教务信息
首页 /  学院信息 /  教务信息 /  正文

2018年皇冠hg1088官方研究生暑期课程之“社交媒体分析在信息系统中的应用”——永不气馁,耐心求索

编辑者:曹丽娜 | 发布时间:2018-07-31


热情的六月,我们非常荣幸地再次迎来了美国弗吉尼亚理工大学的王刚副教授,为我们讲授《社交媒体分析在信息系统研究中的应用》这门课程。这是王刚副教授第二次莅临厦大为管院管科系学生授课。王刚老师现为弗吉尼亚理工大学庞普林商学院商业信息技术系副教授(终身教授职位),目前主要从事数据挖掘与商业智能、信息检索与社交媒体分析等方面的教学与研究工作。因为学院首次对外开放选课系统,所以课堂吸引来不少外校外院的老师和学生,分别来自美国北岭加州州立大学商学院、爱丁堡大学、天津大学、南开大学、重庆大学等等,在课前、课上、课后均有激烈的讨论与分享学习,营造出浓厚的良好学术氛围,促进多知识领域的交流与互动,体现出跨学科之间的交流与合作模式。

627日上午,王老师幽默风趣地自我介绍,很快和老师同学们熟络起来。王老师请每位同学自我介绍,并询问同学的研究兴趣,进一步了解同学们的教育层次、专业背景及学习需求。下课前,王老师提供8篇发表在信息系统领域具有代表性的论文并布置课后的学习任务。

课堂的重点与收获:(1)社交媒体研究的国内外发展概况以及IS领域的研究现状。国内外研究领域集中在计算机科学、心理学、传播学、工程学、商业与经济学、环境科学与生态学等等。有学生提出这样的一个现象:现在流行的社交媒体传播介质很多,如BlogVlogFacebookPlurkTwitter、微信、QQ等,甚至百度、Yahoo! AnswersEHow等也加入了类似的功能。可见,社交媒体在互联网沃土上的蓬勃发展,已然成为互联网的大趋势,成为平台商、消费者以及研究学者们的热门话题。

2)云计算、物联网概念以及大数据挖掘的内涵解析。互联网大数据挖掘已经成为热点趋势,王老师生动刻画了数据挖掘具备“多”、“快”、“易”、“融”、“换”5个特点。王老师激发了学生们进一步深入学习的热情与兴趣:如果能够从数据库中抽丝剥茧、转换分析,那就能掌握其潜在价值与规律。

3)文本挖掘的含义与运用。文本挖掘是数据挖掘的延伸,互联网文本数据数据量丰富庞大,采取归纳法、特征法、关联法的多元化分析方法获取价值与规律,促进问题的解决和优化:对互联网文本的提取与清洗,利用文本聚类、情感分析、观点抽取、数据关联等强大的自然语言处理技术(NLP)进行文本分析。王老师建议在文本分析过程,视野可以开拓一些,从行业、地域、专家等多维度进行可视化分析。


23265


628日上午,由于时间紧凑,王老师将原本是一学期的教学知识浓缩在短短半天,专业知识的信息量比较大,期望能让大家广泛涉猎有关社交媒体、文本挖掘的概念与技术方法,在今后学习中选取重点加以深入。

课堂的重点与收获:(1)社会网络分析、社交媒体分析过程应用与商业价值,以及团队正进行的项目。重点讲述了社会网络分析中的中心度分析,具有广泛的应用性。将社交媒体数据与商业增长紧密结合,这是社交媒体分析研究的价值所在。王老师分享了自己团队的有趣项目,生动形象地促进学生们对这门学科的理解:社交媒体分析可以促进商家更好地聆听客户需求、锁定潜在客户、改善产品与服务质量等等。

2)文本挖掘的步骤过程以及相关技术介绍。首先,对文本进行预处理;其次,文本流的语言学处理(分词、词性标注、去除停用词)、文本流的数学处理(TFIDFPMI);再次,特征提取和特征选择;最后,利用算法进行挖掘(KNN算法,贝叶斯算法、决策树算法)。王老师特别强调:社交媒体中用户产生的内容短小而又分散,这些信息呈现出碎片化的特点,属于非结构化信息。应适当以建模方式,尽量全面准确地了解用户的观点。

3)文本的特性。在中文的情感分析中,不同情感词表达情感的作用范围、使用语境存在一定的差别。同时,现代社会活跃思维带来的网络用语、诙谐用语日益普及等特点在一定程度上增加了文本分析科学性与准确性的难度。课堂引起了老师与同学们的浓厚兴趣,举出不少网络用语与反语的例子,如“不明觉厉”、“人艰不拆”、幸福ing(中文词与英语动词后缀组合,表示正在享受幸福的过程),等,这些互联网文本的特性是中文文本挖掘过程的挑战与机遇。


172D7


627日下午和628日下午,王老师向大家介绍了社交媒体分析中所用到的常见方法和工具,并带领大家进行实际应用操作。为了更快更有效地吸收知识,所有听课的老师以及同学们提前安装好操作软件。教学过程中,王老师时不时走下台与同学们的实时交流和沟通。

课堂的重点与收获:(1)从数据获取、数据预处理到数据分析和结果讨论,王老师一一演示操作。在数据获取方面:王老师向大家介绍了目前最常用的几款网页数据抓取工具:八爪鱼软件、import.io软件;在数据处理和分析方面:则重点以情感分析为例,详细介绍数据处理的过程及Weka软件、rapidminer软件的操作步骤。(2)王老师从论文结构、语言行文、重点内容阐述、结果讨论、贡献梳理、投稿期刊选择等方面进行细致讲解和经验传授。台下师生们也彼此分享宝贵经验和知识。比如,王振宁老师在课上分享了HistCite软件,以及如何用VOSviewer分析CNKI数据;来自美国的张跃老师分享如何有效地做阅读文献笔记并建立好信息框架以便于后续温故知新。

19C18


629日上午,每个人对阅读总结的论文(共有8篇)进行了汇报和展示;下午一共5个小组进行研究设计的汇报和展示,由于兴趣的激发,个别小组提出多个研究设计,期望展示能够集思广益。小组研究设计涉及到金融、旅游业、农业、娱乐、新闻媒体等多个行业领域。

课堂的重点与收获:(1)选择来自于Supply Chain and ManagementHealthcare and ISMarketing and ISHospitality and Tourism ManagementAccountingFinance等近年来8不同领域的代表性文章,启发同学们将文本分析运用到自己感兴趣的研究问题。

2)宝贵的讲台时间,学生获得语言表达及上台演讲的锻炼。王老师强调,汇报者要充分用多媒体来实现与听众的连接:尽量面向观众汇报; PPT的设计从观众视觉角度出发,结构清晰简洁;讲解论文时,要讲好故事和研究动机,激发听众的兴趣。课堂讨论氛围激烈并且友好,汇报过程得到有效互动,充分表现出彼此的相互尊重以及学术交流的开放包容心态。

35个小组的研究设计。小组从三个方面进行研究设计汇报:Topic(我要做什么)、Question(what/how/why)(为什么要做这个研究)、Significance(研究的贡献在哪里)。5个小组的研究设计包括:股票评论对公司的股价的影响;在线评论对酒店排名的影响;养猪户意见倾向对出栏价的影响;游戏社区的评论对游戏玩家的影响;音乐评论对音乐下载的影响等。每个小组的展示均获得表扬与肯定,同时收获王老师有价值的点评以及台下老师同学们的建议。比如,第二小组的研究设计“养猪户意见倾向对出栏价的影响”,王老师对其观点和视角的创新给出肯定与表扬,同时建议初步简化模型,寻找理论来引导模型框架,如理性预期模型,并且对养猪户意见倾向的度量提出建设性的方法。

课程结束,同学们纷纷表示收获丰厚,视野得到很大的开拓,在大数据挖掘、文本分析以及社交媒体分析的应用等专业知识得到丰富的同时,备受王老师人格魅力的感染,心中谨记王老师所言:在学术道路上挖掘自己的研究兴趣,耐心求索,按图索骥,一步步去寻找解决方法。期待王老师今后能够再次莅临美丽的厦大,为更广大的学子们传授知识!


注:作者系我院管理科学系2016级博士研究生生


Baidu
sogou