伴随着同学们的期待,《信息系统实证研究方法综述》课程如约而至。该课程由两位老师教学,虽然这是管理科学系信息系统研究方向系列暑期课程中最晚结课的一门,但由于两位老师所涉猎的研究方向与研究方法都非常丰富,所以在听课过程中同学们学习的热情并没有丝毫减弱。
7月9日至7月12日早上1-2节,由陈伟老师授课。陈伟老师目前任职于亚利桑那大学Eller皇冠hg1088官方管理信息系统系,担任助理教授职位。他的研究主要集中于众包众创、金融科技和商务分析这三个领域。陈伟老师已在信息管理领域的顶级期刊上发表了多篇论文,包括在MISO, ISR等期刊,也在管理学顶级期刊以及国家自然科学基金委管理科学部认定的A类期刊上发表了多篇论文,包括《管理世界》、《系统工程理论与实践》等,是近几年信息管理领域很有潜力的华人学者之一。
在第一次课堂上,陈伟老师介绍了其翻转课堂的教学方式,希望同学们在课前先阅读了解知识。老师给每个同学发放了A、B、C、D的小卡片,在课堂上会有小测验(选择题),每个同学独立回答,用小卡片回答问题。如果同学们的意见不统一,则可以邻桌相互讨论后再一次投票,最后老师揭晓答案、答疑解惑。这种互动性较强的课堂教学方式引起了同学们对课程的兴趣,也活跃了课堂气氛。每次课课后都会布置一篇论文,同学们需要提前去阅读,下一次课堂上使用十分钟进行小测验。小测验的题目一般是三道或者四道选择题,主要是针对上次课布置的阅读论文里的内容,题目简单但是很有启发意义,帮助同学加深了对论文的认识。接下来,陈伟老师介绍了三种管理信息系统研究方法、实证研究的基本类型等基本知识,并一一讲解实证研究、理论模型研究、结构计量模型这三种管理信息系统的研究方法。在此之后,他重点介绍了在计量中经常遇到的内生性问题,指出了内生性的三个来源:遗漏变量、测量误差和双向因果,并举例对三种情况进行了详细地介绍,并认为解决内生性问题的最佳方法:随机实验。但由于条件限制,学者们做得最多的还是类实验方法。而在类实验方法中,受到外部冲击的个体并非是随机选择的,因此双重差分(DID)是解决该问题的一个可行方案。他介绍了DID的研究设计,分析了DID的基本计量模型和面板模型,也说明了DID的假设与限制,例如:对照组和实验组在政策实施前具有平行趋势、线性假设等。面对DID存在的局限性,我们可以先匹配再做DID,例如:使用倾向得分匹配(PSM)选择与实验组相似的对照组对象,或者Synthetic Control Method合成一些与实验组非常相似的对照组,再使用DID。
在第二次课上,老师介绍了两个与DID方法相关的研究案例,第一个案例是研究Craigslist对当地报纸的影响,对当地报纸的分类广告价格、订阅价格、分发份额,以及差异化这几个方面的影响。第二个案例是研究酒店的管理反馈对后续评论数量和评分的影响,该案例涉及到DDD方法和事后针对DID平行假设验证方法——Relative Time Model。在详细讲解了两个研究案例后,老师给我们介绍了两个常用的配对方法:Propensity Score Matching和Coarsened Exact Matching。他表示当没有合适的对照组时,还可以用Synthetic Control Method来合成一些与实验组非常相似的对照组,并举例说明。
在第三次课上,老师又介绍了两个与DID方法相关的研究案例,第一个案例的研究背景是新浪博客2005年9月开启了广告计划,研究问题是广告计划对博主影响,此影响包含了对博客数量、博客内容、博客质量和流行博客比例的影响,该案例运用了DID+matching方法,通过对该案例的分析,巩固了我们对DID+matching的认识。另一个案例是研究群组规模会如何影响对公共产品贡献。老师从政策影响过程、stata代码的实现、模型、结果等方面向我们阐述了该案例,从中我们学到了DID不只是适用于冲击作用于部分样本的场景,对于冲击作用于总体的情况也可能是适用的。之后提到了解决内生性问题的另外一个办法就是寻找一个合适的外生的工具变量来估计出内生变量中的外生部分,并介绍了使用工具变量的两阶段最小二乘法的步骤。
在第四次课上,老师继续讲解工具变量的内容。他介绍了工具变量的必须符合的两个基本要求,一是Relevance,即工具变量要与内生变量相关,这是个可检验的条件;二是Validity,即工具变量要和误差项不相关,这是个无法检验的要求,只能靠argue。老师还列举了对于工具变量可以做的各种检验,比如:Endogeneity Test、Over Identification Test、Identification Test和Weak Instrument Test等。在此以后,老师引入了几个使用工具变量的经典案例,来加深我们对工具变量的理解。案例一是1991年Angrist和Krueger对教育的投资回报的研究,老师介绍了该研究中可能遇到的内生问题,其用到解决方法是用出生的季度作为教育年限的工具变量,然后使用2SLS进行回归。案例二是之前提到的“博客”那篇文章,里面也使用到了博客年龄和发博频率作为工具变量。案例三是2010年Chintagunta等人研究在线评论对于电影票房的影响,该研究用到之前区域的竞争影片的一些属性和天气作为工具变量。通过对这篇论文的剖析,我们学习到了学术大牛是如何在一个已经被研究得非常多的电影题材下还能脱颖而出的。
虽然翻转课堂的形式,需要同学们提前去了解知识且上课互动性较强,但由于小测验的问题都是较为简单且具有启发性的,因此同学们课后压力不是很大。同学们表示能够在轻松愉快的学习氛围中接触到非常多的干货,收获满满。而且对于同学们的每次提问,陈伟老师总能回答在点上,并且用非常精简易懂的语言为我们答疑解惑,传授知识和经验。
在结束了课程的前半部分后,同学们进入了课程的下半部分。课程的下半部分由罗欣老师任课。罗欣教授,现任美国新墨西哥大学(The University of New Mexico)安德森皇冠hg1088官方校董事会讲席教授和管理信息系统和信息安全保障的终身正教授。他的研究兴趣主要在信息系统安全管理,电子商务/移动商务,创新性技术用于战略决策和开发(云计算,绿色信息系统,社会网络),跨文化信息技术管理等。罗欣教授在国际学术期刊、书籍和会议录上出版超过90篇科研报告,他的科研论文在国际顶级或著名的期刊发表,如Computers & Security, Communications of the ACM, Decision Sciences, Decision Support Systems, European Journal of Information Systems, Information Systems Journal, Information& Management, Journal of the Association for Information Systems, Journal of Strategic Information Systems。并担任美国国家自然科学基金(U.S. National Science Foundation)在信息安全和隐私研究基金方面的评审专家,他的研究和教学基金申请已分别获得美国和中国的国家自然科学基金资助。
在第一次课上,老师让同学们一一地进行自我介绍,并了解同学们上这门课的目的,活跃了课堂气氛,也了解到同学们对这门课程的想法。在这过程中,老师也向我们介绍了他自己的学术背景、研究兴趣等。他认为定量研究方法准确但不真实,定性研究方法真实但不准确,因此他的研究方法是定性和定量相结合的方法。在短暂地相互了解后,正式进入了课程的学习。老师介绍了科学的定义、分类、目的,还详细地介绍了社会科学中的一些理论,例如:Cognitive dissonance theory、General deterrence theory、The theory of planned behavior,并告诉我们科学研究的目标是发现可以解释自然或社会现象的规则和理论,换句话说,创建科学知识,虽然知识可能不完美甚至与事实相差甚远。科学研究的形式分为归纳、演绎,其中归纳研究的是“是什么”的问题,是理论建构研究;而演绎则是回答了为什么,是验证理论研究。而研究的过程可以概况为:通过观察或者经验构建理论(归纳研究),再用实际数据去验证理论(演绎研究)。之后老师告诉我们,进行科学研究所需要的两项技能、一个好的科学方法应当满足的四个特征、科学研究的类型有哪些等基本知识,并向我们阐述了科学思想史,还告诉我们应当如何做个合格的研究者。最后,老师告诉我们,做任何社会科学研究首先需要决定的是基于哪个研究层面,即科学研究的分析单位,而研究层面有多种,例如:个体、群体、组织、公司、国家、技术等。他列出了一些具体情景,用问答的形式教我们如何选择合适的研究分析单位。
第二次课主要是一一讲解了研究步骤里的一些专有名词的概念。比如,构念的定义,构造是一种抽象概念,用来解释给定的现象;变量的定义,即在科学研究中,变量是抽象构造的可测量表示;除此之外,还介绍了自变量、因变量、调节变量、中介变量、控制变量、命题、假设、理论、模型的定义等。然后讲到名词间的关联,例如,在做研究时,是先有理论,然后用实际数据去验证。但是理论构念不可直接观察,因此需要找到合适的指标(即变量)把理论具体化,从而对这些构念所代表的现象进行科学的描述、区分、解释乃至预测。
承接上一次课的内容,第三次课先介绍了范例(paradigm)等词的定义,然后阐述了研究过程,他认为所有的研究过程是一个观察、合理化和验证的过程的不断迭代。在观察阶段,我们观察到感兴趣的自然、社会现象、事件或者行为。在合理化阶段,我们尝试着去理解或解释所观察到的现象、事件或行为,并构建理论。在验证阶段,我们运用科学的方法,通过数据收集和分析的过程去验证我们的理论,主要是验证理论是否能在新的场景下也适用,如果不能,那么说明理论还有被拓展、完善的空间。因此,我们在具体进行一项研究时,可按照下列三个步骤:探索、研究设计和研究执行阶段。在探索阶段,首先要提出研究问题,然后阅读大量与该问题相关的文献,进行文献综述,总结出已有的研究,并针对自己的研究问题创建或者找到合适的理论作为支撑。而在研究设计阶段,则需要将理论中的构念具体化,选择合适的研究方法,收集到适量且具有代表性的数据,特别要注意的是如果收集到的数据并非总体,而是总体中的子集,那么要确保它能代表总体。在研究执行阶段,先要预测试,看下大体的、可能的结果,再根据预测试的结果和研究执行的成本进行衡量,衡量要不要做这个研究。如果觉得可以继续该研究是有意义的,那么接下来就要收集数据并对数据进行分析。最后,针对这个研究过程,老师细致地讲解了各个过程/步骤需要做的事情、需要注意的事项,并分享了自己做研究的经验、看法和建议等,比如:分析了如何进行研究设计,如何选择合适的样本,有哪些方法可以用来做数据分析,如何选择合适的样本等问题,并分享了在研究中常见的一些错误、好理论的特征、一些具体的理论、研究设计的过程、研究设计的外部有效性(即可推广性)和内部有效性等知识。他还鼓励我们,要打破舒适区,多做研究方法上的突破,并惊叹于某个大牛能用多种不同的研究方法去做同一个研究,鼓励我们在研究中要像该大牛一样地严谨。
虽然只有短短的三次课,但是老师的精彩讲解引起了同学们对做学术研究的极大兴趣,同学们积极地在课堂发起了提问。其中,令人印象深刻的问题是如何提出有意思的研究问题。针对该问题,老师提出了以下两点看法:一是反面思维想出来的idea可能更有趣,例如:最近很火的共享经济方向,大家可能都在研究共享经济的好处及未来势不可挡的趋势,但是我们可以从它带来的不好的地方(如:共享经济下的偏离行为)进行研究,这样一下子就使得研究变得有意义、能推动社会的发展和进步。二是当你选定一个研究领域后,可以先看一些关于该领域的元分析的文章,元分析被称为文献综述的文献综述,它可以帮助你迅速了解该领域里已有的研究,在阅读时,你应当注意找出该领域中较为空白的研究点。还有同学问到如何选择合适的理论,对此,老师推荐了一个理论库,另外建议我们可以阅读一些应用心理学期刊,或者阅读其他行业的理论,坚持阅读,在运用时可以考虑用一些较少被IS领域用过的理论。
7月16日,《信息系统实证研究方法综述》圆满结课,然而同学们意犹未尽,两位风格迥异的任课老师都给同学们留下了深刻的印象。两位老师的教学内容上有所互补,陈伟老师注重计量研究,注重实操,而罗欣老师则更侧重研究理论上的讲解、对研究过程的分析,研究经验的传授。除了满满的干货外,这门课程更是由于互动性强,轻松愉快的学习氛围,及生动清晰地知识传授方式而引起了同学们对学术研究的极大兴趣,同学们表示听完该课程顿时对今后的学术研究充满了信心,清晰了自己该做什么,怎么做。而两位老师不同的研究方法鼓舞着同学们在未来的研究中大胆去尝试不同的研究方法来做自己的研究,要有耐心、多折腾,做研究就要做得严谨可靠。
注:作者系我院管理科学系2017级硕士研究生