注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

教育科研博客

宁拙毋巧 宁朴毋华

 
 
 

日志

 
 

如何科学的学习研究方法?  

2017-04-01 19:09:49|  分类: 【科研方法】 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
如何科学的学习研究方法?
原创 2017-03-17 乔晓春

作者简介
乔晓春,中国人民大学博士,美国北卡罗来纳大学人口中心博士后。现任北京大学人口所教授、博士生导师。从2006年开始发起并组织“社会科学研究方法暑期班”,曾开设过多种社会科学研究方法领域的课程:社会调查与研究方法、社会科学应用统计学、应用线性回归模型、分类数据分析、生存分析、结构方程模型、应用多元统计分析、社会项目评估方法、生命历程理论与方法等。

学术中国特供签名版《中国社会科学离科学还有多远?》


前面讲过,科学本质上指的是思路和方法。能否做好科学研究,取决于是否使用了正确的、合适的方法。要想了解某一个特定方法,或只是为了能够使用该方法,掌握起来并不是一件难事。但要系统地从原理上掌握这些方法,就要一个方法、一个方法,一门课、一门课地去学,这需要一个过程。

学习社会科学研究方法,不仅仅是为了学习某些分析“技术”,更重要的是学会一种科学的世界观和思维方式,一种思考和分析问题的思路,学会了这种思维方式,即使不从事学术研究,也会终身受益。在这里,我们不可能把所有的方法或所开设的方法类课程都做详细论述,只是初步介绍一下与做好社会科学研究应该具备的原理、研究程序、收集数据以及分析数据所使用的一些方法。

我们可以把社会科学研究方法分为三个层次:方法论、一般方法和特定方法。三者是密切联系在一起的,即后者是以前者为基础的。方法论可以告诉你,是什么东西使社会科学研究成为了科学,即社会科学是什么样的,应该怎么做才是科学的;一般方法指的是适用于各门或多门社会科学的各种技术方法;而特定方法是指在一般方法基础上进一步发展出来的、只与特定学科有关的技术方法。

人们普遍承认自然科学是科学的,这样会很自然地想到用自然科学的方法来研究社会科学。后来人们又进一步发现社会科学研究的对象是人,而自然科学研究的对象是物,二者有本质的区别。这样,用研究“物”的方法来研究“人”有时是有问题的,也是不够的。以实证研究方法为基础的自然科学研究,往往会把物质世界及其运动抽象为数;同样,当针对人的研究也遵循实证研究方法时,也自然会把人的特征、行为转化或抽象为数。然而,人有思想、会思考、能判断、有主观能动性,人还具备很多不可侵犯的权利,这些权利必须被尊重。若单纯把人看成数,而不是看成活生生的人,会忽略“人性”特征,会用对待“物”的办法来对待“人”,甚至会出现对人的权利的侵犯。另外,将人抽象为数,还会出现过分强调人的行为的一般性,而忽略人和人的差异及个体的特殊性,从而导致对人的行为的认识出现偏误。人的这些特征,决定了对这样一个特殊研究对象的观测和研究,需要一些独特的思路和方法,这些都是自然科学研究所不具备的,而且会远远超出自然科学的视野。

社会科学研究的方法论会告诉我们社会现象的本质是什么,社会科学的研究方式和方法与自然科学有什么不同。方法论不仅表述科学哲学对科学的认识,同时将科学哲学中所表述的科学原理与具体的研究方法建立联系。而具体方法的有效性和可靠性恰恰建立在方法论给出的思路基础上,换句话说,如果我们理解了科学研究的逻辑、思路和一般原理,就会更好地理解具体的研究方法。方法论表述了一个好的、规范的社会科学研究应该是什么样的,应该遵循什么思路、程序和原则,还会进一步告诉我们什么样的问题属于科学问题、什么样的问题属于非科学问题,告诉我们什么是社会现象,如何测量和反映社会现象,以及如何分析这些现象并从中发现规律。方法论还会表述社会科学研究中价值判断与客观判断的联系,告诉我们怎样做研究才符合科学伦理,等等。

社会科学研究的一般方法可以分为两大类,一类称为定量或量化研究方法,另一类称为定性或质性研究方法。尽管两类方法都承认存在的客观性,而且都属于经验研究,但对于客观世界的认识方式还是有很大不同的。

如果将上述不同层次、不同类型的研究方法分解为不同课程或内容的话,那么社会科学研究方法中的第一门课应该涉及方法论以及科学研究中所普遍涉及的原理、过程和方法,我们把这门课称为“社会科学研究方法”,或“社会科学研究设计和研究方法”。这门课程主要介绍社会科学研究的思路、范式、原则、研究方式,以及如何做研究设计,如何对研究变量做概念化和操作化处理,如何对研究对象的状态、行为和认知进行测量,如何进行观察和收集数据,数据分析的一般原理,定性和定量分析方法的分类,如何做文献研究,以及如何撰写研究论文等一般性内容。

在学习了第一门课以后,就可以进一步把要学的研究方法分为量化(定量)研究方法和质性(定性)研究方法两大类。量化方法也被称为“实证社会科学”(Positivist Social Science)研究方法,它沿袭了自然科学的研究思路和方法,强调的是发现因果规律,做细致的经验观察,并要求研究者针对研究内容要保持价值中立。这类研究通常是通过实验、调查方法来获得数据,通过统计学方法来分析数据。量化方法所获得的结论往往具有较强的描述性、代表性和可推断性。质性方法被认为是“解释社会科学”(Interpretive Social Science)所使用的研究方法,其目的是要了解由于个体原因和动机所形成的个人内在感受,并决定人们以特定方式采取行动。这一方法侧重寻求发现有意义的社会行为、社会建构的意义和价值相对主义。这一方法追求对原因和意义的深入剖析,属于“解剖麻雀”式的分析方法,尽管该方法具有很强的解释性,但其结论往往不具有广泛的代表性和推断性。很多中国学者由于对质性研究方法了解得不充分,经常会误认为质性研究方法比定量研究方法更容易学、更容易做。然而事实正好相反,质性研究方法的使用要比量化研究难得多,在实践中更难把握,这一点只有在系统学习特别是真正使用了这一方法后才会理解。实际上,定量研究方法和定性研究方法各有其优势和不足,而且二者的优缺点恰恰是互补的,因此将两类方法结合来做社会科学研究,意义更大,效果也会更好,在国外被称为“混合方法”。

关于定量研究方法又可以分成三大类,即测量方法、数据收集方法和数据分析方法。这三类方法具有严格的逻辑联系,即分析是针对数据的分析,要想分析数据,必须先要获得数据,因此研究者必须知道数据是怎么来的,要了解数据收集方法。数据是人和社会特征的数量表现形式,如何将人和社会的特征转化为数据,则涉及测量方法。这样就存在着如何对人和社会进行测量,即如何利用测量工具将人的特征、观念和行为转化为数据的问题。学会如何将行为转化为数、如何获得数据、如何对数据进行分析,正是测量方法、数据收集方法和数据分析方法所要介绍的内容。

为什么要对人和社会特征进行测量?与对物质世界的研究一样,物理学家要想对物质对象进行研究,首先必须将这些研究对象转换为数据,物质的特征包括长度、重量、体积、面积密度等,对空气的测量会包括温度、湿度、气压、pm2.5含量等,要想把这些特征转化为数据,首先要有一个测量工具并规定测量标准。比如要想测量长度,人们发明了米尺,从而对长度设定了标准,并制作了米尺这样一个工具。用米尺来度量不同的物体,就可以得到不同物体长度的数据,物理学家再根据所获得的数据进行分析。针对人和社会的测量方式也是如此,简单地讲社会测量就是对人和社会特征进行赋值。然而针对社会的测量所获得的数据类型与对物体的测量有很大不同,有时要比对物体的测量更复杂一些。比如,对物体测量所获得的变量绝大多数为连续变量,而对人和社会特征的测量结果更多属于分类变量。

社会科学家把变量类型分为四类,即定类(nominal)变量、定序(ordinal)变量、定距(interval)变量和定比(ratio)变量。定类变量是按不同属性进行分类的变量,比如性别、民族、居住地等;定序变量不仅可以按属性分类,还存在内在顺序,比如受教育程度、满意度等。这两类变量在社会科学中统称为分类变量。而定距变量和定比变量一般是按数值进行分类,统称为连续变量,比如年龄、收入等。

社会科学研究对象的复杂性导致其测量的方式也会比较复杂。有些特征可以直接测量,比如人的年龄、性别、受教育程度、民族等;有些特征是不可以直接观察和直接测量的,比如智商、信念、动机、幸福、需求、情感等比较抽象的内容,通常把这些抽象变量称作潜变量。人们很难用一个尺度或一个问题来测量这类抽象变量,必须构建一系列问题,从多个维度或角度来进行测量,最终给出一个综合测量值。这种多维度测量工具被称为量表。目前国际上已经有很多成熟的社会科学测量量表,也有些学者自己设计量表,但是自行设计的量表需要对其信度和效度进行检验。信度反映的是测量结果的稳定性或误差大小,效度反映的是测量工具是否反映了它所要测量的问题。在社会科学研究方法中,社会测量方法是一门独立的课程,对如何设计调查问卷、如何编制量表、如何测量信度和效度以及有哪些已经成熟的量表进行介绍。

测量工具准备好以后,下一步工作就是要利用这些工具来收集数据。一般来说收据社会数据的方式有三类:第一类是普查,包括人口普查、工业普查、农业普查等;第二类是经常登记,包括婚姻登记、出生死亡登记、人口迁移登记、工商登记等;第三类是抽样调查。一般来说,第一类和第二类通常是由政府组织的调查,属于全面调查,即涵盖给定地域的所有人群,不同的是普查一般属于静态调查,即在一个特定时间上的调查,而经常登记属于动态调查,即随着事件的发生随时进行登记或记录。第三类抽样调查属于对总体中部分人群进行的调查,它既可以做静态调查,也可以做动态或跟踪调查。第一类和第二类调查并不涉及很多技术性问题,而第三类调查,即抽样调查,往往涉及的技术性问题比较多,所以成为社会科学研究方法中要专门讲授的一门课程。学习抽样调查方法可以让你知道抽样有哪几种方式,如何去设计抽样,通过什么样的抽样方法所得到的数据才会有代表性,能够反映客观事实。即使研究者个人不去做抽样调查而是使用别人的调查数据,学习了这门课以后你也可以判断所使用的数据是否是用科学方法获得的,数据本身是否能够反映客观事实,甚至你还可以判断数据是否有偏、是否能够代表总体,并能够根据情况对数据做适当的调整和修正。

物理学通常通过做实验来获得数据并发现规律。实际上,社会科学也可以仿照物理学实验的方法来获取数据,但社会科学的实验要比物理学难控制得多,因为控制对象是人,不是物。尽管如此,实验也不失为一种很好的、有效的方法。在社会科学收集数据的方法中,学生也会学习社会实验设计方法。这种方法往往针对检验某种干预或政策的效果,通过人为设定干预组、处理组或实验组,并将其结果与对照组或控制组结果进行比较,检验二者的差异。这一研究方法对于研究因果关系非常有效,所以它不仅属于数据收集方法,同时也属于数据分析方法的一种,不同的是它可以通过事前控制一部分混杂或干扰因素,而不是完全通过事后控制来测量影响因素。因为这类实验不可能完全控制混杂因素,所以有时也被称为准实验设计(quasi experimental design)。

在学习了社会科学的测量方法和数据收集方法以后,进一步需要学习的则是数据分析方法。根据数据的不同类型和结构,可以将数据分析方法进一步细分为很多具体的研究方法。最基础的一门课,也被称为社会科学定量研究方法的第一门课,应该是“社会科学应用统计学原理”。这门课讲的是应用统计学最基础的内容。它涉及描述统计方法,即各类统计指标的计算和表示方法;还涉及从样本向总体进行统计推断和假设检验方法。这门课是推断统计学的基础,也可以说是整个统计学的基础。除此之外还要讲到交叉表分析,这是针对两个分类变量关系的分析。因为社会科学的绝大多数变量是分类变量,所以它在社会科学研究中得到广泛应用。可以说,这门课主要讲的是单变量和双变量统计分析问题,这里既涉及连续变量也涉及分类变量。从未学过任何统计学(包括曾经学过社会经济统计学)或者曾经学过但并没有真正理解统计含义和原理的学生,应该从这一门课开始学起。

在学习“社会科学应用统计学原理”时学生会了解到,单变量和双变量数据只能用于描述,不能用于对变量之间关系的解释,因为二者的关系并不是真实的关系,或者说可能是虚假关系,因此独立测量双变量关系所反映的结果是不能用来下结论的,这时必须控制有关的一系列其他变量。解决这个问题必须用多变量分析的方法,即回归分析方法。“应用线性回归模型”这门课是所有模型类课程的基础,它通常被称为定量分析方法的第二门课。任何其他统计模型都是在线性回归模型基础上或比照线性回归模型构建出来的,如果不了解线性回归模型,对其他模型的理解就会比较困难,而且在应用上,特别是在对模型结果的解释上也会经常出现错误。因此“应用线性回归模型”这门课也被称为学习统计模型的第一门课。

然而,线性回归模型主要是针对因变量是连续变量的回归。由于社会科学中的变量绝大多数都是非连续型变量或者称作分类变量,所以针对分类变量的分析用线性回归模型往往是解决不了的,因此对于做社会科学研究的学者来说,必须学会使用“分类数据分析”方法。这也是社会科学研究中使用最为广泛的一类方法。这类方法通常分为描述性分析和解释性分析方法两类。描述性分析方法主要涉及定类、定序和计数变量的双变量关系的描述;解释性分析主要介绍逻辑斯蒂(Logistic)回归模型,包括针对多分类定类和定序变量以及其他数据类型和结构(包括有条件数据、配对数据、重复发生数据、分层数据等)所使用的拓展逻辑斯蒂模型,除此之外,还会涉及对数线性(loglinear)模型、普阿松(Poisson)模型等其他广义线性模型。

无论是连续变量回归还是分类数据回归,针对的变量通常都被称为“状态变量”,社会科学研究中还涉及另外两类变量,即时间变量和空间变量。针对时间变量的研究方法被称为“生存分析”方法,该方法得名于对人的生存时间的研究,然而该方法同样适合对人或物处于某一状态所持续时间的解释,比如失业持续时间、运动员运动生涯的持续时间、犯人释放后再次犯罪的时间、夫妻处于离异状态的时间、学生毕业找工作的持续时间等,这些“时间”的长度受哪些因素的影响,则是生存分析研究的内容。生存分析方法可以处理观测时间结束后的数据删失(censoring)问题,还可以解决自变量随时间变化的问题。核心生存分析模型被称为Cox模型,除此之外还有一系列有参数回归模型。针对复杂时间数据还有一系列广义Cox回归模型。

近年来,国际上出现了空间数据分析热潮。“空间数据分析”是一种针对具有空间位置属性的数据的分析工具,近年来在社会科学领域得到越来越广泛的应用。该分析方法主要涉及GIS(地理信息系统)平台下空间数据的分析在社会科学研究中的有效应用,尤其是针对社会科学数据,利用空间分析软件实现统计数据空间可视化、创建专题地图、进行GIS查询与地理空间分析,以GIS空间数据为素材,进行空间数据的统计与建模分析等。该课程内容可以分为GIS技术基础和应用统计分析建模两部分:GIS技术基础部分会以某一种软件为例,介绍GIS的基础概念与基本功能、GIS地图与GIS数据,使学生初步掌握GIS软件的操作与应用;空间数据统计分析与建模也将通过学习某一种软件的使用,结合实际案例介绍社会科学领域的空间数据统计分析方法。

除了处理带有因变量和自变量关系的模型以外,还有一类专门处理多变量关系的方法,称为“多元数据分析(multivariate data analysis)”方法。该类方法主要包括主成分分析、因子分析(包括探索性因子分析和确定性因子分析)、多尺度分析、聚类分析、判别分析、典型相关分析、对应分析等一系列分析方法。这些方法既可以测量和解决多个变量之间的内部联系和转换问题,也可以解决多个变量之间的外部作用关系问题。

绝大多数统计分析方法都假定被调查个体之间是相互独立的,然而事实却是很难得到严格独立的数据,因为在具有同一属性的一个群体内的个体一定会存在一定程度的相关性,我们可以把涵盖范围不同的群体分为不同的层。实际上,人的某一类行为不仅受到个体层面因素的影响,也会受到这个个体所在群体层面因素的影响,为了处理这类问题,人们创建了“分层模型(hierarchical model 或 multilevel)分析”方法。该方法不仅解决了样本不独立的问题,同时还可以测量不同层级作用因素对因变量影响的程度。

社会科学研究绝大多数使用的是截面数据(crosssectional data),即在同一时间上对多个变量进行测量。人们往往使用这样的数据来做回归分析,其目的是在控制其他有关变量的情况下,研究一个变量对另一个变量的作用关系,并试图描述两个变量之间的因果关系。实际上,使用截面数据是不可能反映因果关系的,因为因果关系必须存在时间滞后性,即原因发生在前、结果发生在后。为了解决这一问题,学者们不仅只做一次性截面调查,而且对测量的多个变量做重复性调查,即在不同时间上获得多次同样的数据,这样的数据被称为纵向数据(longitudinal data),而针对这些数据所做的分析称为纵向数据分析方法。纵向数据实际上存在着对同一个个体来说,其测量数据在时间上不独立的问题,所以传统的以个体相互独立为假设的统计模型,在这里是不适用的,需要用专门针对纵向数据进行分析的模型。从本质上说,纵向数据分析所解决的问题与分层级数据分析方法所面临的问题类似,二者都需要解决混合效应(即固定效应和随机效应)的问题,这类模型也被统称为混合效应模型,简称为混合模型(mixed models),所以两种方法可以结合起来进行介绍。

科学研究的最终目的不是为了发现“是什么”而是为了解释“为什么”,即要揭示因果关系。推断因果关系需要具备三个条件,一是原因发生在结果之前,二是二者存在含义上的因果关系,三是影响这一关系的其他变量必须被排除或被控制。社会关系是一种客观存在,它是先于研究、独立于研究而存在的。研究的目的是通过构建数学模型来反映这种客观关系,然而人们常用的回归模型只能反映简单和单向关系,即自变量对因变量的作用,这种简单的关系可能与真实关系相差甚远。真实关系实际上要比这复杂得多,甚至是一种错综复杂的关系,即不仅某个自变量会影响某个因变量,而且各个变量之间也会有影响,甚至因变量也会影响到自变量——这些关系有些属于直接关系,有些属于间接关系。“路径分析(path analysis)”方法正是为了反映这种复杂社会关系所发展起来的一种研究方法。通过使用这一方法,研究者可以同时测量多个变量之间的各类关系和各条路径,通过计算各条路径的系数,来反映模型中每一个自变量对因变量的作用程度,包括直接作用和间接作用,并比较它们的作用程度。该方法还可以处理变量之间互为因果关系的问题,将路径系数分解为多个作用因素,从而可以为变量之间的作用关系提供更好的解释。

尽管路径分析能够测量复杂关系,但却不能解决带有潜变量的复杂关系。而带有潜变量的“结构方程模型(structural equation modeling)”恰恰弥补了路径分析方法的不足,它可以针对带有潜变量的复杂数据进行分析。结构方程模型是由路径分析、确定性因子分析和联立方程模型三种方法有机组合起来形成的一类新的分析模型。由于该模型可以生成潜变量之间的关系,从而使其不仅能够研究很多抽象社会变量之间的关系,也可以通过将可测量的多个实变量根据其不同特征组合成多个潜变量,并将其用联立方程的形式联系起来。该方法近年来在国际社会科学界得到广泛的使用。目前该方法主要解决连续变量的问题,针对分类变量问题的方法,近年来也取得了长足的发展。在结构方程课程中会介绍最基本的原理和方法,以及理论模型构建、模型识别、参数估计、模型检验、评价及修正,并结合软件的使用和操作来介绍该模型的使用。

社会科学研究除了基础研究、应用研究外,还有一项特殊的研究,被称为评估研究。为了解决某一类社会问题,政府会制定出相应的社会政策或提供一些公共服务项目,一些社会公益组织、国际组织也会开展一些这类项目。然而令人遗憾的是,项目结束后,很少有人能确切地描述项目最终所取得的真实效果,原因是在项目实施过程中没有开展对项目的评估,从而拿不出项目是否成功的科学的证据。社会项目评估犹如财务审计一样,是项目工作不可或缺的环节,也是社会科学研究方法中一类特定的研究方法。“社会项目评估方法”是以社会调查和分析方法为基础,对社会政策和社会项目的干预效果进行测量。它不仅可以运用科学的方法对社会问题进行识别、界定,还可以协助开展项目设计、实施和管理,最终可以对项目实施的结果和绩效进行确切的评价。从某一个角度看,社会项目相当于“社会实验”,人们可以通过“实验”来检验理论,也可以通过“实验”来解决某类问题。该门课程介绍评估的基本问题和如何做随机化分组以及相应的分析方法,包括倾向分配对法、双差异方法、工具变量估计、回归间断和管道方法等。

20世纪60年代罗马俱乐部的一批国际顶尖学者为研究人口、经济、社会和环境之间的关系构建出世界模型,这一模型后来被称为“系统动态学(system dynamics)”模型,该方法后来作为宏观政策模型被很多国家所采用。系统动态学是一种以计算机模拟技术为主要手段、通过结构—功能和信息反馈分析来研究和解决复杂动态反馈性系统问题的方法。它属于一门新兴的交叉学科,常被列为系统科学的一个重要分支,广泛地应用于自然科学、人文社会科学和工程技术领域,被誉为人文社会科学的“战略与策略实验室”。

近些年来,西方学者根据贝叶斯理论,提出了一种新的研究思路和研究方法,这种方法被称为贝叶斯方法(Bayesian methods)。这一方法的基本思路是研究者首先以概率的形式提出观点,然后通过实验或调查来收集能够支持这一观点的数据,并用贝叶斯理论来修正先前的观点,形成修正后的、可以用概率表现出来的新观点,并称为事后概率。然而,从统计方法上来讲,贝叶斯推断属于条件概率,它给出了在结果已经发生的情况下原因发生的概率,这属于一种反向推理,即从结果到原因,而不是从原因到结果。这一方法对传统统计学提出了非常大的挑战,有些挑战甚至是颠覆性的。

上一章曾经提到美国Glen Elder教授曾在20世纪70年代出版了一本对生命历程研究领域影响非常大的著作《大萧条时期的孩子们》,该研究通过跟踪1920—1921年出生的一批孩子,研究了他们的成长经历。受到该研究的影响,学者们提出了队列分析(Cohort Analysis)方法。该研究方法并不是构建了一个新的统计学模型,而是提出了一种分析思路和视角。队列(cohort)指的是具有同一特征的一批人,比如同时(一般为一年)出生的一批人、同时结婚的一批人、同时毕业的一批人或者同时就业的一批人。这里讲的队列也可以是别的事物,比如同时出厂的汽车、飞机、灯泡产品。队列分析方法指的是针对同一性质的一个或多个队列某些指定变量进行分析的方法。由于队列分析会涉及年龄(age)、时期(period)和队列(cohort),而且三者具有特定的线性关系,因此在这一分析中会将三者的效应结合起来,并将三个英文的第一个大写字母整合起来,统称为APC模型。

社会是一个复杂的随时间不断变化的系统,如何能够描述这一复杂系统的变化过程,对社会科学学者来说是一个巨大的挑战。其中一个有效的工具就是随机过程(stochastic process),它是指用时间和状态空间标志的一系列随机变量所组成的集合,并描述这一系统随事件发生变化的过程。当状态空间和时间空间均为离散形式的话,此时的随机过程则被称为马尔科夫链(Markov chain)。比如用随机过程可以构建婚姻模型,即构建从一种婚姻状态向另一种婚姻状态,以及各种婚姻状态向死亡的各种转移路径,从单身到在婚,从在婚到离婚,从在婚到丧偶,从离婚可以再回到在婚状态,从丧偶也可以再回到在婚状态。人们也可以构建迁移模型、就业模型和健康模型等。用统计模型来描述这一系统并反映这一系统的各类特征则是随机过程研究的任务。

尽管随机过程可以用来描述相对复杂的社会系统,但它只能描述一个受模型条件限定的系统,很难反映一个无条件的或假设过多、规律难以把握甚至是无法用数学关系来描述的复杂系统。近年来社会科学家开始用系统仿真的方法来描述社会运动过程,甚至用来模拟政策的执行过程和执行结果。仿真,顾名思义就是模仿真实过程。如果要描述一个真实的人口运动过程,它是用发生随机数的办法,并假定一个随机数就相当于一个人,这个人会经历人生中的各种“事件”,比如入托、上学、就业、结婚、生育、退休等,人们通过设定各种事件随时间发生的概率,来描述这个人一生的经历,直到这个人死亡为止,这个数就消失了。若发生1000万个随机数,最终将得出这一千万个人一生的生存过程,将整个过程的宏观结果进行汇总后,可以得到各种测量结果。若出台某项政策,通过调整由于政策导致的某一事件发生的概率,可以估计出政策执行的效果或结果。由于现在的计算机运算速度快,存储容量大,可以导致这种仿真过程会在很短时间得出结果,从而很快模拟出政策执行的可能结果。仿真方法也被称为社会政策实验室。最典型的仿真模型是蒙特卡洛(Monte Carlo)模型,人们将蒙特卡洛模型与马尔科夫链模型结合,还构建了MCMC模型。

文献分析(Meta Analysis),也有人称为元分析方法,是以一篇篇论文或报告作为研究对象,而不是以“人”为研究对象的一种调查研究(survey research)或定量研究方法。研究者首先要构建一种编码系统,然后抽取某一领域的部分或所有研究文献进行认真的阅读,再对每一篇文献所反映的特征和定量结果进行分类和编码,最后使用相应的统计学方法进行分析,并对所选文献的研究结果进行定量描述。该方法是社会科学各类学科归纳、整合和解释学术研究成果最有效的方法。尽管如此,它的应用性仍然有限。比如,它只能针对实证性研究,并不能针对理论性、质性研究和政策建议性研究。当然,如果研究者能够直接获得各个研究论文或报告中的具体数据,就没有必要再做文献分析了,而是直接使用数据进行分析。

内容分析(content analysis)顾名思义是对文字材料(包括书籍、论文、历史文献、报刊、互联网、书信、广告、宣传栏等任何带有文字内容的材料)、影视、广播、电视、音乐、照片、绘画、舞蹈等各种内容进行的分析。它是一种通过计量特定内容发生的频数和比例所做的归纳性分析,因此属于定量分析方法的一种。做内容分析首先要选定所要分析的具体内容,并对要测量的内容进行分类编码;其次要定义分析的对象和总体,抑或对总体进行抽样;再次,记录内容发生的频数,并作必要的加权处理;最后对其结果进行汇总和分析。比如,人们可以研究某一个关键字在媒体上出现的频率,也可以分析公开发表的论文中基于证据(evidence based)得出结论的论文比例等。

社会科学研究者通常要做两个不同结果差异的假设检验,比如检验男性和女性收入是否相等的检验。因为研究所使用的是抽样数据,那么就可能存在用样本数据检验出的结果与“真实”或总体结果不同的情况,统计学中的“势(power)”指的是当总体结果确实存在差异时,用样本能够检验出这一差异的可能性有多大,用统计学语言则是,若原假设确实是错误的,而研究者能够拒绝原假设的可能性(likelihood)是多大。势分析(Power Analysis)主要有两种用途:一是做研究设计时,需要通过势分析来决定样本规模,设定显著性水平;二是对一项研究进行评价,分析为什么某项研究是失败的,或者没有能够拒绝原假设。在国际上人们公认的、可以接受的标准是Power要大于80%,即总体存在差异且能够通过样本检验出差异的可能性超过80%,这个研究就是可行的。很多国家的基金会都规定,课题申请书必须涵盖势分析的内容,目的是要估计出该项研究需要收集的样本规模,否则是不能立项的。

我们通常所学的和所做的统计估计和检验(包括对回归模型参数的检验)均假定样本数据来自简单随机抽样(SRS),即每个随机样本被抽中的概率已知并相等。而事实上,实际抽样时并不经常是每个样本均有相同的被抽中概率。社会科学所用的数据绝大多数都不是来自简单随机抽样,而是来自更为复杂的分层、整群、等距、按总体规模成比例(PPS)或者各种抽样方法整合一起的复杂的多阶段抽样。绝大多数情况下,为了使样本数据对总体有代表性,还需要做事后加权处理,这样的数据均被称为复杂调查数据(complex survey data)。在实践中,我们实际上使用的是复杂调查数据,但所用的分析方法则是针对简单随机抽样的方法。这样,对标准误(standard error)的估计,以及对总体的推断,都存在一定的甚至可能是相当大的误差。近年来,统计学家针对复杂调查数据构建了一系列分析方法,绝大多数统计软件也引入了这些方法,遗憾的是很少有学者,特别是很少有中国学者使用这些方法,当然这是由于学者们不知道为什么以及怎样使用这些方法。

以上介绍的具体研究方法均指定量研究方法,另一类具体研究方法则是定性或质性研究方法,此类研究在调查时所询问的问题基本上属于非结构化、开放性或者可以灵活设定的问题。实际上这里讲的定性研究方法属于一类方法,其中还可以分为许多具体的研究方法,包括叙述研究(narrative research)、现象学(phenomenology)、扎根理论(grounded theory)、民族志(Ethnography)、案例研究(case study)和焦点组讨论(focus group discussion)等。这里的每一个具体方法都其特定的思路,都可以作为一门课,但是在实际教学中往往并不会介绍得那么详细,所以教学中经常把定性研究方法作为一门课来讲,一次性介绍各个具体的研究方法。学习定性研究方法光靠听课是远远不够的,在学习过程中需要开展参与式教学,通过一边学习、一边实践的方式来加深对所学内容的理解。然而,真正理解和掌握定性研究方法,还需要在长期实践中去慢慢体会、逐步积累经验,这样才会做得越来越好。

在一般方法的基础上,很多社会科学的具体学科往往根据自身领域的特点和变量的规律,又拓展出了一些更为具体的研究方法。比如在经济学领域,学者们经常会使用时间序列分析方法来分析按时间顺序统计出来的数据,这类数据往往存在于政府的统计年鉴中,其统计对象往往是特定的地域,如全国、省、市、县等,特定地区会按照年代来统计和公布各项社会经济数据。因为是同一地区不同时间上的数据,这样同一数据在不同时间上是存在相关性的,这类数据属于“自相关(autocorrelation)”数据,所以传统的统计分析方法是不适用的,必须用特定的方法。除了经济学外,社会科学其他学科很少使用这类分析方法,所以它属于特定分析方法。

在经济学中还有一门更为一般的方法类课程,称为计量经济学(econometrics)。计量经济学实际上与统计学一般方法没有什么区别,它只是把一般统计学中经常在经济领域使用的方法集中起来,并将这些方法应用到对经济变量的分析中。严格意义上说,计量经济学可以被命名为“统计学在经济学中的应用”。计量经济学的特点是从线性回归模型入手,并将其进一步拓展到广义线性回归、联立方程、纵向数据分析等,并形成了自身的一套体系。由于计量经济学并不是从统计的最基础内容入手,并且过于强调统计模型的演绎而忽视统计学基本原理的介绍,往往学生掌握起来会比较困难。

近年来在社会学中人们经常使用社会网络分析(social network analysis)方法来分析各种社会网络关系,比如家庭关系、朋友关系、上下级关系等。社会网络分析方法最早是人类学家开始使用的,当时只是用来构造“结构”,而不强调“技术”,后来社会学家开始使用这一方法,在技术层面取得了很大的发展,并大量使用数学方法对其结构和关系进行描述。这一方法主要使用三类数据:第一类是关系数据,关注一个人与其他人的交往、联系、关联、接触、见面的情况;第二类是属性数据,包括人的状况、态度、观点、行为等的测量;第三类属于观念数据,主要反映意义、动机,以及与行为有关的定义和分类等。对前两类数据的分析方法已经比较成熟,而针对第三类数据的分析方法仍然在发展过程中。

以上是对目前国际社会科学领域主要使用的研究方法进行概括性的介绍,这里并没有涵盖全部的方法。实际上,学习了一种方法就相当于掌握了解决某一特定问题的一件工具,掌握的工具越多,解决问题的方法也越多,你的研究能力越强。要想掌握这些工具,人们需要静下心来、循序渐进地学习。

  评论这张
 
阅读(63)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017