精神计量学
精神计量学是一个学习领域心理学关注的理论和技术测量。心理计量学通常是指致力于测试,测量,评估和相关活动的心理学和教育中的专业领域。[1]心理计量学关注的是客观的测量潜在构造那不能直接观察到。潜在构造的示例包括智力,内向,精神错乱, 和教育成就.[2]在不可观察的潜在变量上的个人水平是推断通过数学建模根据个人对测试和量表上项目的响应的观察到的。[2]
从业者被描述为心理医生,尽管并非所有从事心理测量研究的人都以这个标题为单位。心理医生通常拥有特定的资格,例如学位或认证,大多数是心理学家通过精神计和测量理论的高级研究生培训。除了传统的学术机构外,从业人员还为诸如组织的组织工作教育测试服务和心理公司。一些心理测量研究人员专注于评估工具的构建和验证调查,秤, 和打开-或者封闭式问卷。其他则关注与测量理论有关的研究(例如,项目响应理论;类内相关性)或专门为学习与发展专业人士。
历史基础
心理测试来自两个思想流:第一个,来自达尔文,加尔顿, 和卡特尔关于个体差异的测量,第二赫尔巴特,韦伯,菲切纳, 和Wundt以及他们对类似结构的心理物理测量。第二组个人及其研究导致了实验心理学和标准化测试。[3]
维多利亚时代
查尔斯·达尔文(Charles Darwin)是弗朗西斯·加尔顿爵士(Francis Galton)爵士的灵感,他是一名精神计量学发展的科学家。1859年,达尔文出版了他的书关于物种的起源。达尔文描述了自然选择在随着时间的流逝,动植物种群中不同种群的出现中的作用。这本书展示了一个个人成员物种他们之间的不同以及它们如何具有或多或少适应其环境的特征。那些具有更适应性特征的人更有可能生存以生存并引起另一代。那些自适应特征较少的人的可能性较小。这些思想激发了加尔顿对人类研究的兴趣,以及他们如何与另一个人的差异,更重要的是如何衡量这些差异。
加尔顿写了一本名为的书遗传天才。该书描述了人们所拥有的不同特征以及这些特征如何比其他特征更“合适”。如今,这些差异,例如感觉和运动功能(反应时间,视力和体力),是科学心理学的重要领域。早期的理论和申请精神计量学工作的大部分是为了衡量智力。加尔顿经常被称为“精神计量学之父”,在他的中设计并包括了心理测试人体测量学措施。詹姆斯·麦肯·卡特尔(James McKeen Cattell)是精神计量学领域的先驱,继续扩大了加尔顿的作品。卡特尔创造了这个词心理测试并负责最终导致现代测试发展的研究和知识。[4]
德国流
心理计量学的起源也与相关领域的联系心理物理学。大约在达尔文(Darwin),加尔顿(Galton)和卡特尔(Cattell)发现他们的发现的同时,赫巴特(Herbart)也有兴趣通过科学方法“解锁人类意识的奥秘”。[4]赫尔巴特负责创建思维的数学模型,这些模型在未来几年中对教育实践产生了影响。
E.H.韦伯建立在赫尔巴特的工作之上,并试图证明心理阈值的存在,称至少刺激是为了激活一个感官系统。韦伯之后,G.T.菲切纳扩展了他从赫巴特和韦伯收集的知识,以设计一种刺激强度对数的力量的法律。韦伯和菲切纳的追随者,威廉·旺德(Wilhelm Wundt)以创建心理学的科学为荣。旺德的影响为他人开发心理测试铺平了道路。[4]
20世纪
1936年,心理学家L. L. Thurstone,心理计量学会的创始人兼第一主席,开发并应用了一种理论方法,以衡量比较判断法,这种方法与与心理物理理论有着紧密联系恩斯特·海因里希·韦伯(Ernst Heinrich Weber)和古斯塔夫·费希纳(Gustav Fechner)。此外,斯皮尔曼(Spearman)和瑟斯通(Thurstone)都为理论和应用做出了重要贡献因子分析,一种统计方法在心理计量学中开发和广泛使用。[5]在1950年代后期,Leopold Szondi对过去几十年来对统计思维对心理学的影响进行了历史和认识论评估:“在过去的几十年中,特定的心理思维几乎被完全抑制和删除,并用统计思维取代。今天的睾丸学和睾丸病。”[6]
最近,心理计量学理论已应用于人格的衡量中,态度, 和信念, 和学术成就。这些潜在的结构无法真正衡量,并且已经开发了该学科中的许多研究和科学,以试图衡量这些结构尽可能接近真实分数。
为心理计量学做出重大贡献的数字包括卡尔·皮尔森(Karl Pearson),亨利·凯瑟(Henry F. Kaiser),卡尔·布里格姆(Carl Brigham),L. L. Thurstone,E. L. Thorndike,乔治·拉希(Georg Rasch),尤金·加兰特(Eugene Galanter),约翰逊·奥康纳(Johnson O'Connor),弗雷德里克·M·洛德(Frederic M. Lord),Ledyard R Tucker,路易·古特曼(Louis Guttman), 和简·洛夫文(Jane Loevinger).
社会科学中测量的定义
社会科学中测量的定义具有悠久的历史。当前的广泛定义,提出斯坦利·史密斯·史蒂文斯(Stanley Smith Stevens),测量是“根据某些规则将数字分配给对像或事件”。这个定义是在1946年引入的科学史蒂文斯提出四个的文章测量水平.[7]尽管广泛采用,但在重要方面,这种定义与物理科学中采用的测量的更古典定义有所不同,即科学测量需要“估计或发现定量属性的某种大小属性的比率属于同一属性的单位”(第358页)[8]
的确,史蒂文斯(Stevens)对衡量标准的定义是为了回应英国弗格森委员会(Ferguson委员会),该委员会的主席A. Ferguson是物理学家。该委员会于1932年由英国科学发展协会任命,以调查定量估计感官事件的可能性。尽管其主席和其他成员是物理学家,但委员会还包括几位心理学家。委员会的报告强调了测量定义的重要性。尽管史蒂文斯(Stevens)的回应是提出一个新的定义,该定义在该领域产生了很大影响,但这绝不是对报告的唯一回应。另一种不同的回应是接受经典的定义,如以下陈述所反映的:
- 心理学和物理学的测量在没有不同的意义上。物理学家可以衡量何时找到符合必要标准的操作;心理学家也必须这样做。他们不必担心两家科学的测量含义之间存在神秘的差异(Reese,1943年,第49页)。[9]
这些不同的反应反映在替代测量方法中。例如,基于协方差矩阵通常在以下前提下使用的数字(例如评估得出的原始得分)是测量值。这种方法隐含地需要史蒂文斯对测量的定义,这仅要求数字是分配根据一些规则。因此,主要的研究任务通常被认为是分数之间的关联,以及所提出的因素是基于这种关联的基础。[10]
另一方面,当测量模型(例如Rasch型号被使用,数字未根据规则分配。取而代之的是,根据REESE的上述声明,陈述了测量的具体标准,目标是构建符合相关标准的数据或操作。根据模型估算测量值,并进行测试以确定是否已满足相关标准。
仪器和程序
第一个心理测量器旨在测量智力.[11]测量智力的一种早期方法是在法国开发的测试Alfred Binet和西奥多·西蒙(Theodore Simon)。该测试被称为测试binet-simon 法国测试是通过在美国使用的刘易斯·泰伦(Lewis Terman)斯坦福大学,并命名Stanford-Binet IQ测试.
精神计量学方面的另一个主要重点是个性测试。尽管没有广泛同意的理论,但仍有一系列的理论方法来概念化和衡量个性。一些知名的乐器包括明尼苏达州多相个性库存, 这五因素模型(或“ big 5”)和诸如个性和偏好库存和Myers -Briggs类型指标。还使用心理测量方法对态度进行了广泛的研究。另一种方法涉及应用展开测量模型的应用,最普遍的是双曲线余弦模型(Andrich&Luo,1993)。[12]
理论方法
心理医生已经开发了许多不同的测量理论。这些包括古典测试理论(CTT)和项目响应理论(IRT)。[13][14]在数学上似乎与IRT相似,但就其起源和特征而言,这种方法与IRT相似,也很独特。Rasch型号进行测量。Rasch模型的开发及其所属模型的更广泛类别是根据物理科学的测量要求明确建立的。[15]
心理医生还开发了与大量相关和协方差矩阵合作的方法。这一一般传统中的技术包括:因子分析,[16]确定数据基础维度的一种方法。因素分析用户面临的主要挑战之一是缺乏就适当程序的共识确定潜在因素的数量.[17]通常的程序是停止考虑时特征值下降到一个以下,因为原始球会收缩。缺乏切割点也涉及其他多元方法。[18]
多维缩放[19]是找到具有大量潜在维度的数据的简单表示的方法。聚类分析是寻找彼此类似对象的方法。因子分析,多维缩放和聚类分析都是用于从大量数据简单结构中提取的多元描述方法。
最近,结构方程建模[20]和路径分析代表更复杂的方法与大型合作协方差矩阵。这些方法允许将统计复杂的模型拟合到数据并进行测试以确定它们是否足够。因为在颗粒层,心理测量研究与每个感兴趣的项目中多维性的程度和性质有关[21][22][23]可能会有所帮助。双因素分析可以分解“一个项目的系统差异,理想情况下是两个来源,一个总体因素和一个额外的系统差异来源”。[24]
关键概念
古典测试理论中的关键概念是可靠性和有效性。可靠的措施是跨时间,个人和情况始终如一地衡量结构的方法。有效的措施是衡量其打算衡量的措施。可靠性是必要的,但不足以实现有效性。
可靠性和有效性都可以从统计学上进行评估。可以通过Pearson相关系数评估相同测试的重复测量的一致性,通常称为测试可靠性。[25]同样,同一度量的不同版本的等效性可以由A索引皮尔逊相关性,被称为等效形式的可靠性或类似的术语。[25]
内部一致性解决了单个测试形式的均匀性,可以通过在测试的两半上关联性能来评估,这被称为半分裂的可靠性;这个价值皮尔森产品矩相关系数对于两个半测试,请调整Spearman -Brown预测公式对应于两个全长测试之间的相关性。[25]也许最常用的可靠性索引是克朗巴赫的α,等同于意思是所有可能的半分系数。其他方法包括类内相关性,这是给定目标测量值与所有目标方差的差异之比。
有许多不同形式的有效性。与标准相关的有效性是指测试或量表预测行为样本的程度,即标准,即“测量工具本身的外部”。[26]外部行为样本可以是许多事情,包括另一项测试;平均大学坡度的平均水平与高中SAT用于预测大学表现的时间一样;甚至过去发生的行为,例如,当使用当前心理症状的测试来预测过去的受害的发生(这将准确地代表后期的发生)。当在验证措施的同时收集标准度量时,目标是建立并发有效性;当稍后收集标准时,目标是建立预测有效性。措施有构造有效性如果它与理论要求的其他结构的度量有关。内容有效性证明了测试的项目在涵盖正在测量的域上做得足够的工作。在人员选择示例中,测试内容基于定义的陈述或一组知识,技能,能力或其他从工作分析.
项目响应理论建模潜在特征和对测试项目的响应。除其他优点外,IRT提供了一个基础,以估算给定潜在特征以及该位置测量的标准误差。例如,可以从大学考试中得出大学生的历史知识,然后可靠地将其与高中生的知识可靠地进行比较。通过经典测试理论得出的分数没有这种特征,并且必须通过将分数与从人群随机选择的“规范组”的分数进行比较来评估实际能力(而不是相对于其他考试者的能力)的评估。实际上,从经典测试理论得出的所有措施都取决于所测试的样本,而原则上,从项目响应理论得出的样本不是。
质量标准
考虑因素有效性和可靠性通常将其视为确定的基本要素质量任何测试。但是,专业和从业者协会在开发时经常将这些关注点在更广泛的环境中标准并在给定背景下对整个测试的整体质量做出总体判断。在许多应用研究环境中对关注的考虑是给定心理清单的指标是有意义的还是任意的。[27]
测试标准
2014年,美国教育研究协会(AERA),美国心理学协会(APA)和国家教育测量委员会(NCME)发表了修订教育和心理测试标准,[28]它描述了测试开发,评估和使用的标准。这标准涵盖测试的基本主题,包括有效性,可靠性/测量错误和测试中的公平性。该书还建立了与测试操作有关的标准,包括测试设计和开发,得分,量表,规范,得分链接,降低分数,测试管理,评分,报告,分数解释,测试文档,测试文档以及测试用户的权利和职责和职责。最后,标准涵盖与测试申请有关的主题,包括心理测试和评估,工作场所测试和证书,教育测试和评估和测试计划评估和公共政策。
评估标准
在...方面评估,特别是教育评估, 这教育评估标准联合委员会[29]已经发布了三组评估标准。人员评估标准[30]于1988年出版计划评估标准(第二版)[31]于1994年出版,学生评估标准[32]于2003年出版。
每个出版物都介绍并阐述了一套标准,以用于各种教育环境。该标准提供了设计,实施,评估和改进确定的评估形式的准则。[33]每个标准都属于四个基本类别之一,以促进适当,有用,可行和准确的教育评估。在这些标准组中,准确性主题涵盖了有效性和可靠性考虑因素。例如,学生的准确性标准有助于确保学生评估将提供有关学生学习和表现的合理,准确和可信的信息。
争议和批评
因为心理计量学是基于潜在的心理过程通过相关性,关于一些心理测量措施一直存在争议。[34][需要页面]批评家,包括从业者物理科学,认为这种定义和量化很困难,并且这种测量经常被外行滥用,例如在就业程序中使用的人格测试。教育和心理测量标准给出了以下声明测试有效性:“有效性是指证据和理论支持通过提出的测试用途所需的测试分数解释的程度”。[35]简而言之,除非测试以预期的方式使用和解释,否则测试是无效的。[36]
两种用于测量的工具人格特质是客观测试和投影措施。此类测试的示例是:五大库存(bfi),明尼苏达州多相个性库存(mmpi-2),Rorschach Inkblot测试,神经性人格问卷KON-2006,[37]或者Eysenck的个性问卷(EPQ-R)。其中一些测试很有帮助,因为它们足够可靠性和有效性,两个因素使测试对基础结构进行一致和准确的反射。然而,迈尔斯 - 布里格斯类型指标(MBTI)具有可疑的有效性,并且一直是许多批评的主题。心理学专家罗伯特·霍根(Robert Hogan)写了这一措施:“大多数人格心理学家都认为MBTI只不过是一个精心制作的中国财富饼干。”[38]
李·克朗巴赫注意美国心理学家(1957年),“相关心理学虽然像实验一样古老,但较慢。但是,它同样符合纪律,因为它提出了一种独特的问题,并且具有研究问题是否正确的技术方法放置和数据正确解释。”他会继续说:“相关方法就可以研究人类没有学会的控制或永远无法控制的东西……需要对学科的真正联合会。保持独立,只能给予关于某些重要问题的错误答案或根本没有答案。”[39]
非人类:动物和机器
心理计量学的解决方案人类能力,态度,特质和教育进化。值得注意的是,非人类的行为,心理过程和能力的研究动物通常由比较心理学,或通过非人类动物与其他动物之间的连续体进化心理学。尽管如此,在人类采取的方法与(非人类)动物采取的方法之间有一些逐渐过渡的倡导者。[40][41][42][43]
能力,特征和学习进化的评估机器主要与人类和非人类动物无关,并在该地区采用特定方法人工智能。一种更集成的方法,以普遍的心理计量学,也已提出。[44]
也可以看看
参考
- ^“词汇表1”。 2017年7月22日。原本的在2017-07-22。检索6月28日2022.
- ^一个bB.G. Tabachnick;菲德尔(L.S.) (2001)。使用多元分析。波士顿:艾琳和培根。ISBN 978-0-321-05677-1.[需要页面]
- ^Kaplan,R.M。和Saccuzzo,D.P。 (2010)。心理测试:原理,应用和问题。(第8版)。加利福尼亚州贝尔蒙特:沃兹沃思,Cengage Learning。
- ^一个bcKaplan,R.M。和Saccuzzo,D.P。 (2010)。心理测试:原理,应用和问题(第8版)。加利福尼亚州贝尔蒙特:沃兹沃思,Cengage Learning。
- ^Nunnally,J。和Berstein,I。H.(1994)。心理学理论(第三版)。纽约:麦格劳 - 希尔。
- ^Leopold Szondi(1960)Das Zweite Buch:Lehrbuch der persubimentellen triebdiagnostik。Huber,Bern und Stuttgart,第二版。Ch.27,来自西班牙语翻译,b)iiLas Condiciones遗传性,第396页。引述:
El Pensamiento Psicologico Especifico,En Las Ultima decadas,Fue Suprimido y leiminado casi Casi Totalmente,Siendo sustituido por un pensamiento estadistico。Precisamente aqui vemos elCáncerde latestologíay testomania de Hoy。
- ^史蒂文斯(S. S.)(1946年6月7日)。“关于测量量表的理论”。科学.103(2684):677–680。Bibcode:1946年... 103..677S.doi:10.1126/Science.103.2684.677.PMID 17750512.S2CID 4667599.
- ^乔尔·米歇尔(1997年8月)。“定量科学与心理学测量的定义”。英国心理学杂志.88(3):355–383。doi:10.1111/j.2044-8295.1997.tb02641.x.
- ^里斯(T.W.)(1943)。物理测量理论的应用在心理大小的测量中,并通过三个实验示例。心理专着,55,1-89。doi:10.1037/H0061367
- ^“心理计量学”.评估Psychology.com。检索6月28日2022.
- ^斯特恩(Theodore A。)法瓦,毛里齐奥;威尔斯(Timothy)Rosenbaum,Jerrold F.(2016)。马萨诸塞州总医院综合临床精神病学(第二版)。伦敦。 p。 73。ISBN 978-0323295079。检索10月31日2021.
- ^Andrich,D。&Luo,G。(1993)。一种用于展开的双曲线余弦特征模型二分法单刺激响应。应用心理测量,17,253–276。
- ^Embretson,S.E。和Reise,S.P。(2000)。心理学家的项目反应理论。新泽西州马瓦(Mahwah):埃尔鲍姆(Erlbaum)。
- ^Hambleton,R.K。和Swaminathan,H。(1985)。项目响应理论:原理和应用。波士顿:克鲁沃 - 尼古夫。
- ^Rasch,G。(1960/1980)。一些智力和成就测试的概率模型。丹麦教育研究所哥本哈根(Copenhagen),扩展了版本(1980),并由B.D.赖特。芝加哥:芝加哥大学出版社。
- ^汤普森(B.R.) (2004)。探索性和验证性因素分析:理解概念和应用。美国心理协会。
- ^Zwick,William R。;Velicer,Wayne F.(1986)。“比较五个确定保留组件数量的规则”。心理公告.99(3):432–442。doi:10.1037/0033-2909.99.3.432.
- ^辛格,Manoj Kumar博士(2021-09-11)。社会心理学简介。 K.K.出版物。
- ^戴维森(M.L.) (1992)。多维缩放。克里格。
- ^Kaplan,D。(2008)。结构方程建模:基础和扩展,第二版。智者。
- ^Demars,C。E.(2013)。解释双因素模型得分的教程。国际测试杂志,13,354–378。http://dx.doi.org/10.1080/15305058.2013.799067
- ^Reise,S。P.(2012)。双因素建模的重新发现。多元行为研究,47,667–696。http://dx.doi.org/10.1080/00273171.2012.715555
- ^Rodriguez,A.,Reise,S.P。,&Haviland,M。G.(2016)。评估双歧杆模型:计算和解释统计指标。心理方法,21,137-150。http://dx.doi.org/10.1037/met0000045
- ^Schonfeld,I.S。,Verkuilen,J。&Bianchi,R。(2019)。探索性结构方程模拟双因素分析方法,以发现倦怠,抑郁和焦虑量表测量什么。心理评估,31,1073–1079。http://dx.doi.org/10.1037/pas0000721p。 1075
- ^一个bc“家庭 - Del Siegle的教育研究基础知识”.www.gifted.uconn.edu。 2015年2月17日。
- ^Nunnally,J.C。(1978)。心理学理论(第二版)。纽约:麦格劳 - 希尔。
- ^Blanton,H。和Jaccard,J。(2006)。心理学的任意指标。存档2006-05-10在Wayback Machine美国心理学家,61(1),27-41。
- ^“教育和心理测试的标准”.apa.org.
- ^“教育评估标准联合委员会”。存档原本的2009年10月15日。检索6月28日2022.
- ^教育评估标准联合委员会。(1988)。人员评估标准:如何评估评估教育者的系统。存档2005-12-12在Wayback Machine加利福尼亚州纽伯里公园:Sage出版物。
- ^教育评估标准联合委员会。(1994)。计划评估标准,第二版。存档2006-02-22在Wayback Machine加利福尼亚州纽伯里公园:Sage出版物。
- ^教育评估标准委员会。(2003)。学生评估标准:如何改善学生的评估。存档2006-05-24在Wayback Machine加利福尼亚州纽伯里公园:Corwin出版社。
- ^[E. Cabrera-Nguyen(2010)。“报告规模开发和验证的作者指南在《社会工作与研究学会杂志》中导致的作者指南”.Academia.edu.1(2):99–103。
- ^B.G. Tabachnick;菲德尔(L.S.) (2001)。使用多元分析。波士顿:艾琳和培根。ISBN 978-0-321-05677-1.
- ^美国教育研究协会,美国心理学协会和国家教育测量委员会。(1999)教育和心理测试标准。华盛顿特区:美国教育研究协会。
- ^Bandalos,Deborah L.(2018)。测量理论和社会科学的应用。纽约。 p。 261。ISBN 978-1-4625-3215-5.OCLC 1015955756.
- ^Aleksandrowicz JW,Klasa K,SobańskiJA,Stolarska D(2009)。“ Kon-2006神经性个性问卷”(PDF).精神病学和心理治疗档案.1:21–22。
- ^霍根,罗伯特(2007)。个性和组织的命运。新泽西州马瓦(Mahwah):劳伦斯·埃尔鲍姆(Lawrence Erlbaum Associates)。 p。 28。ISBN 978-0-8058-4142-8.OCLC 65400436.
- ^Cronbach,L。J.(1957)。“科学心理学的两个学科”。美国心理学家.12(11):671–684。doi:10.1037/H0043943 - 通过EBSCO。
- ^Humphreys,L.G。(1987)。“评估智力内种内差异的心理计量学考虑”。行为脑科学.10(4):668–669。doi:10.1017/S0140525X0005514X.
- ^Eysenck,H.J。(1987)。“智力的几种含义”。行为脑科学.10(4):663。doi:10.1017/S0140525X00055060.
- ^Locurto,C。&Scanlon,C(1987)。“两种小鼠菌株中的个体差异和空间学习因素”。行为脑科学.112:344–352。
- ^King,James E&Figueredo,Aurelio Jose(1997)。“五因素模型以及黑猩猩个性中的主导地位”。个性研究杂志.31(2):257–271。doi:10.1006/jrpe.1997.2179.
- ^J.Hernández-Orallo;D.L.我们要不要;M.V.Hernández-Lloreda(2013)。“普遍的心理计量学:衡量机器王国的认知能力”(PDF).认知系统研究.27:50–74。doi:10.1016/j.cogsys.2013.06.001.HDL:10251/50244.S2CID 26440282.
参考书目
- Andrich,D。&Luo,G。(1993)。“一种用于展开二分单刺激反应的双曲线余弦模型”(PDF).应用心理测量.17(3):253–276。Citeseerx 10.1.1.1003.8107.doi:10.1177/014662169301700307.S2CID 120745971.
- Michell,J。(1999)。心理学的测量。剑桥:剑桥大学出版社。doi:10.1017/CBO9780511490040
- Rasch,G。(1960/1980)。一些智力和成就测试的概率模型。哥本哈根,丹麦教育研究所),扩展版(1980年),由B.D.赖特。芝加哥:芝加哥大学出版社。
- 里斯(T.W.)(1943)。物理测量理论的应用在心理大小的测量中,并通过三个实验示例。心理专着,55,1-89。doi:10.1037/H0061367
- Stevens,S。S.(1946)。“关于测量量表的理论”。科学.103(2684):677–80。Bibcode:1946年... 103..677S.doi:10.1126/Science.103.2684.677.PMID 17750512.
- Thurstone,L.L。(1927)。“比较判断法则”。心理评论.34(4):278–286。doi:10.1037/H0070288.
- Thurstone,L.L。(1929)。心理价值的测量。在T.V. Smith和W.K.赖特(编辑),芝加哥大学十七位哲学医生的哲学论文。芝加哥:公开法庭。
- Thurstone,L.L。(1959)。值的测量。芝加哥:芝加哥大学出版社。
- S.F.眨眼(1997)。“过去不完美,未来条件:五十年的测试理论”。英国数学和统计心理学杂志.50(2):175–185。doi:10.1111/j.2044-8317.1997.tb01139.x.
- 桑福德,大卫(2017年11月18日)。“剑桥刚刚告诉我,大数据尚不正常”.LinkedIn.
进一步阅读
- 罗伯特·德·德维利斯(Robert F. Devellis)(2016)。规模发展:理论和应用。鼠尾草出版物。ISBN 978-1-5063-4158-3.
- Borsboom,Denny(2005)。衡量思想:当代心理计量学中的概念问题。剑桥:剑桥大学出版社.ISBN 978-0-521-84463-5.
- 莱斯利·米勒(Leslie A. Miller);罗伯特·洛夫勒(Robert L. Lovler)(2015)。心理测试的基础:一种实用方法。鼠尾草出版物。ISBN 978-1-4833-6927-3.
- Roderick P. McDonald(2013)。测试理论:统一治疗。心理学出版社。ISBN 978-1-135-67530-1.
- 保罗·克莱恩(Paul Kline)(2000)。心理测试手册。心理学出版社。ISBN 978-0-415-21158-1.
- Rush AJ Jr;第一MB; Blacker D(2008)。精神病手册。美国精神病出版。ISBN 978-1-58562-218-4.OCLC 85885343.
- Ann C Silverlake(2016)。理解测试手册:指南和工作簿。泰勒和弗朗西斯。ISBN 978-1-351-97086-0.
- Snigdha Rai(2018)。“心理测验的最终指南”。 Mercer Mettl。