心理测试是心理测试的管理。心理测试由训练有素的评估人员进行。一个人的反应是根据精心制定的指导方针进行评估的。分数被认为反映了测试旨在测量的结构中的个体或群体差异。心理测试背后的科学是心理测量学。
根据 Anastasi 和 Urbina 的说法,心理测试涉及对“精心挑选的个人行为样本[强调作者]”进行的观察。心理测试通常用于测量未观察到的结构,也称为潜在变量。心理测试可以包括受访者必须解决的一系列任务或问题。心理测试可以包括问卷调查和访谈,它们也被设计用于测量未观察到的结构。基于问卷和访谈的量表通常不同于心理教育测试,后者要求受访者的最大表现。相比之下,基于问卷和访谈的量表要求受访者的典型行为。症状和态度测试通常被称为量表。一个有用的心理测试/量表必须既有效(即,有证据支持测试或量表测量其声称要测量的内容以及“它的效果如何” )和可靠(即,内部一致或随着时间的推移、跨评分者等给出一致的结果)。
重要的是,在测量结构(例如,数学能力、抑郁症)上相同的人准确回答测试项目或承认存在症状的概率大致相等。[4]可能在英国使用但在美国不使用的数学测试项目示例如下:“在一场足球比赛中,两名球员得到红牌;场上还剩多少名球员?” 本题要求正确回答足球(足球)知识,而不仅仅是数学能力。因此,组成员身份可以影响正确回答项目的机会,正如在差异项目功能概念中所包含的那样. 通常为特定人群构建测试,在该人群之外进行测试时应考虑该人群的性质。如果一个测试对一个人群(例如英国的学童)是不变的,它并不自动意味着该测试在另一个人群(例如美国的学童)中的功能大致相同。
心理评估类似于心理测试,但通常涉及对个人更全面的评估。心理评估是一个涉及检查来自多个来源的信息整合的过程,例如正常和异常人格测试,能力或智力测试,兴趣或态度测试,以及来自个人访谈的信息。还收集有关个人、职业或病史的附带信息,例如从记录或与父母、配偶、老师或以前的治疗师或医生的面谈中。心理测试是评估过程中使用的数据来源之一;通常使用不止一项测试。许多心理学家在为客户或患者提供服务时会进行一定程度的评估,例如,可能会使用简单的清单来评估某些特征或症状,但心理评估是一个更复杂、更详细、更深入的过程。心理评估的典型重点是提供诊断;经常在学校环境中评估特定的功能或残疾领域;帮助选择治疗类型或评估治疗结果;帮助法院决定诸如儿童监护权或受审资格等问题;或帮助评估求职者或员工,并提供职业发展咨询或培训。
第一次大规模的考试可能是中国科举制度的一部分。该测试是心理测试的早期形式,根据候选人对民法和财政政策等主题的熟练程度进行评估。其他早期的智力测试是为了娱乐而不是分析。现代心理测试始于 19 世纪的法国。它有助于将精神发育迟滞与精神疾病分开,并减少对两组人的忽视、折磨和嘲笑。
英国人弗朗西斯·高尔顿创造了心理测量学和优生学这两个术语,并开发了一种基于非语言感觉运动测试的智力测量方法。它最初很受欢迎,但在发现它与大学成绩等结果无关后被放弃了。法国心理学家阿尔弗雷德·比奈( Alfred Binet)与心理学家维克多·亨利(Victor Henri)和西奥多·西蒙( Théodore Simon )一起,经过大约15年的发展,于1905年发表了比奈-西蒙测试,该测试侧重于语言能力。它旨在识别学龄儿童的智力低下。
性格测试的起源可以追溯到 18 世纪和 19 世纪,当时通过颅相学、人类头骨的测量和面相学来评估性格,后者根据一个人的外表来评估性格。这些早期的伪科学技术最终在 20 世纪被更多的经验方法所取代。最早的现代人格测试之一是伍尔沃斯人格数据表,这是一个为第一次世界大战开发的自我报告清单,用于对新兵进行精神病筛查。
与“找出你的性格颜色”或“你的内心年龄是多少?”的基于网络或杂志的快速问卷形成对比的是,在大力研究和开发之后进行适当的心理测试。适当的心理测试包括以下内容:
行为样本一词是指个人在通常事先规定的任务上的表现。构成纸笔测试(最常见的心理测试类型)的行为样本是一系列测试项目。在这些项目上的表现会产生一个测试分数。一个结构良好的考试的分数被认为反映了一种心理结构,例如数学知识、认知能力、能力、情感功能、个性等学校科目的成就。考试分数的差异被认为反映了个体差异构建测试旨在测量。[需要引用]
心理测试有几大类:
成就测试是评估个人在学科领域知识的测试。学术成就测试旨在由经过培训的评估员对个人或一群人进行管理。在成就测试期间,一系列测试项目被呈现给被评估的人。考试成绩被认为反映了学校科目的成绩。
许多成就测试都是参照标准的。该人的反应根据标准化协议进行评分,并且可以在测试完成后将结果与规范组的反应进行比较。
一些成就测试是参照标准的,其目的是了解应试者是否掌握了预定的知识体系,而不是将应试者与其他参加考试的人进行比较。
考夫曼教育成就测试是针对学生进行单独管理的成就测试的一个例子。
心理测试旨在衡量特定的能力,例如文书能力、感知能力、数字能力或空间能力。有时这些测试必须是专门为特定工作设计的,但也有一些测试可以衡量一般文书和机械能力,甚至是一般学习能力。职业能力倾向测试的一个例子是明尼苏达文书测试,它测量执行各种文书职责所需的感知速度和准确性。商业中广泛使用的能力倾向测试是Wonderlic 测试。有些能力被认为与特定职业相关,用于职业指导以及选拔和招聘。
有证据表明,像智商测试这样的能力倾向测试对过去的学习很敏感,并且无法避免衡量过去的成就,尽管它们曾经被认为可以衡量未经指导的能力。[14] SAT,曾经被称为学术能力测试,由于测试的表现对训练很敏感,所以更名了。
态度量表评估个人对事件(例如,最高法院的裁决)、人(例如,州长)、概念(例如,在大流行期间戴口罩)、组织(例如,童子军)或对象的处置(例如,核武器)在一维的有利-不利态度连续体上。态度量表用于营销以确定个人对品牌的偏好。历史上,社会心理学家开发了态度量表来评估个人对联合国和种族关系的态度。通常李克特量表用于态度研究。从历史上看,瑟斯通量表在李克特量表的发展之前使用。李克特量表已在很大程度上取代了瑟斯通量表。
传记信息空白或 BIB 是一种纸笔表格,其中包括询问详细个人和工作历史的项目。它用于通过将个人背景与工作要求相匹配来帮助雇用员工。
临床测试的目的是评估精神病理学症状的存在。临床评估的例子包括明尼苏达多相人格量表、Millon 临床多轴量表-IV、儿童行为检查表、症状检查表 90 和贝克抑郁量表。
像 MMPI 这样的临床测试也是标准参考,50 分是症状分量表(如抑郁量表)的最中间分数,而 60 分是使个体高于症状量表平均值一个标准差的分数。[需要引用]
标准参考测试是特定知识领域的成就测试。将个人在测试中的表现与标准进行比较。考生之间不进行比较。及格分数,即标准表现,由教师或教育机构确定。标准参考测试是基于掌握的教育的重要组成部分。
心理评估可以涉及在人们完成活动时对其进行观察。这种类型的评估通常在实验室或家中与家人一起进行。有时观察可能涉及教室或校园里的孩子。目的可能是临床的,例如建立儿童过度活跃或攻击性课堂行为的干预前基线,或观察亲子互动的性质以了解关系障碍。时间抽样方法也是直接观察研究的一部分。可以使用Cohen 的 kappa评估直接观察研究中观察者的可靠性。
亲子互动评估-II (PCIA) 是用于学龄儿童和家长的直接观察程序的一个示例。父母和孩子们在一个虚构的动物园里玩耍。亲子早期关系评估用于研究父母和幼儿,涉及喂养和拼图任务。麦克阿瑟故事干电池 (MSSB) 用于引出儿童的叙述。Dyadic 亲子交