SPM瑞文智力推理测验标准版：一个测量"纯粹推理能力"的经典工具

心理量表

拾棠心理

2026-06-24 18:00:29

文章相关测试SPM瑞文智力推理测验标准版

进入测试

提到智力测验，很多人脑海中浮现的是"做题""限时""考分"——但有一类智力测验另辟蹊径：全程不说一个字，不写一个词，只靠看图推理。

这就是已有近九十年历史的SPM瑞文智力推理测验标准版（Raven's Standard Progressive Matrices，简称SPM）。

起源：斯皮尔曼的学生与"G因素"

要理解SPM瑞文智力推理测验标准版的逻辑，需要回到20世纪初。

英国心理学家查尔斯·斯皮尔曼（Charles Spearman）于1904年提出著名的智力二因素理论：所有智力活动背后都有两个因素——一个是渗透于一切智力活动中的一般因素（G因素），另一个是与特定任务相关的特殊因素（S因素） 。G因素代表个体解决各类问题时普遍具备的认知能力。

斯皮尔曼的学生、后来的英国心理测量学家约翰·C·瑞文（John C. Raven，1902-1970）接受了这一思想，并决定将G因素操作化为一个可以直接测量的工具。

Raven在1936年完成硕士论文时设计了这一测验，1938年正式出版瑞文标准推理测验。他的初衷很明确：创造一个不受语言、教育背景、文化知识影响的纯粹推理能力测量工具，可以适用于不同国家、不同职业，甚至不同身体条件的人群。

Raven本人有阅读障碍的经历，深刻体会到传统文字测验对非学术背景人群的不公平，这促使他坚定地走上"非文字"路径。

SPM瑞文智力推理测验标准版的结构

SPM瑞文智力推理测验标准版由60道题目组成，分为A、B、C、D、E五组，每组12题，按难度递增排列：

组别	测量内容	思维操作水平
A组	知觉辨别、图形比较与想象力	基础识别
B组	类同比较、图形组合	类比思维
C组	比较推理、图形组合	关系推理
D组	系列关系、图形套合、比拟	多维度推理
E组	互换、交错等抽象推理	高级演绎推理

每道题呈现一幅3×3的大矩阵图，其中右下角缺失一块，要求被试从6-8个备选答案中选出唯一正确答案，使其在逻辑上完美契合整个矩阵的规律。

关键特点：测验题目不依赖文字阅读，不涉及专业知识，也几乎不受文化背景影响——你只需要"观察规律，作出推断"，这正是SPM瑞文智力推理测验标准版设计的核心精妙之处。

理论对应：流体智力（Gf）的经典测量

从认知心理学角度看，SPM瑞文智力推理测验标准版测量的核心能力对应的是流体智力（Fluid Intelligence，Gf） ——即在面对新问题时，不依赖已有知识而运用抽象思维、推理和逻辑分析解决问题的能力。

这一定位与卡特尔-霍恩-卡罗尔（CHC）智力理论高度吻合。与之对应的是晶体智力（Crystallized Intelligence，Gc），即通过教育和经验积累的知识技能——那是词汇量表和常识测验的领地。

神经科学研究也证实，完成瑞文矩阵类题目时，大脑的前额叶皮层和顶叶皮层显著激活——这两个脑区正是复杂问题解决、抽象推理和工作记忆的核心区域。

中国修订：本土常模的建立

SPM瑞文智力推理测验标准版虽然是"文化公平"设计，但直接使用西方常模仍会造成偏差。因此，1985-1986年间，以北京师范大学张厚粲教授为首的全国修订协作组对SPM进行了系统化的中国城市版标准化工作，建立了基于中国城市人群的本土常模。

1989年，李丹、王栋等进一步将彩色型与标准型合并，出版了联合型瑞文测验（CRT）的中国修订版，同时建立了城市和农村儿童常模。CRT共72题（六个单元A、AB、B、C、D、E），前三个单元为彩色图案，后三个单元为黑白图案，是中国目前应用最广的瑞文版本。

信效度：科学性数据

信度：

分半信度：中文版CRT分半信度达0.95，表现优异；
重测信度：间隔15天为0.82，间隔30天为0.79，显示良好的时间稳定性。

效度：

与韦氏智力量表操作智商分量表呈显著正相关，具备良好的校标关联效度；
非文字设计有效规避了语言和文化偏倚，跨文化研究中表现稳健；
神经影像学研究一致显示其激活前额-顶叶网络，与流体智力的神经机制高度吻合。

适用范围与特点

适用年龄：5.5岁至70岁，覆盖全生命周期；

适用人群：正因为是非文字测验，以下人群均可使用：

不同语言、文化背景的人群；
少数民族群体；
聋哑人及语言障碍者；
智力落后者；
老年人认知功能评估。

施测方式：无严格时间限制（个别施测时可记录时间并分析错误模式，有助于了解被试的气质和情绪特点），一般约30-45分钟完成；既可个别施测，也可团体施测。

评分与解释：答对得1分，答错得0分，总分原始分换算为百分等级和IQ分数。智力等级分为五级：

百分位	智力等级
≥95%	高水平智力
75%-95%	智力良好
25%-75%	智力中等
5%-25%	智力中下
<5%	智力缺陷

应用场景

教育领域：儿童智力筛查、学业潜力评估、特殊教育需求识别；
临床与医学：智力障碍分级诊断、神经心理康复评估、老年认知功能监测（早期发现痴呆风险）；
职业选拔：军队、航空、高管评估中评估问题解决与适应能力；
跨文化研究：消除语言影响，进行跨国、跨文化智力比较；
公共卫生：社区认知功能筛查、儿童发育监测。

局限性与批评

天花板效应：在高分段（高智力人群），原始SPM的区分度有限。为此，Raven后来开发了SPM Plus版，包含更高难度的题目，专门用于精细区分高智力水平人群。
非穷尽性智力评估：SPM瑞文智力推理测验标准版专注于流体推理能力，不能代表智力的全部维度。完整的智力评估仍需配合语言、记忆、执行功能等多维度工具。
反应速度信息有限：标准版不计时，缺乏加工速度维度。对某些临床和神经心理评估场景，反应时的记录与分析有额外价值。

了解你的推理能力

SPM瑞文智力推理测验标准版之所以历经近九十年仍在全球广泛使用，根本原因在于它的设计哲学：测量的不是你知道什么，而是你能推出什么。

如果你想系统评估自己的推理能力，可以通过拾棠心理测试完成瑞文智力推理测验。

与其用一道题判断自己"聪明不聪明"，不如用一套科学工具看清自己的认知结构。

SPM瑞文智力推理测验标准版：一个测量"纯粹推理能力"的经典工具

起源：斯皮尔曼的学生与"G因素"

SPM瑞文智力推理测验标准版的结构

理论对应：流体智力（Gf）的经典测量

中国修订：本土常模的建立

信效度：科学性数据

信度：

效度：

适用范围与特点

应用场景

局限性与批评

了解你的推理能力

相关测试

最新文章

新闻动态

心理随笔

心理量表

心理科普

九型人格

推荐测试