如何初始化题库习题的区分度(1)
题库系统怎么判断题目区分度?尤其是没有历史做题数据的时候!这篇文章讲透了冷启动阶段的设计思路,产品人建议收藏!

上一篇讲了在没有做题数据下“如何初始化习题的难度”,本篇主要介绍习题的另外一个参数“区分度”,存在做题数据和无历史做题数据的时候分别如何确定区分度。
一、有历史数据的区分度
1. 极端分组法(最常用)
适用条件:有用户做题数据,样本量≥30人(人数越多越好)。
步骤:
排序分组:按总正确率从高到低排序(正确率是总的正确率,非某一道题),选取前27%为高分组,后27%为低分组。
计算通过率(针对某一习题):
高分组通过率 P_h= 高分组答对人数/高分组总人数
低分组通过率 P_l = 低分组答对人数/低分组总人数
计算区分度:D = Ph-Pl
结果解读:
D ≥ 0.4:区分度优秀,可保留
0.3 ≤ D < 0.4:良好,需优化
D < 0.2:差,建议淘汰或修改
举例:某题高分组30人答对24人 P_h=0.8 ,低分组30人答对9人P_l=0.3,则D=0.5,区分度优秀。
2. 点二列相关系数法(适用于客观题)
适用条件:题目为二分计分(0/1),总分连续。
公式:

3. S-P表分析法(适用于试卷整体分析)
步骤:
1. 计算每题得分率(难度指数 S):S = 平均分/满分
2. 计算鉴别指数 P = (答对人数\总人数) – (答错人数\总人数)
3. 绘制S-P表,横轴为难度 S,纵轴为鉴别指数 P ,定位题目位置
应用:可直观筛选出高难度高区分度(右上角)或低难度低区分度(左下角)的题目。
二、无数据的区分度
1. 专家评估法(核心方法)
操作流程:
1)组建评估小组:3-5名数学教师/教研员,熟悉课程标准和学生水平。
2)制定评估维度(建议5分制):
- 知识点覆盖广度:1分(单一知识点)→5分(跨章节综合)
- 解题策略复杂度:1分(直接套用公式)→5分(需创新方法)
- 错误类型多样性:1分(仅计算错误)→5分(概念、逻辑多重错误)
- 思维层次:1分(记忆复述)→5分(批判性思维)
3) 独立评分:专家根据题目特征对每个维度打分,取平均分作为区分度值。
4)结果校准:对评分差异较大的题目进行讨论,达成共识。
2. 认知复杂度模型(基于SOLO分类理论)
分类标准:
- 前结构:无法理解题意,无有效解答
- 单点结构:仅使用一个知识点,步骤单一
- 多点结构:使用多个孤立知识点,缺乏整合
- 关联结构:知识点间建立联系,形成完整逻辑链
- 拓展抽象:能推广结论或提出新方法
标记规则:
- 关联结构及以上:区分度高(D≥0.4)
- 多点结构:区分度中等(0.2≤D<0.4)
- 单点及前结构:区分度低(D<0.2)
3. 题目特征分析法
关键指标:
1. 选项干扰性:选择题中错误选项是否能有效迷惑低水平学生。
2. 开放性程度:主观题是否允许多种解法或答案。
四、注意事项
1. 数据场景:
极端分组法建议样本量≥50人,否则27%分组可能不具代表性。
点二列相关系数需满足总分正态分布假设,否则结果偏差较大。
2. 专家评估:
评估前需进行培训,统一评分标准。
建议采用双盲评分(隐去题目来源和出题人)。
3. 混合方法:
有数据时优先采用统计方法,无数据时专家评估需至少3人独立评分。
重要考试(如中考、高考)建议结合两种方法交叉验证。
通过以上方法,可系统、科学地标记数学题的区分度参数,为教学决策和题库建设提供量化依据。
本文由 @luffy 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!

起点课堂会员权益



