三月正暖,驰声语音技术专家团队已前往一线,开启今年的首站考试评分服务。何为“双机评”?为何“双机评”?如何保障考试公平?让我们一起前往探寻了解。
01何为“双机评”?
“双机评+人工仲裁”的评分方案,是2013年广西高考口语考试自动评分技术验证项目时,驰声率先提出的方案设想。
“双评+仲裁”制是中高考主观题普遍采用的评分机制,即将同一题目随机分发给不同的评卷老师,通过预设阈值控制分差。若两人评出的分数在专家组设定的评分误差范围之内,则取其平均值计分;超出评分误差范围的,进行专家第三评;仍超出评分误差范围的由评卷专家组集体研究仲裁。
在中高考英语听说考试中采取“双机评+人工仲裁”方案,正是借鉴了上述严肃严谨的人评方式。即,两家技术服务商的智能评分引擎,分别自适应学习标杆卷的专家评分标准,独立评分后取平均分。如果两家评分结果的差值超出考试院规定的阈值,比如:20%,触发专家仲裁。
如果说,在中高考英语听说考试时采用机器评分,可以保障评分标准的统一和稳定性,那么,“双机评”方案有三大意义——
1、大分差出现概率,有效降低30%-80%;2、增强评分透明度,提高可追溯性;3、双AI+专家,多方共护社会信任。
2016年沈阳中考英语口语考试,首次在正式考试中采用“双机评”方案,超过5万初中毕业考生参与了此次中考。2016年5月下旬公布成绩以后,无任何一位考生提出对分数进行复查和申诉,有效保障了考试的公平公正。
之后,“双机评”在2021年得到标志性规模应用。上海、湖北宜昌、辽宁盘锦等多地中考英语听力口语自动化考试“双机评+人工仲裁”同时落地实施,成效显著。
以上考试,均由驰声提供AI口语阅卷技术。
03 2025年,驰声团队首站已出发!驰声在中高考英语听说考试服务领域,积累了逾13年的丰富实践经验,拥有完全知识产权的大型人机对话语音评测技术。
驰声全新启用的AMS4.0英语口语机评系统,支持单、双、多机评阅卷,可适配100+城市中高考复杂评分要求,评分精度和能力无限接近专家老师,轻松应对百万量级音频评分,兼顾科学、准确、高效、公平,在历次教育局、考试院组织的技术验证中成绩斐然。
今年,苏州驰声信息科技有限公司与长春市教育考试院再次达成战略合作。日前,驰声考试专家团队已启程长春,开启2025年“双机评”服务首站。
“双机评”不仅是技术进步的产物,更是教育评价体系迈向公平、高效、科学的重要里程碑。随着更多地区引入“双机评”模式,驰声将继续以领先的解决方案,以“守护每一分成长”为使命,为亿万学子构建更公正的考评体验。