又再说作文机器阅卷的两路径
又再说作文机器阅卷的两大路径
渐新堂
国内现在大约是三家科技公司在进行高考作文机器阅卷的试验,三家公司的阅卷技术以及程序算法等应该还处于保密阶段,根据一些蛛丝马迹的碎片拼接,可以大致知道一些最主要的两大实施路径。
一是按照课程标准或者说过去的考试大纲对写作部分的要求,设置不同层级的作文评分栏目后进行评分。诸如
内容 含内容充实、思想健康,符合题意、感情类型。前者 健康句识别;后者 情感分析。
表达 基础表达、行文规范、文体符合、语言流畅,紧跟着的分别是统计、分类、检测及连贯性分析。语言流畅又与语言准确度分析关联,涉及别字纠错、成语检错、网络语检索,以及语法古诗文标点等检错。
发展 有文采 涉及到常用修辞手法及描写方法
结构 严谨 涉及到结构分析(开篇、结构、首尾等)与主题分析(主题识别与离题检索)
显然,这样的要求是全面导向的,然而又是很难在认知上甚至是各部分各细微处的权重上获得共识的。尽管很艰难,作文机器阅卷也得一步步往前挪动,不断进行修改调整。
二是根据阿尔法狗机器人的思维方式来根据高考作文阅卷实际进行深度学习的算法进行的作文评分。
阅卷场评分的要求是分为五等六等甚至八等十等,电脑则比照进行,对几十万份作文进行相同等级的级数进行分类。
此外,还利用计算机强大的检索功能,进行雷同卷的检索、文本特征句子特征段落特征等的提取。从客观上外显形式上可以进行加分减分的辅助评分,有力地佐证和辅助了人工阅卷的不足。
如文本特征提取上,可以得知总字数、标点符号、词汇量、单字量、段落量、诗词名句等。
当然,这些检所观察到的数据,可以为潜语义分析提供支撑,尤其是积累多年的数据后。但是,绝对不要将上述维度单一化绝对化去思考,其间的数据关系应该不再是简单的直线方程。
这两大路径,简单说来就是标准预设与实践抽象,也可以说,一是演绎式的思路,一是归纳式的思路。在实践中都还有待进一步去得到证实与证伪,都应该在实践中不断去修改调整,获得更加切近实际得到更多人认可的相对比较客观科学的作文阅卷结果。