【Knewton适应性学习研究】推荐原理+知识图谱+连续适应性+大数据
作者:梵人
发布时间: 2014-02-28 10:49
背景:Knewton是一个“适应性学习”工具,由约瑟·费雷拉(Jose Ferreira)在2008年创办。创始人费雷拉是一个喜欢折腾的人,从1991年从卡尔顿学院毕业后在卡普兰(Kaplan)当了一名SAT辅导老师(卡普兰(Kaplan)是旧金山最大的应试培训机构)。几年后辞职,到哈弗商学院读了MBA,1997年,获得工商管理硕士的费雷拉在令人神往的高盛做了三年金融衍生品交易员。之后又先后创办过一家制图软件公司DizzyCity,担任过约翰·克里(John Kerry)总统竞选团队的战略师,做过风险投资人。就像佛洛依德的梦魇一般,出于对生产线式的传统教育的不认同,2008年费雷拉决定回归教育行业,毅然创办了Knewton来重构学习方式——Knewton诞生了。
(一)Knewton适应性学习:是一种课程必须适用每个用户的思想的教学方法
适应性学习是一个以课程应该适应每一个用户的思想为前提的教学方法。Knewton认为,适应性学习指的是一个连续的适应性系统。对于每个用户在Knewton系统上的表现和活动都进行实时的响应。系统通过在正确的时间对每个学生提供正确的指导,从而使得学生达到所制定的学习目标的可能性最大化。换句话说,适应性测试回答两个基本问题:一个是如何通过特定数量的试题精确的掌握学生对于知识的掌握程度;另一个是既然我们已经知道一个学生的当前的知识水平和学习状态,那么这个学生从现在开始应该学习哪些新的知识。
为了提供连续适应性学习,Knewton分析了基于成千上万的数据点的资料,包括概念、结构、不同层次以及媒体格式数据,还采用复杂的计算不断地把每个学生的最有效的数据内容拼接起来,系统通过分析收集的所有学生的效果数据,提炼出推荐结果,用来给每个学生优化学习方法。
(二)Knewton推荐原理基础--采用路径规划技术和学生能力模型保证学生学习的不断进步
Knewton假设没有两个学生是完全一样的,他们以不同的速率学习和忘记,来自不同的教育背景,有着不同的智力程度,注意力范围和学习方式。所以,设计一个对于每一个学生的特点都敏感的实时推荐引擎是一个非常巨大的工程。Knewton是通过采用教育路径规划技术和学生能力高级模型,以保证每个学生都通过课程材料以最大化的学习方式来实现不断的进步。
项目反应理论(Item Response Theory (IRT))
在传统的评分方法中,在一次包含10个测试题的测试中,有两个学生回答对了9道题,那么两个学生的测试分是一致的。但是题目的难易程度没有区分的话,如果第一个学生回答错了一个非常简单的问题,另外一个学生回答错了一个非常困难的问题,这样就暴露出这种评价学生能力的测试方法缺乏针对性。项目反应理论不是假设每个试题都有相同的贡献度来实现对学生能力的掌握,而是通过设定试题难度,级别区分和“猜测性”, 将学生能力与正确回答一个试题的可能性联系起来,从而对学生的能力进行建模,对于每一个学生的每一个试题都提供信息的细微差别的观察,这种测试包含了一个人的潜在特性、能力和试题特征。
概率图形模型(Probabilistic Graphical Models)
Knewton采用的PGMs包含了贝叶斯神经网络和马尔科夫随机场等统计方法,使得数据学家能够在多维空间中通过成百上千的参数分析和操作概率分布。换句话说,PGMs使得Knewton分析师能够建立复杂的效果模型,将众多观测到的学习活动与对系统推荐有用的评估联系起来。Knewton应用PGMs的一种方法是通过使用学生已知的掌握程度来决定他可能已经有能力学习的知识。例如,这样的模型能够帮助平台发现一个学生对于分数达到怎样的掌握程度才能够帮助学生掌握小数,以及对小数怎样的掌握程度能够帮助学生掌握指数。Knewton的数据学家能够决定对于分数的掌握和对于指数的掌握之间的联系。最终,这些类型联系的发现使得Knewton适应性学习平台能够持续地提炼推荐结果。
凝聚层次聚类(Hierarchical Agglomerative Clustering)
在数据挖掘中,层次聚类是一种分析方法,被用来构建类的层次或者结构。在Knewton系统中,这个技术被用来检测大的分组内的潜在结构和建立如何决定学生应该怎样分组以及根据哪些特征将学生分组的算法。Knewton数学准备(Knewton Math Readiness)提供了一个分组面板,使得老师可以对使用相同教材的学生根据学生对概念理解的级别进行分组。
(三)Knewton效果机制:通过推荐理论科学,有效促使符合Knewton适应性能力的规律性知识范围扩大,实用性增强。
Knewton适应性功效通过推荐理论科学,对每一个学习者的学习轨迹进行追踪,高效地将带有规律性的知识范围扩大和实用性增强。Knewton系统将连续适应性的,学生长期学习层级和巨大的网络效果结合起来,建立起一个跨学科的知识图谱,对每一个参加Knewton课程的学生形成一个强大的个性化学习方案。
1、知识图谱将交叉学科知识架构连接起来
Knewton知识图谱是一个权威的学术概念交叉学科图。Knewton知识图谱考虑进了内容设置定义的概念以及这些概念之间的联系,将Knewton课程连接起来。为了完成最终学习目标, Knewton推荐系统专门个性化地引导学生学习,知识图谱基于学生知道什么和学生如何学习来为学习者连接交叉学科。教授的内容越多,或者被加入到系统的每个概念的评价越多,适应性学习体验就变得更加准确。当可视化以后,知识图谱通过课程材料可以向学生提供潜在发展路径的判断。在知识图谱内,由于Knewton是通过课程来定义一个学生的学习路径,多个概念之间有着先决条件的关系。Knewton将知识图谱中的内容定义为“已知”或者“评估”的特殊关系,根据这些决定在既定的时间点应该给学生传送什么样的学习内容。
2、连续性学习系统不断地挖掘学生表现数据
单点适应性学习系统会在一个单独的时间点评估学生的表现,然后从这个时间点决定他将要收到的内容类型,很少或者没有更进一步的个性化数据挖掘。与此不同,Knewton连续适应学习系统不断地挖掘学生表现数据,对于学生在系统中的活动进行实时的分析和反馈。根据一个给定活动的完成结果,系统将指引学生进入下一个活动。例如,当一个学生对于一个特殊的试题组受到困扰的时候,Knewton系统就会知道这个学生的特殊不足,并快速反应哪些内容与这些试题考核的概念相关联,然后给学生推送相关内容让学生增强对于这些概念的掌握。通过这种方法,连续适应性系统每时每刻都能为每个学生提供一个个性化的学习大纲。
3、空间强化不断累积学生能力
一般来讲,所谓强化训练是要求学生在较短时间内学会应用新的概念或方法,直到他们能够熟练应用或者精通。然而,空间强化(也可以理解为分布式强化)是指不仅在教学的过程中新的概念或方法被吸收,同时以往的概念和方法被强化。因为新的材料被不断的增加进知识图谱系统中来并编织成用户熟悉的材料,空间强化强调的是知识在时间上的延伸分布和筛选抽取。空间强化使得Knewton推荐系统能够帮助学生通过不断累积的方式培养学生的能力,并且一旦接触到就能反复学习。
4、记忆力和学习曲线检测学习者的真实能力
Knewton推荐引擎需要将知识遗忘或者遗忘方式加入到系统中来,同时能够检测出类似情况并提供可解决的推荐。受到艾宾浩斯在记忆保持力和学习曲线方面的工作的启发,Knewton数据学家使用了指数增长和衰退曲线、学生学习和忘记的能力曲线,这些曲线建立的前提是一方面每次学生接触的是一个给定主题的内容时,他们会收到关于这个主题的真实能力的一个“突然测试”;另一方面如果他们没有接触其他的主题,他们很有可能会在一段时间后忘记这个主题的内容。Knewton数据学家根据学生在何时以及何种方式接触内容等信息,捕获学生知识增长和减少的方式。最终通过这个过程使得Knewton数据学家能够测试控制学生在课程中的成长路径。
5、学生学习概览让学生更好的审视自己
在Knewton系统中,学生能够获得持续更新的学习概览,包括这个学生学习到的知识以及他如何学习效率最高的信息。这个概览是不断变化的,随着学生在Knewton平台上学习的时间越长,这个概览变得更加的智能。一个学生使用Knewton课程的时间越多,平台对于服务目标学习材料的效率就越高。在这种方式下,Knewton适应性学习平台致力于最小化沮丧、迷惑等不利于学习的感觉,以一种自然的方式培养学生的能力。
6、利用强相关的教育大数据优化适应性结构
在教育领域,大数据展示了强大的创造性,因为教育领域的大数据反映了强认知,这一点与门户网站,社交网络以及电子商务网站等产生的数据在结构上完全不同。因为教育数据具有高度相关性,例如例如对于分数的掌握和对于指数的掌握,这样就为给学生优化的用户体验和切实的价值提供了非常大的可能性。与在线购物相比,为了提升分数或努力改变未来等强烈的学习动机,学生产生的数据具有在线参与时间长和参与程度高等特征,这样就产生了巨量有意义的数据,这些有价值的数据又可以被连续的操作处理,实现每个学生的个性化学习。
Knewton平台已经建立了一个能够处理大量学生数据的基础结构,还设计了一个称作“AltNode”的框架,这个框架通过在计算机之间分割工作量来实现,并在一个最小需求量的计算机之间发送连续更新。所有重大的更新都被存储在分布式的Cassandra数据库中。如果一台机器失效,另外一台附近的机器会取代他的位置,从数据库中恢复最近的数据然后继续工作。AltNode的一个独特的特征是它允许模型从任何状态进行恢复并且对新到来的数据立即作出响应。