教育是最传统和复杂的社会活动,如何使用AI(机器学习)技术改造和促进人类自身学习(提高学习效率和学习效果) ,是互联网教育大数据及挖掘的基本问题;简单介绍AI 技术应用沪江各个产品线(核心包括辅助学生“个性化”学习和辅助教师教学工作)的情况,重点分享:使用DM、ML技术结合RM(Retention Model)、IRT(Item Response Theory)、DKT(Deep Knowledge Tracing)等模型在开心词场中应用实践和认识。
关于教育及互联网教育
教育是最传统、最复杂、涉及面广的社会活动,而学习是痛苦的,人类都是不爱学习但是渴望成长。
互联网教育的特点是低频、高交互。我们的使命就是使用机器学习技术改造和促进人类自身学习,让学习更快乐,提高学习效率和学习效果。
机器学习在沪江网的应用
机器学习在沪江网应用主要四个维度出发:老师(网师)、学生者、内容、工具,进行构建四大应用场景:
自适应学习、人机交互、教学过程监控、内容加工。
网师
机器学习可以在大数据基础上帮助网师全方位洞察学生者、洞察自己,以及洞察整个市场。
洞察学生是要知道所有学习该课程的学生的学习情况如何,了解每个细节知识点的掌握程度。
洞察自己是发现网师在讲课过程中哪些知识点、流程或节点会使大家在理解上有问题,并辅助网师对课件进行修改。
洞察市场是概括地从整个大方向来说,哪些课程会比较热门。
随着人工智能在教育及互联网教育上逐步应用和发展,老师(网师)角色也在改变,逐步从“知识传递”的角色转移“能力培养”和“品德培养”。
学习者
自适应学习分为智能导学服务和智能学习助手。智能导学是把一门课拆分成不同的知识块,给每个人提供不同的合理学习路径。智能学习助手就是重新定义老师和机器的定位,将老师的一些重复性工作交给机器来完成。
我们在丰富的大数据基础上,充分利用数据分析、挖掘和机器学习技术,根据学习者详尽学习轨迹数据从学习需求、学习意愿、学习能力、经济能力、学习毅力等维度构建用户模型。
在学习过程(学习系统)中做一些高交互的改进,优化课件的内容和设计,在题库等内容库上推荐题目和学习资料,在考试过程中提供合理的评测周期,带来丰富多样的学习体验。
内容
教育场景中存在老师、学生、教学辅助人员等多种⻆色。⻆色互动时会产生大量数据,包括并不限于文本、图片、音频、视频、用户行为等内容形态。传统教学中,除了少部分能被老师感知的部分,大量数据都没有得到利用。
充分地对数据进行收集,并构建一种面向教育行业的标签体系;一方面,将这些数据沉淀为结构化的知识,让他们具备教学价值;另一方面,在不同的应⽤场景,这些数据也能对商业化提供帮助。
标签及度量体系:教育场景存在大量维度,通过数据挖掘和机器学习,对内容进行打标,输出对应标签及相关性、相关度量指数。
构建各学科、各层次知识图谱,题库及资料库。所有课件、知识点的内容都会关联到知识图谱上。在知识图谱上我们可以做很多工作,比如一个知识点掌握得不好,可以通过知识图谱进行分析关联。
为加速内容的产品化和助推内容商品化提供一些开源的数据、算法支撑。
工具
机器学习在工具线应用主要包括以下三方面:
通过开放接口与教学场景深度融合;
开放用户行为感知和数据分析;
应用智能云服务。
通过数据和机器学习技术构建学、练、测等全流程的智能化、个性化的工具。
机器学习在开心词场中应用
开心词场是沪江旗下的背词练习工具,通过学习、测试、复习的游戏闯关模式,掌握词汇,更添学习乐趣。机器学习在开心词场中应用主要介绍两个模块:基于IRT模型的自适应词汇量测试和基于记忆模型的个性化闯关路径。
基于IRT模型的自适应词汇量测试:基于IRT模型最少用户交互准确评估用户的词汇量,在自适应词汇量测试的基础上,推荐一些合理的词书。
基于记忆模型的个性化闯关路径:在背单词的过程中,根据每个人的记忆特点计算记忆曲线,利用这个记忆曲线来安排合理的关卡。
基于IRT模型的自适应词汇量测试
静态考卷:每个人所做的题目相同,学生在肯定会做的容易题和肯定不会做的难题上浪费较多时间,影响用户体验。
动态交互式测试:每个学生所做的题目不同,下一道题目根据历史做题的反馈动态改变。算法可以聚焦于算法不确定的题目,请学生回答,从而避免在肯定会做和肯定不会做的题目上浪费太多时间。
IRT (Item Response Theory)
人能力越高,答对概率越大;
词难度越高,答对概率越小,曲线越靠右;
人能力=词难度, 则答对概率0.5。
如何选下一个词?
选难度和当前能力估计最接近的,且用户没有回答过的词。对于该词,P(答对|词难度,人能力)~0.5,即最不确定,从而避免两种可能浪费时间的词。
可以改进的方向
如果存在多个学习路径,可以使用混合IRT。
使用深度神经网络,可以很好的解释现有的数据。
推题策略的改进就是使用MDP。
基于记忆模型的个性化闯关路径
基于记忆模型的个性化闯关路径:在背单词的过程中,根据每个人的记忆特点计算记忆曲线,利用这个记忆曲线来安排合理的关卡。基于记忆模型的个性化闯关路径的算法模型经历三个主要阶段:艾宾浩斯记忆曲线、间隔效应、Act-R;接下来正实施MCM模型。第一段(艾宾浩斯记忆曲线):主要构建群体艾宾浩斯记忆曲线及每个学习者的个性化记忆曲线;第二阶段考虑间隔效应进行构建曲线模型;第三阶段基于Act-R算法建模。
艾宾浩斯记忆曲线→间隔效应→Act-R→MCM
概率随着时间指数衰减:
其中m,h,f是常数,分别解释为初始学习的程度(0<m<1),时间的缩放因子(h>0),以及记忆的衰减指数(f>0)
艾宾浩斯记忆曲线:y=1-0.56x^0.06
多次学习对记忆的影响:间隔效应(Spacing effect)两次学习的间隔记作ISI(intersession interval),第二次学习和最后的测验的时间记作RI(retention interval)。
Act-R
ACT-R假设每次学习会有不同的记忆概率轨迹,而且记忆概率随着时间的增长成幂函数衰减:tk,dk指的是第k条轨迹的记忆时间和衰减指数,β是和学生或者记忆事物有关的影响记忆强度的参数。bk指的是每条记忆轨迹的显著性,这个数越大表示一次学习的效果越好。
轨迹的衰减和学习发生的时间点有关:这里c和α是常数,如果第k次学习和前一次的间隔比较短,会导致当前的一条衰减的比较快。
回忆的概率和记忆活性m单调相关:其中和是相应的参数。整个模型有6个自由的参数。
MCM提出了一个假设,每次新的学习学到的东西是分别存储在不同的轨迹中,而且会按照不同的速率衰减。虽然每条迹会指数衰减,这些轨迹的和随着时间的衰减是一个幂函数,丼例来说,第i条轨迹,xi的衰减如下面公式所示:
其中是衰减时间常数,而且后续的轨迹具有比较小的衰减时间常数,轨迹1-k使用了一个加权平均,最后合成了一个总的轨迹强度。
其中
。yi是一个权重因子,代表了第i条轨迹的贡献,在总共k条轨迹中,记忆的概率是其中的最小值:
间隔效应发生的主要原因是轨迹的更新规则(Staddon et al.,2002)。一条轨迹只有在其它轨迹无法保持对材料的记忆的时候才会更新。这个规则影响了信息在不同发生频率和不同环境下的记忆效果。当一个材料被学习的时候,第i条轨迹贡献的上升和前面轨迹的总强度负相关:
我今天的分享就到这里,谢谢大家!