Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >大数据和人工智能是怎样在教育行业发挥作用的?

大数据和人工智能是怎样在教育行业发挥作用的?

原创
作者头像
用户6287968
修改于 2019-09-29 02:42:07
修改于 2019-09-29 02:42:07
1K0
举报
文章被收录于专栏:NLPIRNLPIR

大数据、自然语言理解、人工智能在现今科技创新的时代已成为各行各业的热门词汇,教育领域当然也不例外。2018年1月,教育部将人工智能、物联网、大数据处理正式划入全国高中新课标。正在热议的两会,多位全国政协委员热议人工智能与教育:加快培养人工智能化人才,人工智能助力个性化学习,人工智能辅助教师工作(决策、教育、教学)等。

大数据、人工智能技术如何真正服务教育领域?

《红楼梦》作者前后同一性识别

近期,新版《红楼梦》作者署名改动为:(前八十回)曹雪芹著,(后四十回)无名氏续,引发学界广泛的关注与讨论。红学界关于《红楼梦》的作者争议一直很大,前八十回和后四十回到底是不是同一个作者?红学研究者们经过多年的史料研究至今也没有定论。事实上,学术界多有此类作者判别之争议与难题,本文将利用大数据语义智能分析技术,通过分词、语言统计、概率计算与文本相似度分析来进行《红楼梦》前后作者同一性判别。

虚词统计

每位作者都有自己独特的写作小习惯,比如使用虚词的顺序与数量会存在着差异,这就是我们研究的切入点。我们根据1987李贤平发表的《〈红楼梦〉成书新说》一书中选择的四十七个虚字,将《红楼梦》120回均分为3组(第1回-第40回、第41回-第80回、第81-第120回),使用NLPIR-paser统计出文言虚词的词频与概率,三组数据中部分虚词统计结果如下:

表1 虚词统计

KL距离

KL距离(相对熵),它衡量的是相同事件空间里的两个概率分布的差异情况。当两个随机分布相同时,它们的相对熵为零,当两个随机分布的差别增大时,它们的相对熵也会增大,所以相对熵可以用于比较文本的相似度。

表2  KL距离分析

回数KL值回数

1-40

41-80

81-120

1-40

0

0.008

0.082

41-80

0.007

0

0.06

81-120

0.051

0.049

0

分析结果显示:前两组任意一组与第三组的KL值都是前两组组内KL值的近十倍,也就是说前八十回两组数据与第三组的差别比前两组组内差别大的多,即前八十回文本相似度较高,与后四十回文本差异较大。

我们还将红楼梦120回分别分为六组、十二组数据分别进行分析,不仅分析前八十回与后四十回的差异,还分析了前八十回与后四十回组内的差异,通过反复的推敲得出前八十回与后四十回的写作风格存在明显差异。故可以大胆猜测红楼梦前后作者并非同一人。

关于教育,我们能做的还有很多…

人工智能的教育应用场景

知识传播

大数据不仅是一种技术,还是实实在在的硬学问,有系统的理论与方法,所以必须增加这门知识学问的传播力度,尤其不能仅局限于理论的课堂,教学、科研、实践必须并重地扎根于具体应用场景中才有意义。人工智能人才产教融合才能满足市场对人工智能专业技术人才的大量需求。

教育管理

首先,教育管理工作会面临海量文档的管理与分析,论文类、报告类、统计类等。比如论文管理:文章分类,文档查重、相似度分析,精准检索等功能需求,自然语言理解正是文档处理的专家,基于自然语言处理技术的平台完全可以成为文档管理与分析的得力助手。其次,教育机构,尤其是高校因其高等教育属性,公众有特别期待,舆情管理的需求更加迫切。近期网红教授薛兆丰北大离职事件引起热议,我们完全可以利用大数据挖掘分析技术实现舆情管理与分析的各个功能需求:热点发现、话题追踪、负面信息倾向性分析、舆情搜索、自动报告等。

教、学、科研

我们在教、学、科研的过程中都会面临许多需求,比如查找文献,了解学术研究的热点与趋势,文本内容处理(分词、翻译、分类聚类、作者、摘要、关键词的自动提取与自动摘要)等,尤其是语言类、管理类、计算机类或需要处理大量文本的专业,自然语言理解将成为一大利器。另一方面,知识的领域庞大而深奥,知识图谱技术可以历史文献、动态快报、活动会议、项目课题、期刊杂志、专家作者等多个维度整合知识体系,挖掘知识关联关系,构建一个便于管理与分析的知识图书馆。

人工智能教育应用的核心:自然语言理解

NLPIR大数据语义智能分析平台针对大数据内容采编挖搜的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的最新研究成果,先后历时十八年,服务了全球四十万家机构用户,是大数据时代语义智能分析的一大利器。

NLPIR大数据语义智能分析平台十三大功能:

NLPIR大数据语义智能分析平台客户端。欢迎大家下载使用。

NLPIR大数据语义智能分析平台白皮书: http://www.nlpir.org/NLPIR-Parser-WhitePaper.pdf (约3MB)

NLPIR大数据语义智能分析平台:

http://www.nlpir.org/NLPIR-Parser.zip (约160MB)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
NLPIR中文数据挖掘帮助企业执行最佳商业决策
随着计算机在生活中的应用逐渐增加,网络技术和通信技术在企业运营所占比重也在增加。这些都使得企业在运营过程中会产生大量的数据,而如何规划和分析这些数据,对于企业的长期发展也十分重要。
用户6287968
2019/09/24
8230
NLPIR中文数据挖掘帮助企业执行最佳商业决策
智能决策:人工智能+大数据
本文介绍了人工智能决策系统的发展背景,分析了传统决策系统的痛点,并重点介绍了基于人工智能和大数据技术的智能决策系统的架构设计和实现。该系统可以为各行业提供智能化、精准化、个性化的决策支持,具有广泛的应用前景。
人工智能的秘密
2017/12/21
5.6K0
智能决策:人工智能+大数据
数据驱动智能,智能优化数据——大数据与人工智能的双向赋能
在数字化浪潮席卷全球的今天,大数据和人工智能(AI)已成为推动技术创新和产业升级的核心动力。这两者之间的关系并非简单的单向依赖,而是一种深度协同、相互赋能的关系。大数据为人工智能提供了养料,而人工智能则为大数据的处理与应用带来了革新。
Echo_Wish
2025/04/21
1360
数据驱动智能,智能优化数据——大数据与人工智能的双向赋能
AI 插手!用文本分析鉴定《红楼梦》《亨利八世》实际作者
导读:《红楼梦》、《亨利八世》都是经典的文学名著,许多历史和研究都暗示这些名著有不止一位作者,但文学界对此众说纷纭无法给出定论。而最近,基于人工智能和数据科学的研究发现,则是从数据分析的维度上,去区分一部作品的具体作者。
IT阅读排行榜
2019/12/10
1.5K0
AI 插手!用文本分析鉴定《红楼梦》《亨利八世》实际作者
客户画像中的聚类分析
实际工作中,最常使用的当属回归类模型,其次便是客户画像。即便是评分模型也会涉及到客户画像,由于首富客户的违约特征与普通百姓不同,故需进行区分,信用分池即为客户画像。
许卉
2019/07/15
1.7K0
客户画像中的聚类分析
R语言《红楼梦》文本挖掘:词频统计、词云可视化及前后对比分析
作为中国古典文学的瑰宝,《红楼梦》具有极高的文学价值和丰富的主题内涵(点击文末“阅读原文”获取完整代码数据)。
拓端
2023/11/22
7640
R语言《红楼梦》文本挖掘:词频统计、词云可视化及前后对比分析
我们精选出十篇数据干货,助你圆满收官2017!
回顾2017,始终紧跟历史进程的DT君,带大家用数据视角探索世界:从人工智能到共享经济,从影视热点到古典文学,我们探索过新零售的“门店秘密”,也挖掘过城市空间的“可视化创新”;我们讨论过科技圈最前沿的算法,也揭示过潜藏在人际关系数据中的社会价值……今天DT君精选出年度十篇数据侠好文回馈各位新老粉丝,祝你们携满干货跨入2018年。
DT数据侠
2018/08/08
3530
我们精选出十篇数据干货,助你圆满收官2017!
干货 ▏用机器学习的方法鉴别红楼梦作者
在学界一般认为,《红楼梦》后 40 回并非曹雪芹所著。本文尝试应用机器学习的方法来分析原著文本中作者的用词习惯,从技术角度去说明《红楼梦》前 80 回和后 40 回的写作风格差别,继而可以确认后 40 回非原作者所写。
IT阅读排行榜
2018/08/14
5210
干货  ▏用机器学习的方法鉴别红楼梦作者
红楼梦、法律,BERT 已有如此多的神奇应用
2019 年 5 月 ACM 图灵大会上,朱松纯教授(加州大学洛杉矶分校)与沈向洋博士(微软全球执行副总裁)在谈到「人工智能时代的道路选择」这个话题时,沈向洋博士认为人工智能发展在工业界将会迎来黄金十年,而朱松纯教授也表示人工智能的发展趋势将会走向大一统,从小任务走向大任务,从 AI 六大学科走向统一。
机器之心
2019/07/19
1K0
红楼梦、法律,BERT 已有如此多的神奇应用
用Python分析《红楼梦》:见证了贾府的兴衰,你是否还能“笑道”世事无常
本文通过分析《红楼梦》的章回和词汇,使用聚类算法来发现贾府的兴衰变化。通过对比前后文,发现“笑道”这个词在全文中的权重变化,从贾府的鼎盛时期到衰败时期,体现出人物和贾府的命运变化。同时,通过分析“笑道”这个词在全文中的出现频率,可以发现贾府的兴衰与人物命运的变化具有密切的联系。
企鹅号小编
2018/01/04
1.1K0
用Python分析《红楼梦》:见证了贾府的兴衰,你是否还能“笑道”世事无常
NLP小白入门篇:莫愁前路,一文读懂语料预处理
机器能跟人类交流吗?能像人类一样理解文本吗?这是大家对人工智能最初的想象。如今,NLP 技术可以充当人类和机器之间沟通的桥梁。环顾周围的生活,我们随时可以享受到 NLP 技术带来的便利,语音识别、机器翻译、问答系统等等。
机器之心
2020/08/04
5920
职场人涨薪30%的秘诀,看完这篇你就明白了
如果有人问:未来十年最值钱的技能是什么?数据思维能力一定名列前茅! 不知道大家有没有发现,在近几年的招聘中,不少岗位都要求具备数据思维处理问题的能力。拥有此能力的职场人薪资往往比同岗位高出30%,而且在面试过程中更容易受到面试官的欣赏。 在各大招聘网站中,我们很容易就可以看到与数据思维处理问题能力相关的岗位,薪资极具竞争力。可以这么说,如果你具备数据思维处理问题的能力,加上一些过往的工作经验,你将获得相当丰厚的待遇。 向左滑动查看更多 现在扫码进群或点击文末阅读原文,即可获得
博文视点Broadview
2023/05/06
1570
职场人涨薪30%的秘诀,看完这篇你就明白了
【CDAS 2017】大数据与人工智能分论坛:大数据驱动人工智能
作者 CDA 数据分析师 前言 2017年7月29日,由CDA数据分析师主办,以“跨界互联 数据未来”为主题的CDAS 2017第四届中国数据分析师行业峰会在北京中国大饭店隆重举行。 7月29日当天,除了引人眼球的主会场以外,当天同步开放11个分论坛,我们将逐一推送每个分论坛的盛况,以及演讲嘉宾速记稿整理,给每一个CDA成员奉上干货。 2017年CDAS第4届中国数据分析师行业峰会大数据与人工智能分论坛中,来自IBM、猎聘网、智众互动、智库等6位专家与资深行业领军人物分享了大数据时代,大数据如和驱动
CDA数据分析师
2018/02/26
8380
【CDAS 2017】大数据与人工智能分论坛:大数据驱动人工智能
数据大帝国:大数据与人工智能的巅峰融合
随着科技的迅猛发展,大数据和人工智能(AI)已经成为当今科技领域的两大热门话题。它们不仅在各自领域内取得了重大突破,还在不断地交汇和融合,开创了数据大帝国的时代。本文将深入探讨大数据和人工智能的融合,分析其在不同领域中的应用,以及这一趋势对未来的影响。
IT_陈寒
2023/12/13
1.2K0
数据大帝国:大数据与人工智能的巅峰融合
自然语言处理概述
自然语言处理(Natural Language Processing,NLP)是计算机科学、人工智能和语言学的交叉学科,其范畴广泛,比如:语音合成、分词、词法分析、问答系统、机器翻译、情感分析等等。
老齐
2022/12/09
3.4K0
大数据搜索与挖掘:知著-见微-晓意【大数据100分】
主讲嘉宾:张华平 主持人:中关村大数据产业联盟 副秘书长 林春雨 承办:中关村大数据产业联盟 嘉宾简介:张华平博士,副教授,北京理工大学大数据搜索与挖掘实验室主任,研究生导师,知名汉语分词系统ICTCLAS的创始人,中国计算机学会YOCSEF委员及普及工委委员,中国中文信息学会社会媒体处理专业委员会常务委员,首都师范大学,辽宁师范大学客座教授,北京市重点产业知识产权联盟专家、同时担任《计算机学报》、《计算机研究与发展》、中国科技论文在线等杂志的特邀评审专家。研究方向为:大数据搜索与挖掘、自然语言处理、社交
大数据文摘
2018/05/21
7670
【数据挖掘】数据挖掘与生活:算法分类和应用
“如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘(Data Mining)的知识,你,或许会有柳暗花明的感觉。 的确,数据挖掘无处不在。它和生活密不可分,就像空气一样,弥漫在你的周围。但是,很多时候,你并不能意识到它。因此,它是陌生的,也是熟悉的。 本文,主要想简单介绍下数据挖掘中的算法,
陆勤_数据人网
2018/02/26
1.7K0
【数据挖掘】数据挖掘与生活:算法分类和应用
用 Python 分析《红楼梦》(1)
專 欄 ❈楼宇,Python中文社区专栏作者。一位正在海外苦苦求学的本科生。初中时自学编程,后来又在几位良师的帮助下走上了计算机科学的道路。曾经的 OIer,现暂时弃坑。兴趣不定,从机器学习、文本挖掘到文字识别以及各种杂七杂八的知识都有一点点涉猎。同时也对物理学有相当大的兴趣。 知乎:https://www.zhihu.com/people/lou-yu-54-62/posts GitHub:https://github.com/LouYu2015❈ 1 前言 两个月以来,我通过互联网自学了一些文本处理的
Python中文社区
2018/02/01
2.1K0
用 Python 分析《红楼梦》(1)
用Python分析红楼梦,见证贾府的兴衰
在上一篇文章,我们借用jieba分词工具,提取了《红楼梦》120回中的出现次数较高的词,然后用词云工具将结果画了出来。
HuangWeiAI
2019/08/15
1.6K0
数据挖掘与生活:算法分类和应用
“如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘(Data Mining)的知识,你,或许会有柳暗花明的感觉。 的确,数据挖掘无处不在。它和生活密不可分,就像空气一样,弥漫在你的周围。但是,很多时候,你并不能意识到它。因此,它是陌生的,也是熟悉的。 本文,主要想简单介绍下数据挖掘中的算法,
小莹莹
2018/04/20
2.6K0
数据挖掘与生活:算法分类和应用
推荐阅读
相关推荐
NLPIR中文数据挖掘帮助企业执行最佳商业决策
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档