前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >什么是 NLP (自然语言处理)

什么是 NLP (自然语言处理)

作者头像
叶锦鲤
发布于 2021-04-26 06:36:51
发布于 2021-04-26 06:36:51
1.6K0
举报
文章被收录于专栏:悦思悦读悦思悦读

NLP(自然语言处理)到底是做什么?

NLP 的全称是 Natural Language Processing,翻译成中文称作:自然语言处理。它是计算机和人工智能的一个重要领域。顾名思义,该领域研究如何处理自然语言。

自然语言就是我们人类市场交流所使用的语音和字符系统。就目前而言,NLP所研究的对象,以字符系统——也就是我们通常说的“文字”——为主。

为什么要处理自然语言?

为什么要处理文字呢?因为有需求啊!

我们用文字描述事物、经历和思想。形成的文献资料,除了被阅读,往往还需要进行很多其他操作。

比如,被翻译成其他语种;对内容进行摘要;在其中查找某个问题的答案;或者,了解其中提到了哪些人事物,以及它们之间的关系如何,等等。

虽然所有这些需求,都可以通过人工阅读文献来解决,但“浩如烟海”的文献量导致人工文字处理的产能严重不足。

NLP 的发展历程

上世纪 40 年代计算机被发明,用机器而非人力来处理信息成为可能。早在 1950 年代,自然语言处理就已经成为了计算机科学的一个研究领域。

不过一直到 1980 年代,NLP 系统是以一套复杂的人工订制规则为基础,计算机只是机械地执行这些规则,或者做一些诸如字符匹配,词频统计之类的简单计算。

1980年代末期,机器学习的崛起为 NLP 引入了新的思路。刚性的文字处理人工规则日益被柔性的、以概率为基础的统计模型所替代。

近些年来,随着深度学习的发展,各类神经网络也被引入 NLP 领域,成为了解决问题的技术。

这里要注意了:自然语言处理(NLP)指以计算机为工具解决一系列现实中和自然语言相关的问题,机器学习、深度学习是解决这些问题的具体手段。 当我们关注 NLP 这一领域时,要分清本末,要做的事情是本,做事的方式方法是末。如果神经网络能够解决我们的问题,我们当然应该采用,但并不是只要去解决问题,就一定要用神经网络。

常见的 NLP 任务

NLP 要处理的问题纷繁复杂,而且每一个问题都要结合相应场景和具体需求才好讨论。

不过这些问题也有相当多的共性,基于这些共性,我们将千奇百怪的待解决 NLP 问题抽象为若干任务。

例如:分词、词嵌入、新词发现、拼写提示、词性标注、实体抽取、关系抽取、事件抽取、实体消歧、公指消解、文本分类、机器翻译、自动摘要、阅读理解等等,都是常见的 NLP 任务。

从 NLP 任务到技术实现

针对这些任务,NLP 研究人员探索出了很多方法,这些方法又对应于不同类型的技术。

在工作中,当我们遇到问题的时候,往往需要先将其对应到一个或多个任务,再在该任务的常用实现方法中选取一种适合我们使用的来执行任务。

【举个例子】:我们要基于若干文献构建一个知识图谱,知识图谱的两大核心要素是实体和关系,那么当然首先我们面临的任务就是从这些文献中抽取实体和关系。

实体抽取是一项非常常见的 NLP 任务,实现它的方法有多种,大体而言分为两个方向:

i)基于实体名字典进行字符匹配抽取;

ii)用序列预测模型进行抽取。

序列预测模型又可以选用机器学习模型,比如条件随机场(CRF);或选用神经网络,比如 CRF+LSTM,或 CRF+BERT等。

具体选哪种方法呢?那就要看我们需要抽取的实体类型、文献类型和文献量了。

如果现在是从少量专业文献(例如论文、说明书、研究报告等)中抽取一些列专业名词表示的实体,那么用字典匹配方便直接代价小,可以一试。

如果是要从海量的各类文献中抽取一些通用的实体,那么借助模型则可能效果更佳。

具体用机器学习模型还是神经网络呢?这又和我们拥有的标注数据与计算资源有关,如果不差钱,想标多少数据,想训练多大模型都不在乎,上神经网络自然可以追求高准确率,但如果资源捉襟见肘,可能机器学习模型更加实用。

“众智汇”愿景

尽职尽才,允公允能 —— 本社群不定期举行线上分享,组织群友分享知识、经验、资源,以达到让我们每个人的职业生涯得到最大程度的发展的目的

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智汇AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
从语言学到深度学习NLP,一文概述自然语言处理
本文从两篇论文出发先简要介绍了自然语言处理的基本分类和基本概念,再向读者展示了深度学习中的 NLP。这两篇论文都是很好的综述性入门论文,希望详细了解自然语言处理的读者可以进一步阅读这两篇论文。 首先第一部分介绍了自然语言处理的基本概念,作者将 NLP 分为自然语言理解和自然语言生成,并解释了 NLP 过程的各个层级和应用,这一篇论文很适合读者系统的了解 NLP 的基本概念。 第二描述的是基于深度学习的 NLP,该论文首先描述了深度学习中的词表征,即从 one-hot 编码、词袋模型到词嵌入和 word2ve
小莹莹
2018/04/24
9510
从语言学到深度学习NLP,一文概述自然语言处理
ACL 2019全程回顾:自然语言处理趋势及NLP论文干货解读
本周,在佛罗伦萨举行的ACL 2019上,参会者中有一个人感慨良多,他就是Alexa AI的机器学习科学家Mihail Eric。
新智元
2019/08/09
1.1K0
ACL 2019全程回顾:自然语言处理趋势及NLP论文干货解读
NLP学习路线总结
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究人与计算机之间用自然语言进行有效通信的理论和方法。融语言学、计算机科学、数学等于一体的科学。旨在从文本数据中提取信息。目的是让计算机处理或“理解”自然语言,以执行自动翻译、文本分类和情感分析等。自然语言处理是人工智能中最为困难的问题之一。
全栈程序员站长
2022/11/10
1.3K0
NLP学习路线总结
「自然语言处理(NLP)」 你必须要知道的 “ 十二个国际顶级会议 ” !
 了解科研动态、进行学术研究、发表研究成果最好的方法就是研读国际顶会论文。那么在自然语言处理方向上,有哪些值得关注的国际顶会呢?今天作者给大家整理了12个在NLP领域中,比较有影响的国际顶会。它们分别是:AAAI、ACL、ICLR、NeurIPS、ICML、COLING、EMNLP、IJCAI、EACL、NAACL、CoNLL、NLPCC。部分会议作者之前单独整理过也有论文列表下载,如有错误的地方欢迎批评指正。
ShuYini
2022/12/06
12.8K0
NLP(自然语言处理)扫盲
最近在学NLP,给自己扫扫盲,看看NLP具体干什么,本文先学学概念,后面再深入。(不是很深入的文章,高手误入。) 自然语言处理(简称NLP),是研究计算机处理人类语言的一门技术,是人工智能(AI)的一个子领域,包括: 1.句法语义分析:对于给定的句子,进行分词、词性标记、命名实体识别和链接、句法分析、语义角色识别和多义词消歧。 2.信息抽取:从给定文本中抽取重要的信息,比如,时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什
大数据和云计算技术
2018/03/08
1.6K0
自然语言处理(NLP)学习路线总结
NLP是自然语言处理(Natural Language Processing)的缩写,它是计算机科学领域中专注于研究如何使计算机理解、生成和处理人类语言的学科。NLP涉及的技术包括但不限于分词、词性标注、句法分析、语义分析、机器翻译、情感分析、信息抽取、文本生成等。通过NLP,计算机可以处理和分析大量的文本数据,帮助人们更好地理解和应用语言信息。
机器学习AI算法工程
2024/07/04
1.1K0
自然语言处理(NLP)学习路线总结
吾爱NLP(1)--我与自然语言处理
文字只是信息的载体,而非信息本身,那么不用文字,而用其它的载体(比如word2vec形式的词向量)是否一样可以储存同样意义的信息呢?这个答案是肯定的,这也是现在通信技术的基础,如果想让计算机来处理我们的人类语言、文本数据,首要的就是换一种数据的载体(表示形式)---数值化。
流川枫
2018/09/12
1.1K0
吾爱NLP(1)--我与自然语言处理
自然语言处理(NLP)技术的详细介绍
自然语言处理(Natural Language Processing,简称NLP)是人工智能(Artificial Intelligence,简称AI)领域的一个重要分支,旨在让计算机能够理解、理解和生成人类语言。
正在走向自律
2024/12/18
1.7K0
自然语言处理(NLP)技术的详细介绍
为什么要处理自然语言? | NLP基础
自然语言处理,英文是Natrual Language Processing,简写为NLP,原本是计算机科学领域的一个研究方向。
叶锦鲤
2019/11/29
1.2K0
为什么要处理自然语言? | NLP基础
自然语言处理-NLP
自然语言处理(Natural Language Processing,简称NLP)被誉为人工智能皇冠上的明珠,是计算机科学和人工智能领域的一个重要方向。
zhangjiqun
2024/12/14
2380
自然语言处理-NLP
自然语言处理在金融实时事件监测和财务快讯中的应用
疫情之下,全球金融市场进入大波动时代,各国金融调控政策、突发事件层出不穷,例如美联储无限量QE、欧央行7500亿复苏基金、中美关闭使领馆、阿塞拜疆和亚美尼亚爆发空战...如何24*7小时全天候自动、智能监控全球新闻事件,从而最快速地做出反应、最大可能地规避风险?
zenRRan
2020/08/11
3.6K0
自然语言处理在金融实时事件监测和财务快讯中的应用
人工智能难点之——自然语言处理
写在前面 如果单从NLP缩写包含很多方面: 有数学的非线性规划(Non-linear programming) 医学的无光感(No light perception) 心理学的神经语音规划(Neuro-linguistic programming) 计算机科学与语言学转换的领域(natural language processing) 这里指的是计算机科学与语言学转换的领域。(NLP)是人工智能和语言学领域的分支学科。(人工智能主要包含以下几个方面:自动推理-计算语言学-计算机视觉-进化计算-专家系统-自然
企鹅号小编
2018/01/10
2K0
人工智能难点之——自然语言处理
NLP01(自然语言处理)第一章 绪论
任意时间、任意地点、任意语言的自由通讯无时无刻不在改变着人们的思维方式和生活方式 1.语言是思维的载体,是人类交流思想、表达情感最自然、最直接、最方便的工具 2.人类历史上以语言文字形式记载和流传的知识占知识总量的80%以上 3.2008年1月中国互联网络信息中心(CNNIC)发布的《第21次中国互联网络发展状况统计报告》表明,中国互联网上有87.8%的网页内容是文本表示的 4.面对文本大数据,我们面临怎样的机遇和挑战?
种花家的奋斗兔
2020/11/13
5910
NLP01(自然语言处理)第一章 绪论
《NLP》你真的了解”自然语言处理(NLP)“吗?
上一周,清华大学AMiner发布了《2018自然语言处理研究报告》(下载地址:https://pan.baidu.com/s/1IXuZLgGVHjfYyyX63jcVHQ),因为时间原因,没能及时的更新,希望大家见谅。现在作者以初学者的态度整理了一下该报告的主要内容,希望能帮助大家。
ShuYini
2019/08/08
1.4K0
《NLP》你真的了解”自然语言处理(NLP)“吗?
好文推荐 | 自然语言处理简介
文章转自清华大学刘知远老师的github:https://github.com/zibuyu/research_tao/blob/master/00_nlp.md
UM_CC
2022/09/22
1.2K0
好文推荐 | 自然语言处理简介
NLP自然语言处理的发展:从初创到人工智能的里程碑
随着深度学习和大数据技术的进步,自然语言处理取得了显著的进步。人们正在研究如何使计算机更好地理解和生成人类语言,以及如何应用NLP技术改善搜索引擎、语音助手、机器翻译等领域。
鲲志说
2025/04/07
1710
NLP自然语言处理的发展:从初创到人工智能的里程碑
自然语言处理(NLP)的一般处理流程!
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
mantch
2019/08/29
3.1K0
自然语言处理(NLP)的一般处理流程!
[自然语言处理|NLP] 命名实体识别(NER)
自然语言处理(NLP)领域中的命名实体识别(NER)是一项关键任务,旨在从文本中提取具有特定意义的实体,如人名、地名、组织机构、日期等。这项技术在信息提取、问答系统、机器翻译等应用中扮演着重要角色。本文将深入探讨NER的定义、工作原理、应用场景,并提供一个基于Python和spaCy库的简单示例代码。
数字扫地僧
2023/11/10
2.8K0
自然语言处理顶级会议 EMNLP 最佳论文出炉,聚焦神经网络 (下载)
【新智元导读】自然语言处理顶级会议 EMNLP2016 今天公布了本届大会最佳论文。本文介绍会议概况,节选主旨演讲、讲座及Workshop 等亮点介绍,最后给出最佳论文。 2016 年自然语言处理(NLP)领域的顶级会议——自然语言处理实证方法大会(Empirical Methods in Natural Language Processing,EMNLP)将于11月 1 日至 5 日在美国德克萨斯州奥斯汀市举行。今年网上报名时间10月22日截止,因此本届大会参会人数暂时还无法确定。不过,去年和前年的 EM
新智元
2018/03/26
1.1K0
自然语言处理顶级会议 EMNLP 最佳论文出炉,聚焦神经网络 (下载)
自然语言处理历史史诗:NLP的范式演变与Python全实现
自然语言处理(Natural Language Processing,简称NLP)是一个跨学科的领域,它主要关注如何使计算机能够理解、生成和与人类使用的自然语言进行有效交流。NLP不仅是实现人与计算机之间更紧密合作的关键技术,而且也是探究人类语言和思维复杂性的一种途径。
TechLead
2023/10/21
1.5K0
自然语言处理历史史诗:NLP的范式演变与Python全实现
推荐阅读
相关推荐
从语言学到深度学习NLP,一文概述自然语言处理
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档