News 新闻 4月18日,达观数据科学家团队再添专家,国内知名自然语言处理领军专家、复旦大学计算机教授黄萱菁博士正式受聘为达观数据高级顾问,达观数据在人工智能领域的研发实力又上新台阶,未来在深度学习
连转2篇文章,先上链接,文章转自清华大学刘知远老师的github:https://github.com/zibuyu/research_tao/blob/master/01_community.md,致予我真诚的感谢!
众所周知,参加学术会议是进入学术圈、走进学术前沿的重要方式。在学术会议上,不仅可以集中听取最新的成果报告,还有讲习班、工作坊、社交活动等形式,了解那些不会写到论文中的八卦与动态,结识学术大佬和朋友,走向学术人生巅峰。
地址 https://github.com/zibuyu/research_tao
在自然语言处理(NLP)领域,预训练模型刷榜已经成为行业惯例。目前,面向英文任务的评测基准有 GLUE、SuperGLUE,面向中文任务的有 ChineseGLUE(简称 CLUE)。
前几年曾经马少平老师的引荐,为某科普图书写过一篇短文介绍自然语言处理。如果只是介绍NLP的概念、任务和挑战,应该可以参考这篇小文。原文如下,仅供参考。 自然语言处理 Natural Language Processing 一、什么是自然语言处理 简单地说,自然语言处理(Natural Language Processing,简称NLP)就是用计算机来处理、理解以及运用人类语言(如中文、英文等),它属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。由于自然语言是人类区别于其他动
每天给你送来NLP技术干货! ---- 作者:刘知远老师 链接:https://github.com/zibuyu/research_tao 与老牌学科如物理学、化学等相比,计算机学科还非常年轻,学科体系长期处于剧烈变革之中。作为计算机应用的重要方向,人工智能和自然语言处理自然更不例外,与现实应用紧密相关,技术发展日新月异,常给人今是昨非之感。在这种情况下,传统学术期刊的那种投稿1-2年才能见刊的模式已经赶不上技术革新的速度,年度学术会议显然更符合计算机学科发展和交流的需求,可以看作是一种“小步快跑”的模
文章转自清华大学刘知远老师的github:https://github.com/zibuyu/research_tao/blob/master/00_nlp.md
在全球疫情背景下,国际间的线下学术交流变得十分困难。 这段时间以来,机器之心一直在围绕国际顶级学术会议在国内举办线下活动,促进国内 AI 领域的学术交流。 2020 年底,机器之心举办了 NeurIPS 2020 中国区 MeetUp,报名人数高达 1300 人,受到了国内 AI 社区的极大关注,众多高校、企业积极参与。 2021 年 6 月,机器之心又组织了 CVPR 2021 线下论文分享会,邀请到了虞晶怡(视频致辞)、陶大程、林达华、纪荣嵘、许春景这些业内顶级专家做主题演讲,同时也设置了 12 篇论文
2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 1 历经70载,机器翻译进入 深度学习驱动时代 机器翻译诞生于
👆点击“博文视点Broadview”,获取更多书讯 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经7
任意时间、任意地点、任意语言的自由通讯无时无刻不在改变着人们的思维方式和生活方式 1.语言是思维的载体,是人类交流思想、表达情感最自然、最直接、最方便的工具 2.人类历史上以语言文字形式记载和流传的知识占知识总量的80%以上 3.2008年1月中国互联网络信息中心(CNNIC)发布的《第21次中国互联网络发展状况统计报告》表明,中国互联网上有87.8%的网页内容是文本表示的 4.面对文本大数据,我们面临怎样的机遇和挑战?
国内自然语言处理期刊 现代语言学(汉斯出版社) 汉斯出版社(Hans Publishers, www.hanspub.org) 聚焦于国际开源 (Open Access) 中文期刊的出版发行, 覆盖以下领域: 数学物理、生命科学、化学材料、地球环境、医药卫生、工程技术、信息通讯、人文社科、经济管理等。秉承着传播文化,促进交流的理念,本社将积极探索中文学术期刊国际化道路,并积极推进中国学术思想走向世界。目前,汉斯出版社的所有期刊均被知网(CNKI Scholar)等数据库收录。其中,23本被美国《化学文摘C
自然语言处理可以说是人工智能领域内落地实践最广的技术之一,NLP产品的应用场景颇为广泛,只要有大量文本数据的场景,都可以使用我们的接口做智能分析,以下列举几个经典的使用场景。
自然语言处理在大数据以及近年来大火的人工智能方面都有着非同寻常的意义。那么,什么是自然语言处理呢?在没有接触到大数据这方面的时候,也只是以前在学习计算机方面知识时听说过自然语言处理。书本上对于自然语言处理的定义或者是描述太多专业化。换一个通俗的说法,自然语言处理就是把我们人类的语言通过一些方式或者技术翻译成机器可以读懂的语言。
好几天没有写关于自然语言处理方面的内容,实在抱歉,不过还是感谢大家支持。今天给大家分享一下关于中文自然语言处理的一些基础知识,希望能够帮你快点“入坑”。
人工智能与人类认知世界的维度一致,即主要通过图像、文本和声音三个维度进行感知和交互。图像、文本和声音分别对应计算机视觉CV、自然语言处理NLP、自动语音识别ASR三个重点应用领域
AI 科技评论按:在自然语言处理(NLP)领域工作的学者(学生)可能无人不知 ACL、EMNLP 这样的 NLP 顶会,但国内发起的这个 NLP 国际会议尽管已经举办六届,可能还没有引起所有人的注意。 近期中国计算机学会(CCF)举办的第六届国际自然语言处理及中文计算会议(NLPCC 2017)在大连成功举办。作为国内 NLP 领域首个面向国际的学术大会,NLPCC 无论从会议的形式、参会的人数(500+)、还是报告的质量(录取率21%),都展现出了一副朝气蓬勃的气象,欲有引领中国 NLP 走向国际之势。
2015年,整个IT技术领域发生了许多深刻而又复杂的变化,InfoQ策划了“解读2015”年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行。 2015年,借助移动互联网技术、机器学习领域深度学习技术的发展,以及大数据语料的积累,自然语言处理(Natural Language Processing,简称NLP)技术发生了突飞猛进的变化。越来越多的科技巨头开始看到了这块潜在的“大蛋糕”中蕴藏的价值,通过招兵买马、合作、并购的方式、拓展自己在自然语言处理研究领域的业务
人工智能大模型时代,评测基准成为大模型发展的风向标。从扁平到全面系统,从简化到多重维度,智源指数CUGE旨在尝试为大模型评测设计一张全面评估综合能力的新考卷。
自然语言处理是什么?谁需要学习自然语言处理?自然语言处理在哪些地方应用?相关问题一直困扰着不少初学者。针对这一情况,作者结合教学经验和工程应用编写此书。《自然语言处理理论与实战》讲述自然语言处理相关学科知识和理论基础,并介绍使用这些知识的应用和工具,以及如何在实际环境中使用它们。由于自然语言处理的特殊性,其是一门多学科交叉的学科,初学者难以把握知识的广度和宽度,对侧重点不能全面掌握。《自然语言处理理论与实战》针对以上情况,经过科学调研分析,选择以理论结合实例的方式将内容呈现出来。其中涉及开发工具、Python语言、线性代数、概率论、统计学、语言学等工程上常用的知识介绍,然后介绍自然语言处理的核心理论和案例解析,最后通过几个综合性的例子完成自然语言处理的学习和深入。《自然语言处理理论与实战》旨在帮助读者快速、高效地学习自然语言处理和人工智能技术。
2017年7月31日-8月4日,第55届国际计算语言学年会ACL 2017(Annual Meeting of the Association for Computational Linguistics)在加拿大温哥华召开。在这场计算语言学盛会期间,中国中文信息学会青年工作委员会(CIPSC青工委)和腾讯AI Lab联合举办了“犀牛鸟之夜”活动,邀请黄伟道、宗成庆、薛念文、夏飞、赵东岩、朱晓丹、陈博兴等30余位海内外学者交流学术研究心得,探讨产学合作模式。活动由中科院自动化所刘康老师主持。 首先,CIP
AI 伦理与治理是与 AI 技术、工程同等重要但讨论不多的议题。随着近年来大模型的不断涌现,AI 应用和产品纷纷落地。随之而来,人们对 AI 伦理与治理的关注度日益增加,比如 AI 向善、隐私保护、负责任 AI、AI 系统可信可控。近几个月,ChatGPT 的出现让 AI 伦理与治理研究被提上更紧迫的日程。 其实针对 AI 发展过程中产生的伦理与治理问题,一直都有组织跟进研究并着力提出相应的解决方案。2021 年,未来论坛组织 AI 伦理与治理系列论坛,邀请产学研专家思辨探讨,引发广泛关注。活动精华内容已整
劳动力短缺加重了快餐业者的压力,但一些餐馆正在尝试新的员工来带回得来速的美好时光——人工智能。 多伦多初创公司HuEx正在与一个用于得来速的对话式人工智能助手进行试点测试,以帮助支持加拿大几家连锁店的餐厅订餐服务。 根据美国劳工统计局的数据,长期人手不足的食品服务工作的员工离职率最高。HuEx 的语音服务 - 被称为 AiDA - 正工作于北美流行的快速服务连锁店的开车窗口。 AiDA 在得来速扬声器箱处处理客户的订单请求。在NVIDIA Jetson 边缘 AI 平台上运行的 HuEx 专有模型的驱动下,
NLP(Natural Language Processing)自然语言处理是计算机科学领域以及人工智能领域的一个重要分支,它研究用计算机来处理、理解以及运用人类语言(中文、英文等),达到人与计算机之间进行有效的通讯。
2011年,日本多个机构发起的一项机器人项目,以东京大学入学考试难度为目标,以检验人工智能可在多大程度上模拟人类思考以及解决问题的能力。在去年和今年的考试中,机器人“Torobo-kun”分别获得了511分和525分,总分为950分。照着当前的成绩,Torobo-kun有80%的可能被512所私立大学和23所国立大学和公立大学录取,可惜的是,离东京大学至少获得 80% 分数的要求还差得很远。 根据对比,在两次考试中,Torobo-kun在数学和物理方面有了明显的进步,而英语和国语的成绩还是一团糟。在镁客君看
黄昌宁先生,作为我国自然语言处理领域的先行者之一,在过去近四十年的时间里为我国自然语言处理的发展做出了杰出的贡献。2017 年 11 月,中国计算机学会(CCF)在第六届自然语言处理及中文计算会议(NLPCC 2017)上将首届「杰出贡献奖」授予黄昌宁先生。
5月25日,由达观数据和上海浦东软件园联合主办、张江发布承办的“AI上海创未来,2018长三角人工智能应用创新张江峰会”在浦软大厦如期举行。本次会议主题为“AI上海创未来”,聚集人工智能发展中的领先企
导读:在人类社会中,语言扮演着重要的角色,语言是人类区别于其他动物的根本标志,没有语言,人类的思维无从谈起,沟通交流更是无源之水。
编者按:12月18日,腾讯大数据峰会暨KDD China技术峰会在深圳举行,华为诺亚方舟实验室主任李航博士在会上做了题为《自然语言处理中的深度学习:过去、现在和未来》的演讲,AI科技评论根据现场演讲整
据ACL 2021官网消息,宗成庆研究员将出任第59届国际计算语言学学会学术年会主席。同时,华盛顿大学的夏飞教授(Fei Xia),香港理工大学李文捷(Wenjie Li)教授为程序主席,这意味着2021年8月1日至6日在泰国曼谷召开的自然语言处理顶会ACL-IJCNLP有三位华人面孔在大会委员会的行列。
“ 精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将引进沟通技巧、商业分析、创新思维等定制课程,定期举办线上线下交流活动,全面提升学生综合素质。入选学生还将获得线上实名社群平台“十分精英圈”的在线访问权限,结识志同道合的科研伙伴,获取业界信息及资源。 ” 今年共有10大方向 81个子课题供大家选择 总有一
AI 科技评论按:2019 年 7 月 1 日,清华大学人工智能研究院自然语言处理与社会人文计算研究中心成立仪式暨学术报告与开元成功发布会在清华大学 FIT 楼举行。这是继知识智能研究中心、听觉智能研究中心、基础理论研究中心、智能机器人研究中心、智能人机交互研究中心、智能信息获取研究中心、视觉智能研究中心之后成立的第八个研究中心。清华大学副校长、清华大学人工智能研究院管委会主任尤政院士,清华大学人工智能研究院院长张钹院士出席成立仪式并共同为中心揭牌。清华大学人工智能研究院院长助理朱军教授主持了成立仪式。
推荐Github上一个很棒的中文自然语言处理相关资料的Awesome资源:Awesome-Chinese-NLP ,Github链接地址,点击文末"阅读原文"可直达:
在中文文本中,由于词与词之间没有明显的界限符,如英文中的空格,因此分词是中文自然语言处理的一个基础且重要的步骤。分词的准确性直接影响到后续的语言处理任务,如词性标注、句法分析等。在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符。分词过程就是找到这样分界符的过程。
2018年7月,爱尔兰都柏林城市大学教授、自然语言处理和机器翻译领域专家刘群博士,正式加入华为诺亚方舟实验室,任语音语义首席科学家,主导语音和自然语言处理领域的前沿研究和技术创新。
导读 众所周知,参加学术会议是进入学术圈、走进学术前沿的重要方式。在学术会议上,不仅可以集中听取最新的成果报告,还有讲习班、工作坊、社交活动等形式,了解那些不会写到论文中的八卦与动态,结识学术大佬和朋友,走向学术人生巅峰。 ACL、EMNLP、NAACL、COLING等NLP领域的顶级国际会议,想必大家已经耳熟能详。但是对很多学生(即使国外学生)而言,想参加这些会议也并非易事,由于注册费和差旅费很高,一般要有论文发表导师提供经费支持,而且长途跋涉也充满了签证申请、旅馆预订等不确定因素。作为学生,每年能出去
自然语言处理是人工智能领域研究的核心内容之一,近年来取得了快速进展和广泛应用,在学术界和企业界备受瞩目。
自然语言处理(Natural Language Processing,NLP)是一门融合了计算机科学、人工智能及语言学的交叉学科,它们的关系如下图所示。这门学科研究的是如何通过机器学习等技术,让计算机学会处理人类语言,乃至实现终极目标–理解人类语言或人工智能。
NLPCC 将在 2018 年 8 月 26 日-30 日于内蒙古呼和浩特举行。 📷 CCF 自然语言处理与中文计算国际会议 (NLPCC) 是由中国计算机学会主办的中文信息技术专业委员会年度学术会议,是专注于自然语言处理及中文计算领域的国际会议。会议旨在为来自学术界、工业界和政界的学者和研究者提供一个交流平台,促进学者和研究者分享研究和应用成果及创新思维。 NLPCC 将在 2018 年 8 月 26 日-30 日于内蒙古呼和浩特举行,致力于推动相关领域学术界和工业界研究、创新与应用的发展
上个月携程技术中心主办了一场深度学习Meetup,由来自伦敦大学学院、复旦大学、东南大学、南京大学等高校的学术界代表,以及来自携程、华为、搜狗、简书等一线企业的技术专家们,一起从旅游行业、计算广告、自
作者 | 陈彩娴 编辑丨岑峰1月6日,2021年ACL Fellow名单正式公布! 今年,一共有8位知名的自然语言处理学者入选,其中,华人学者有2位,占了1/4,分别是中国科学院自动化所的宗成庆教授与华为诺亚方舟实验室刘群博士。 根据官网消息,今年两位华人学者的入选理由分别是: 刘群:对机器翻译与中文自然语言处理作出了卓越贡献; 宗成庆:对机器翻译与情感分析的研究作出重大贡献,并不断促进中国自然语言处理的发展。 ACL Fellow计划始于2011年,旨在表彰对自然语言处理领域的科技研究与社区服务作出了杰出
AI 科技评论按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。
SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。
SnowNLP是一个Python库,用于处理中文文本的情感分析、文本分类和关键词提取等自然语言处理任务。它基于概率模型和机器学习算法,具有简单易用的接口和丰富的功能。
本文简绍了SnowNLP的使用方法,这是一个处理中文文本内容的python类库,其主要功能包括分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等等。
人类自诞生以来就伴随着各种信息的生产和获取,如今这个信息爆炸的 DT 时代,人们更是被各种信息所包围。我们知道,人获取信息的方式主要有被动获取和主动获取两种,其中被动获取就是推荐的方式、主动获取就是搜索的方式。 获取信息是人类认知世界、生存发展的刚需,搜索就是最明确的一种方式,其体现的动作就是“出去找”,找食物、找地点等,到了互联网时代,搜索引擎(Search Engine)就是满足找信息这个需求的最好工具,你输入想要找的内容(即在搜索框里输入查询词,或称为 Query),搜索引擎快速的给你最好的结果,
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
在人工智能出现之前,机器智能处理结构化的数据(例如 Excel 里的数据)。但是网络中大部分的数据都是非结构化的,例如:文章、图片、音频、视频…
领取专属 10元无门槛券
手把手带您无忧上云