2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 1 历经70载,机器翻译进入 深度学习驱动时代 机器翻译诞生于
在自然语言处理(NLP)领域,预训练模型刷榜已经成为行业惯例。目前,面向英文任务的评测基准有 GLUE、SuperGLUE,面向中文任务的有 ChineseGLUE(简称 CLUE)。
众所周知,参加学术会议是进入学术圈、走进学术前沿的重要方式。在学术会议上,不仅可以集中听取最新的成果报告,还有讲习班、工作坊、社交活动等形式,了解那些不会写到论文中的八卦与动态,结识学术大佬和朋友,走向学术人生巅峰。
👆点击“博文视点Broadview”,获取更多书讯 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经7
News 新闻 4月18日,达观数据科学家团队再添专家,国内知名自然语言处理领军专家、复旦大学计算机教授黄萱菁博士正式受聘为达观数据高级顾问,达观数据在人工智能领域的研发实力又上新台阶,未来在深度学习
在全球疫情背景下,国际间的线下学术交流变得十分困难。 这段时间以来,机器之心一直在围绕国际顶级学术会议在国内举办线下活动,促进国内 AI 领域的学术交流。 2020 年底,机器之心举办了 NeurIPS 2020 中国区 MeetUp,报名人数高达 1300 人,受到了国内 AI 社区的极大关注,众多高校、企业积极参与。 2021 年 6 月,机器之心又组织了 CVPR 2021 线下论文分享会,邀请到了虞晶怡(视频致辞)、陶大程、林达华、纪荣嵘、许春景这些业内顶级专家做主题演讲,同时也设置了 12 篇论文
自从2014年GAN对抗性生成网络出现,人工智能进入了图像合成的全新时代。最先进的GAN可以生成高分辨率,逼真的彩色图像,我们几乎无法与真实的照片区分开。AI不止步于视觉内容的生成,近年来自然语言处理NLP和自然语言生成NLG的发展,使得文案生成也成为可能。AI可以针对特定受众量身定制,生成品牌独特的营销信息。
地址 https://github.com/zibuyu/research_tao
每天给你送来NLP技术干货! ---- 实验室窗外 上海人工智能实验室是我国人工智能领域新型科研机构,开展战略性、原创性、前瞻性的科学研究与技术攻关,目标建成国际一流的人工智能实验室,成为享誉全球的人工智能原创理论和技术的策源地。 实验室网址: www.shlab.org.cn 研究方向 人工智能基础理论、人工智能基础软件和基础硬件系统、人工智能核心技术、人工智能开放平台、人工智能应用、人工智能伦理与政策 我们的优势 全球顶尖的AI科研团队 由汤晓鸥、姚期智、陈杰领衔,通过全职、全时双聘等灵活合作方式,
连转2篇文章,先上链接,文章转自清华大学刘知远老师的github:https://github.com/zibuyu/research_tao/blob/master/01_community.md,致予我真诚的感谢!
作者 | 陈彩娴 编辑丨岑峰1月6日,2021年ACL Fellow名单正式公布! 今年,一共有8位知名的自然语言处理学者入选,其中,华人学者有2位,占了1/4,分别是中国科学院自动化所的宗成庆教授与华为诺亚方舟实验室刘群博士。 根据官网消息,今年两位华人学者的入选理由分别是: 刘群:对机器翻译与中文自然语言处理作出了卓越贡献; 宗成庆:对机器翻译与情感分析的研究作出重大贡献,并不断促进中国自然语言处理的发展。 ACL Fellow计划始于2011年,旨在表彰对自然语言处理领域的科技研究与社区服务作出了杰出
前几年曾经马少平老师的引荐,为某科普图书写过一篇短文介绍自然语言处理。如果只是介绍NLP的概念、任务和挑战,应该可以参考这篇小文。原文如下,仅供参考。 自然语言处理 Natural Language Processing 一、什么是自然语言处理 简单地说,自然语言处理(Natural Language Processing,简称NLP)就是用计算机来处理、理解以及运用人类语言(如中文、英文等),它属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。由于自然语言是人类区别于其他动
每天给你送来NLP技术干货! ---- 作者:刘知远老师 链接:https://github.com/zibuyu/research_tao 与老牌学科如物理学、化学等相比,计算机学科还非常年轻,学科体系长期处于剧烈变革之中。作为计算机应用的重要方向,人工智能和自然语言处理自然更不例外,与现实应用紧密相关,技术发展日新月异,常给人今是昨非之感。在这种情况下,传统学术期刊的那种投稿1-2年才能见刊的模式已经赶不上技术革新的速度,年度学术会议显然更符合计算机学科发展和交流的需求,可以看作是一种“小步快跑”的模
自然语言处理是什么?谁需要学习自然语言处理?自然语言处理在哪些地方应用?相关问题一直困扰着不少初学者。针对这一情况,作者结合教学经验和工程应用编写此书。《自然语言处理理论与实战》讲述自然语言处理相关学科知识和理论基础,并介绍使用这些知识的应用和工具,以及如何在实际环境中使用它们。由于自然语言处理的特殊性,其是一门多学科交叉的学科,初学者难以把握知识的广度和宽度,对侧重点不能全面掌握。《自然语言处理理论与实战》针对以上情况,经过科学调研分析,选择以理论结合实例的方式将内容呈现出来。其中涉及开发工具、Python语言、线性代数、概率论、统计学、语言学等工程上常用的知识介绍,然后介绍自然语言处理的核心理论和案例解析,最后通过几个综合性的例子完成自然语言处理的学习和深入。《自然语言处理理论与实战》旨在帮助读者快速、高效地学习自然语言处理和人工智能技术。
大家新年好呀,在《 数据科学家成长指南(上) 》中已经介绍了基础原理、统计学、编程能力和机器学习的要点大纲,今天更新后续的第五、六、七条线路:自然语言处理、数据可视化、大数据。
人工智能大模型时代,评测基准成为大模型发展的风向标。从扁平到全面系统,从简化到多重维度,智源指数CUGE旨在尝试为大模型评测设计一张全面评估综合能力的新考卷。
文章转自清华大学刘知远老师的github:https://github.com/zibuyu/research_tao/blob/master/00_nlp.md
NLPCC 将在 2018 年 8 月 26 日-30 日于内蒙古呼和浩特举行。 📷 CCF 自然语言处理与中文计算国际会议 (NLPCC) 是由中国计算机学会主办的中文信息技术专业委员会年度学术会议,是专注于自然语言处理及中文计算领域的国际会议。会议旨在为来自学术界、工业界和政界的学者和研究者提供一个交流平台,促进学者和研究者分享研究和应用成果及创新思维。 NLPCC 将在 2018 年 8 月 26 日-30 日于内蒙古呼和浩特举行,致力于推动相关领域学术界和工业界研究、创新与应用的发展
编者按:12月18日,腾讯大数据峰会暨KDD China技术峰会在深圳举行,华为诺亚方舟实验室主任李航博士在会上做了题为《自然语言处理中的深度学习:过去、现在和未来》的演讲,AI科技评论根据现场演讲整
本文简绍了SnowNLP的使用方法,这是一个处理中文文本内容的python类库,其主要功能包括分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等等。
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 源 | AI深入浅出 最近几个月小编遨游在税务行业的智能问答调研和开发中,里面涉及到了很多的自然语言处理NLP的功能点。虽然接触NLP也有近两年的时间了,现在真正要应用到问答中,避免不了还是需要再重新熟识并深入研究理解。 下面是与NLP相关的一些书籍推荐、课件推荐和开源工具推荐。 主要是记录下入门的资料,由于资料的存储位置没有做规整,所以本文没有附带资源下载链接。如果有同学需要其中的资
每天给你送来NLP技术干货! ---- 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经70载,机器翻
制定转化对话是每个营销人员和企业所有者都应该掌握的关键技能。它涉及创建和传递引人入胜的信息,吸引您的受众并激励他们采取行动。在当今数字时代,沟通跨越各种渠道和平台进行,掌握对话艺术比以往任何时候都更为重要。
任意时间、任意地点、任意语言的自由通讯无时无刻不在改变着人们的思维方式和生活方式 1.语言是思维的载体,是人类交流思想、表达情感最自然、最直接、最方便的工具 2.人类历史上以语言文字形式记载和流传的知识占知识总量的80%以上 3.2008年1月中国互联网络信息中心(CNNIC)发布的《第21次中国互联网络发展状况统计报告》表明,中国互联网上有87.8%的网页内容是文本表示的 4.面对文本大数据,我们面临怎样的机遇和挑战?
国内自然语言处理期刊 现代语言学(汉斯出版社) 汉斯出版社(Hans Publishers, www.hanspub.org) 聚焦于国际开源 (Open Access) 中文期刊的出版发行, 覆盖以下领域: 数学物理、生命科学、化学材料、地球环境、医药卫生、工程技术、信息通讯、人文社科、经济管理等。秉承着传播文化,促进交流的理念,本社将积极探索中文学术期刊国际化道路,并积极推进中国学术思想走向世界。目前,汉斯出版社的所有期刊均被知网(CNKI Scholar)等数据库收录。其中,23本被美国《化学文摘C
自然语言处理(Natural Language Processing,NLP)是一门融合了计算机科学、人工智能及语言学的交叉学科,它们的关系如下图所示。这门学科研究的是如何通过机器学习等技术,让计算机学会处理人类语言,乃至实现终极目标–理解人类语言或人工智能。
自然语言处理可以说是人工智能领域内落地实践最广的技术之一,NLP产品的应用场景颇为广泛,只要有大量文本数据的场景,都可以使用我们的接口做智能分析,以下列举几个经典的使用场景。
连办八届,SMP年会共话社会媒体;携手六年,腾讯持续支持产学交流 2012年11月24日,哈尔滨工业大学刘挺教授在微博上发起活动“社会媒体与语言处理研讨会”。12月8日,百余位来自自然语言处理、大数据、传播学、社会学等领域的学者相聚在中科院计算所,召开了首届“中国中文信息学会社会媒体与语言计算研讨会”。自此研讨会每年举办一次,专注于以社会媒体处理为主题的科学研究与工程开发,并于2014年起升级为“全国社会媒体处理大会”,现已成为社会媒体处理的重要学术活动。 2012年首届会议掠影 基于哈工大-腾讯联合
“ 精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将引进沟通技巧、商业分析、创新思维等定制课程,定期举办线上线下交流活动,全面提升学生综合素质。入选学生还将获得线上实名社群平台“十分精英圈”的在线访问权限,结识志同道合的科研伙伴,获取业界信息及资源。 ” 今年共有10大方向 81个子课题供大家选择 总有一
随着人工智能的火热,AAAI、NeurIPS、CVPR 等顶级学术会议的影响力也愈来越大,每年接收论文、参会人数的数量连创新高。但受疫情影响,近两年国外举办的学术会议都转为了线上,无法满足学者们现场交流的需求。 ACL 作为全球最受关注的自然语言处理顶级会议,每年都吸引了大量华人学者投稿、参会。今年的 ACL 大会已是第 59 届,中科院自动化所研究员宗成庆老师担任了今年的 ACL-IJCNLP 主席,程序主席包括华盛顿大学的夏飞教授(Fei Xia)和香港理工大学的李文捷(Wenjie Li)教授以及罗马
好几天没有写关于自然语言处理方面的内容,实在抱歉,不过还是感谢大家支持。今天给大家分享一下关于中文自然语言处理的一些基础知识,希望能够帮你快点“入坑”。
自然语言处理在大数据以及近年来大火的人工智能方面都有着非同寻常的意义。那么,什么是自然语言处理呢?在没有接触到大数据这方面的时候,也只是以前在学习计算机方面知识时听说过自然语言处理。书本上对于自然语言处理的定义或者是描述太多专业化。换一个通俗的说法,自然语言处理就是把我们人类的语言通过一些方式或者技术翻译成机器可以读懂的语言。
AI 科技评论按:在自然语言处理(NLP)领域工作的学者(学生)可能无人不知 ACL、EMNLP 这样的 NLP 顶会,但国内发起的这个 NLP 国际会议尽管已经举办六届,可能还没有引起所有人的注意。 近期中国计算机学会(CCF)举办的第六届国际自然语言处理及中文计算会议(NLPCC 2017)在大连成功举办。作为国内 NLP 领域首个面向国际的学术大会,NLPCC 无论从会议的形式、参会的人数(500+)、还是报告的质量(录取率21%),都展现出了一副朝气蓬勃的气象,欲有引领中国 NLP 走向国际之势。
CCF C³活动第十四期自然语言处理,将于本周五8月12日(18:00-21:30)在科大讯飞北京公司举行。名额有限,报名从速。 当前,图文识别、语音识别等感知智能技术已日渐成熟,新一代人工智能正逐步从感知智能向认知智能转化,自然语言处理作为认知智能的重要部分,当前取得了一些显著的进展,同时也面临了许多挑战。本场C³将从技术发展、落地应用等方面开展自然语言处理技术的分享与讨论。 CCF C³活动是CCF CTO Club发起的,面向企业技术专家的热门技术和战略分享会。C³活动旨在联结企业CTO及高级技术人
由于网络暴力往往处于灰色地带,大部分暴力行为都尚未构成诽谤和侮辱,因此很难对网络暴力实施者处以刑罚或者行政处罚。
2015年,整个IT技术领域发生了许多深刻而又复杂的变化,InfoQ策划了“解读2015”年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行。 2015年,借助移动互联网技术、机器学习领域深度学习技术的发展,以及大数据语料的积累,自然语言处理(Natural Language Processing,简称NLP)技术发生了突飞猛进的变化。越来越多的科技巨头开始看到了这块潜在的“大蛋糕”中蕴藏的价值,通过招兵买马、合作、并购的方式、拓展自己在自然语言处理研究领域的业务
AI 伦理与治理是与 AI 技术、工程同等重要但讨论不多的议题。随着近年来大模型的不断涌现,AI 应用和产品纷纷落地。随之而来,人们对 AI 伦理与治理的关注度日益增加,比如 AI 向善、隐私保护、负责任 AI、AI 系统可信可控。近几个月,ChatGPT 的出现让 AI 伦理与治理研究被提上更紧迫的日程。 其实针对 AI 发展过程中产生的伦理与治理问题,一直都有组织跟进研究并着力提出相应的解决方案。2021 年,未来论坛组织 AI 伦理与治理系列论坛,邀请产学研专家思辨探讨,引发广泛关注。活动精华内容已整
2017年7月31日-8月4日,第55届国际计算语言学年会ACL 2017(Annual Meeting of the Association for Computational Linguistics)在加拿大温哥华召开。在这场计算语言学盛会期间,中国中文信息学会青年工作委员会(CIPSC青工委)和腾讯AI Lab联合举办了“犀牛鸟之夜”活动,邀请黄伟道、宗成庆、薛念文、夏飞、赵东岩、朱晓丹、陈博兴等30余位海内外学者交流学术研究心得,探讨产学合作模式。活动由中科院自动化所刘康老师主持。 首先,CIP
机器之心原创 机器之心编辑部 ChatGPT 军备赛开幕,哪些国内机构具备打造下一个 ChatGPT 的实力? 自从 2022 年底 ChatGPT 发布以来,海内外就掀起了一阵狂潮。推出仅两个月,ChatGPT 月活用户突破 1 亿,成为了史上用户增长速度最快的消费级应用程序。 ChatGPT 成为了搅动人工智能领域风云的新势力,其背后的 OpenAI 也因此成为了当下最热门的 AI 公司,甚至引发了科技巨头们的深度焦虑。 谷歌和微软两家科技巨头正在 ChatGPT 搜索上进行激烈竞争,先后宣布了将大
NLP(Natural Language Processing)自然语言处理是计算机科学领域以及人工智能领域的一个重要分支,它研究用计算机来处理、理解以及运用人类语言(中文、英文等),达到人与计算机之间进行有效的通讯。
自然语言处理技术的研究,可以丰富计算机知识处理的研究内容,推动人工智能技术的发展。
众所周知,斯坦福大学自然语言处理组出品了一系列NLP工具包,但是大多数都是用Java写得,对于Python用户不是很友好。几年前我曾基于斯坦福Java工具包和NLTK写过一个简单的中文分词接口:Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器,不过用起来也不是很方便。深度学习自然语言处理时代,斯坦福大学自然语言处理组开发了一个纯Python版本的深度学习NLP工具包:Stanza - A Python NLP Library for Many Human Languages,前段时间,Stanza v1.0.0 版本正式发布,算是一个里程碑:
黄昌宁先生,作为我国自然语言处理领域的先行者之一,在过去近四十年的时间里为我国自然语言处理的发展做出了杰出的贡献。2017 年 11 月,中国计算机学会(CCF)在第六届自然语言处理及中文计算会议(NLPCC 2017)上将首届「杰出贡献奖」授予黄昌宁先生。
2011年,日本多个机构发起的一项机器人项目,以东京大学入学考试难度为目标,以检验人工智能可在多大程度上模拟人类思考以及解决问题的能力。在去年和今年的考试中,机器人“Torobo-kun”分别获得了511分和525分,总分为950分。照着当前的成绩,Torobo-kun有80%的可能被512所私立大学和23所国立大学和公立大学录取,可惜的是,离东京大学至少获得 80% 分数的要求还差得很远。 根据对比,在两次考试中,Torobo-kun在数学和物理方面有了明显的进步,而英语和国语的成绩还是一团糟。在镁客君看
机器之心报道 机器之心编辑部 2017 年 7 月 11 日,专注于计算机视觉和深度学习的国内人工智能企业商汤科技完成 4.1 亿美元融资的消息引爆业内。本次融资创下了全球人工智能公司单轮融资的最高纪录。作为一家专注于计算机视觉和深度学习的新锐公司,在即将到来的世界顶级计算机视觉会议 CVPR(7 月 21 日-26 日,美国夏威夷)上,商汤科技也将带来一系列的技术 Demo、Presentation、PartyTime 等活动。在本届 CVPR 2017 大会上,商汤科技及香港中大-商汤科技联合实验室共
国际权威研究机构Gartner最新发布2022年度《Magic Quadrant for Cloud AI Developer Services》研究报告: 腾讯位列“挑战者“象限! 至此,腾讯连续三年入选Gartner云AI开发者服务魔力象限,为中国云厂商中唯一。 同时,腾讯在计算机视觉方面获得了全球第二的评分排名,再次印证了腾讯云在云AI开发者服务领域的国际领先地位。 ○作为该领域领先的“挑战者”,腾讯将其丰富的人工智能资源用于游戏、视觉和其他服务,不断创新与完善服务能力; ○ 同时开发了CAIDS(
5月25日,由达观数据和上海浦东软件园联合主办、张江发布承办的“AI上海创未来,2018长三角人工智能应用创新张江峰会”在浦软大厦如期举行。本次会议主题为“AI上海创未来”,聚集人工智能发展中的领先企
原文链接:https://github.com/fighting41love/funNLP
领取专属 10元无门槛券
手把手带您无忧上云