麻省理工学院一位经济学家撰写的新研究表明,改进后的翻译软件可以显著促进在线国际贸易——这是机器学习对经济活动产生明显影响的一个显著案例。研究发现,eBay在2014年改进了自动翻译程序后,可以使用这一新系统的两个国家的贸易额猛增了10.9%。
在 8月7日在德国柏林召开的2016 计算语言学(ACL)大会上,学者Thang Luong、Kyunghyun Cho 和 Christopher D. Manning进行了关于神经机器翻译(NMT)的讲座。神经机器翻译是一种简单的新架构,可以让机器学会翻译。该方法虽然相对较新,已经显示出了非常好的效果,在各种语言对上都实现了最顶尖的表现。神经网络在自然语言处理方面,未来有巨大的应用潜力。 讲座学者之一 Kyunghyn Cho 与深度学习“大神” Yoshua Bengio、蒙特利尔大学学者 Jun
选自 einstein.ai 机器之心编译 参与:Nurhachu Null、蒋思源 自然语言处理(NLP)这个领域目前并没有找到合适的初始化方法,它不能像计算机视觉那样可以使用预训练模型获得图像的基本信息,我们在自然语言处理领域更常用的还是随机初始化词向量。本文希望通过 MT-LSTM 先学习一个词向量,该词向量可以表征词汇的基本信息,然后再利用该词向量辅助其它自然语言处理任务以提升性能。本文先描述了如何训练一个带注意力机制的神经机器翻译,其次描述了如何抽取该模型的通用词向量与将其应用于其它任务的性能。
12月11日,2021年腾讯犀牛鸟精英科研人才培养计划正式对外发布。计划截止申报时间为2021年1月28日24:00。 本年度精英科研人才计划将延续人工智能领域顶尖科研人才培养,发布包含机器人、AI医疗、量子计算、智慧城市等12个前沿热议方向,71项研究课题。入选学生将由校企导师联合制定专属培养计划,并获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将为学生搭建线上和线下学习、交流平台,帮助学生挖掘更多潜能。 本期小编整理了该计
ChatGPT(Chat Generative Pre-trained Transformer),是人工智能技术驱动的自然语言处理工具,即AIGC的一款具体的应用和产品。它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
选自arXiv 作者:Antonio Valerio Miceli Barone等 机器之心编译 参与:Nurhachu Null、李泽南 在神经机器翻译问题中,不同的堆叠架构已经多次在不同研究中展现出了良好的表现,而深度转换架构(Deep transition architecture)则成功地用于语言建模等用途中。爱丁堡大学与 Charles University 的研究者们对这两种架构的多个组合形式在 WMT 翻译任务中的表现进行了测试,并提出了结合堆叠与深度转换的新型神经网络:BiDeep RNN。
机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 18 个在机器翻译任务上曾取得 SOTA 的经典模型。 第 1 期:RNNsearch、Multi-task、attention-model
雷锋网AI科技评论按:12月21日,由创新工场、搜狗、今日头条三家联合举办的首届 “AI Challenger全球AI挑战赛”在北京举办落幕仪式及颁奖典礼。雷锋网记者也前往了颁奖典礼现场,进行了全程跟踪报道。 都有哪些参赛队伍获奖? 大赛分为视觉和翻译两大类,共五个赛道。分别是人体骨骼关键点检测竞赛、图像中文描述竞赛、场景分类竞赛、英中机器文本翻译竞赛和英中机器同声传译竞赛。参赛队伍共计7079支,其中场景分类参赛团队最多,达2004支。人体骨骼关键点检测参赛团队1735个,图像中文描述1479个参赛队,机
AI 研习社按:12月21日,由创新工场、搜狗、今日头条三家联合举办的首届 “AI Challenger全球AI挑战赛”在北京举办落幕仪式及颁奖典礼。AI 研习社记者也前往了颁奖典礼现场,进行了全程跟踪报道。 都有哪些参赛队伍获奖? 大赛分为视觉和翻译两大类,共五个赛道。分别是人体骨骼关键点检测竞赛、图像中文描述竞赛、场景分类竞赛、英中机器文本翻译竞赛和英中机器同声传译竞赛。参赛队伍共计7079支,其中场景分类参赛团队最多,达2004支。人体骨骼关键点检测参赛团队1735个,图像中文描述1479个参赛
2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 1 历经70载,机器翻译进入 深度学习驱动时代 机器翻译诞生于
每天给你送来NLP技术干货! ---- 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经70载,机器翻
周末来点烧脑的,Salesforce爱因斯坦发布以来究竟做了哪些事情,做了哪些高科技含量的事情,下面我们就来一起看一看Salesforce爱因斯坦在自然语言处理领域的最新研究吧。
👆点击“博文视点Broadview”,获取更多书讯 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经7
👆点击“博文视点Broadview”,获取更多书讯 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标语言(Target Language)。 图 1 通过计算机将一句汉语自动翻译为英语 一直以来,文字的翻译往往是由人完成的。 时至今日,人工智能技术的发展已经大大超越了人类传统的认知,用计
在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。
【新智元导读】微软昨天宣布其研发的机器翻译系统首次在通用新闻的汉译英上达到了人类专业水平,实现了自然语言处理的又一里程碑突破。 由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队今天宣布,其研发的机器翻译系统在通用新闻报道的中译英测试集上,达到了人类专业译者水平。这是首个在新闻报道的翻译质量和准确率上媲美人类专业译者的翻译系统。 微软技术院士,负责微软语音、自然语言和机器翻译工作的黄学东博士表示,这是自然语言处理领域的一项里程碑式的成就。“这是我们的情怀,是非常有意义的工作,”黄学东告诉新智元:“消除语言障
1949年7月15日,美国数学家Warren Weaver发表了《翻译备忘录》,提出了机器翻译的概念。2021年,作为国内规模最大的机器翻译引擎研发团队,小牛翻译团队携手东北大学自然语言处理实验室,决定在每年7月15日举办“小牛翻译论坛”,邀请国内外相关行业专家学者,围绕“机器翻译技术发展与产业应用”主题进行探讨,分享机器翻译技术前沿发展和行业落地方案。 近年来,随着深度学习技术能力的提升,机器翻译领域发展日新月异,各种机器翻译产品的创新层出不穷,在各行各业的应用也取得了蓬勃发展。本年度的“小牛翻译论坛”将
INTERFACE 分享者:陈伟、李健涛 机器之心报道 参与:李泽南 3 月 12 日,搜狗正式在线上平台发布了「旅行翻译宝」。这款随身翻译设备结合了搜狗神经网络机器翻译、语音识别、图像识别等多项技术,不仅支持语音、图像翻译等多种翻译模式,还提供中英日韩俄德等 18 种语言互译。 在深度学习快速发展的今天,机器翻译系统的能力究竟达到了什么样的水平?机器翻译是否已经可以代替人类翻译?3 月 17 日,机器之心与搜狗共同举办的 INTERFACE 线下分享中,搜狗语音交互技术中心研发总监陈伟、搜狗 IOT 事
论文作者:郑在翔,周浩,黄书剑,陈家骏,许晶晶,李磊论文地址:https://proceedings.neurips.cc/paper/2021/file/afecc60f82be41c1b52f6705ec69e0f1-Paper.pdf论文代码:https://github.com/zhengzx-nlp/REDER 1 简介 众所周知,(神经)机器翻译是一个序列到序列生成任务。标准的序列到序列生成模型类似于一个单工通信通道(在单工信道中信号传递是单向的,即只能从源端(源语言)到目标端(目标语言);与之
10月27日晚7点,机器之心最新一期线上分享邀请到东北大学教授、博士生导师肖桐带来分享,系统梳理机器翻译发展的技术脉络,并介绍机器翻译发展历程中的经典工作。直播过程中将送出20本肖桐和朱靖波教授的联合著作《机器翻译:基础与模型》。详情见文末。 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标
嘉宾:网易高级副总裁、网易有道CEO 周枫 【新智元导读】本周,新智元V享圈请来网易高级副总裁、网易有道CEO周枫一起畅聊机器翻译。周枫分享了有道在自然语言处理上的储备和技术优势,探讨神经机器翻译等一系列问题。本文带来精彩实录。 2017年以来,深度学习技术在翻译上不断取得突破,谷歌、Facebook相继宣布在翻译上取得了较为显眼的进步:除了准确度和支持翻译语种的不断增减,现在用单一语料库来训练机器翻译也已经成为了现实。 技术上的进步也促进了应用上的推车出新。今年3月,谷歌手机翻译已经通过更新可以让中国用户
【新智元导读】12月21日,百度举行机器翻译技术开放日。本次开放日主要向外界传递的一个主题是:百度早于谷歌和微软,在一年前已经推出最近很火的基于神经网络的机器翻译(NMT)系统。 新智元讯 2016年12月21日,百度举行机器翻译技术开放日。 百度技术委员会联席主席、自然语言技术负责人吴华博士作技术报告,她说,百度早在1年多以前就率先发布了世界上首个互联网基于神经网络的机器翻译(NMT)系统,引领机器翻译进入神经网络翻译时代。 神经网络翻译技术从2014年9月提出,百度2015年5月上线首个互联网NMT系
作者:科大讯飞cobbyli、zmwang 摘自:36氪 (36kr.com) 不久前,一个实时翻译视频风靡网络,视频中两名分别说着英语和西班牙语的人借助Skype软件的实时翻译功能竟然实现了无障碍交
前面我们讲了机器翻译的原理以及神经网络翻译的发展、以及面临的挑战,我们现在看一看,机器翻译现在有哪些应用?
到目前为止,虽然机器翻译无法完全做到「信、达、雅」,但翻译结果的准确性对于一般应用场景来说已经足够。
上周,谷歌AI团队开源了备受关注的“最强NLP模型”BERT的TensorFlow代码和预训练模型,不到一天时间,收获3000多星!
来源:环球科学ScientificAmerican 作者:陈宗周 本文长度为5200字,建议阅读5分钟 本文回顾机器翻译发展史,并分析这个曾一度陷入低潮的领域,是如何实现飞跃,并可能在不久的将来打破不同民族间的语言壁垒的。 2017年3月的全国“两会”上,李克强总理来到安徽代表团。讯飞公司董事长刘庆峰拿起桌子上一部手机模样的小设备,说出总理以前对讯飞的勉励——让世界聆听我们的声音,机器马上翻译成流利的英文。他又说“这个哈密瓜很甜”,机器立刻又翻译成流利的维吾尔语。这部叫晓译多语种翻译机的小机器,是讯飞公
两天前谷歌宣布发布新一代神经网路机器翻译系统(Google Neural Machine Translation),简称GNMT,因为使用当前最先进的训练技术,能够实现到迄今为止机器翻译质量的最大提升。 “人们对这个翻译系统的评价显示,与之前那个基于短语的翻译系统相比,在翻译多种语言时,神经学习翻译系统的错误率已经降低了60%左右,其中包括英法互译,英西互译以及英汉互译。附加实验的结果显示,翻译系统的质量将和笔译人员平均水准更加接近。” 但是好奇心爆棚的AI科技评论君,突然想知道这个错误率降低60%是怎么推
天撸了!昨天微信翻译因为出Bug被网友送上热搜,网友质疑微信在翻译明星内容时,结果是近乎“恶搞”。
2015年12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与CSDN共同协办的2015中国大数据技术大会(Big Da
【新智元导读】 2016年12月20日,哈佛大学自然语言处理研究组,宣布开源了他们研发的机器翻译系统 OpenNMT ,并声称该系统的质量已经达到商用水准。本文作者邓侃基于OpenNMT背后的论文,尝
人工智能从幕后走向实用离不开人工智能技术取得的突破和发展。在互联网时代背景下,大数据、新型高性能计算架构以及深度学习帮助人工智能技术实现了从量变到质变的转变。其中,计算机视觉、语音识别技术均已能够规模
去年,一位叫作石渡祥之佑的小哥开发了一个AI系统Mantra,该系统结合了特定于漫画的图像识别技术、机器翻译和外语排版自动化技术,也就是说,能够直接在漫画原文上实现翻译。
相信不少人还记得中学的时候全文背诵《陈涉世家》的痛苦,当然还有考试的时候让你翻译某一句名言,像是“燕雀安知鸿鹄之志哉”,或者“天下苦秦久矣。吾闻二世少子也,不当立,当立者乃公子扶苏”。
COLING 2016 日本·大阪 12.11-12.16 国际计算语言学会议(International Conference on Computational Linguistics,简称COLING),是自然语言处理和计算语言学领域的重要国际学术会议,每两年召开一次。本次是第26届国际计算语言学会议(即COLING-2016)于12.11-12.16日在日本大阪举行。 腾讯AI平台孟凡东博士报告独家报道 本次会议的有效投稿数为1039篇,有337篇论文被录用,接收率是32%。论文的报告形式分为Or
【新智元导读】华为诺亚方舟实验室在他们一篇被 AAAI 2017 录用的论文里提出了一个新的神经机器翻译(NMT)模型,引入基于重构的忠实度指标,结果显示该模型确实有效提高了机器翻译的表现。华为诺亚方舟实验室的研究人员表示,他们的 NMT 技术与谷歌持平。 基于深度学习的机器翻译,简称深度机器翻译近两年来取得了惊人的进展,翻译的准确度综合评比已经超过传统的统计机器翻译,研究单位主要有蒙特利尔大学[1,2],斯坦福大学[3,4],清华大学[5,6],谷歌[3,7,8],微软[9]和百度[5,10],以及华为诺
导语 :一年一度的全国机器翻译大赛(CCMT 2019)于7月20日公布了比赛结果,来自TEG的腾讯民汉翻译团队自去年拿下英汉翻译冠军之后,再一次载誉而归。团队经过多日奋战,最终在30个参赛单位的角逐中脱颖而出,以绝对优势获得三个民族语种中“维吾尔-汉"、“蒙古-汉”任务冠军。而在一个月前国家部委举办的企业级机器翻译系统评测(非受限数据集)中,腾讯民汉翻译团队参加了两个项目,获得了藏语-汉语冠军,维吾尔语-汉语亚军的成绩,这些成绩彰显了腾讯在民族语言技术领域的核心竞争力。 第十五届全国机器翻译大赛(C
编者按:ICLR 2019 于5月6日至9日在美国新奥尔良举行,本届投稿比去年增长了近60%,共收到1591篇,录取率为31.7%。由微软研究院与蒙特利尔大学 MILA 研究所合作的论文《Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks》获得了最佳论文奖。来自微软亚洲研究院的6篇论文入选了本届ICLR,内容涵盖多智能体的对偶学习、自然语言生成模型训练中的表征退化问题、基于知识蒸馏的多语言神经机器翻译、多视图立体场景重建等。本文将对这些工作进行介绍,感兴趣的读者可以在“阅读原文”中下载论文。
作者 | 陈彩娴 编辑丨岑峰1月6日,2021年ACL Fellow名单正式公布! 今年,一共有8位知名的自然语言处理学者入选,其中,华人学者有2位,占了1/4,分别是中国科学院自动化所的宗成庆教授与华为诺亚方舟实验室刘群博士。 根据官网消息,今年两位华人学者的入选理由分别是: 刘群:对机器翻译与中文自然语言处理作出了卓越贡献; 宗成庆:对机器翻译与情感分析的研究作出重大贡献,并不断促进中国自然语言处理的发展。 ACL Fellow计划始于2011年,旨在表彰对自然语言处理领域的科技研究与社区服务作出了杰出
7月3日下午,爱奇艺技术产品团队举办了“i技术会”第16期技术沙龙,本次技术会的主题是“NLP与搜索”,邀请到了来自字节跳动、去哪儿和腾讯的技术专家,共同分享与探讨NLP与搜索结合的魔力。
【新智元导读】 随着AlphaGo战胜柯洁,AI 所激起的惊慌不仅在围棋界蔓延,而且扩展到了几乎每一个领域,翻译受到的冲击尤为严重。深度学习的出现极大地变革了机器翻译:2013年以来基于神经网络的机器翻译在速度和准确度将翻译水平提升到了新的台阶。当下,科技巨头的激烈争夺以及学术界百花齐放的研究下,机器翻译水平仍在不断地进化当中,超过人类水平只是时间问题。在新的智能时代中,翻译这个“古老”的职业会消失吗? “从事翻译的人很可能会看到一些工作机会在不断消失,他们必须要习惯一种‘创业思维’。” 5月27日,中国围
当时人类联合起来兴建希望能通往天堂的高塔,为了阻止人类的计划,上帝让人类说不同语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。
11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - “腾讯辅助翻译”(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量。该产品采用业内领先的人机交互式机器翻译技术,融合神经网络机器翻译、统计机器翻译、输入法、语义理解、数据挖掘等多项前沿技术,配合亿级双语平行数据,为用户提供实时智能翻译辅助,帮助用户更好更快地完成翻译任务。产品旨在致敬人工翻译,辅助人工翻译更快、更好地完成任务,探索人工智能赋能翻译行业新思路。
【新智元导读】“世界末日时钟是23点57分。我们正在经历世界上的戏剧性的发展,这表明我们越来越接近末日和耶稣的回归。”这段惊悚的“预言”来自谷歌翻译。2016年,谷歌宣布机器翻译“重大突破”——神经机器翻译(GNMT),将翻译质量提高到接近人类笔译的水平。然而,它将无意义的文本翻译成怪异的宗教预言引起了新的恐慌。这次,要怪AI是“黑盒”,还是拖出谷歌员工来背锅?
精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将为学生搭建线上和线下学习、交流平台,帮助学生挖掘更多潜能。学生通过“十分精英圈”线上平台,随时获取前沿技术资讯、沉淀科研收获与心得;通过“智学研讨会”及“智享交流会”等线下平台,积极参与海内外顶级学术会议及学术专家交流活动;通过“精英研学营”进阶平台,对话产业
选自arXiv 机器之心编译 编辑:杜伟 当今世界上有 7000 多种语言,其中只有大约 100 种具有机器翻译系统,那其他语言怎么办呢?谷歌正在为这些小众语言创建通用的机器翻译系统。 过去十年,学术和商业机器翻译系统(MT)的质量已经得到了大幅度的提升。这些提升很大程度上得益于机器学习的进展和可用的大规模 web 挖掘数据集。同时,深度学习(DL)和 E2E 模型的出现、从 web 挖掘得到的大型并行单语言数据集、回译和自训练等数据增强方法以及大规模多语言建模等带来了能够支持超过 100 种语言的高质量机
当今世界随着大数据、人工智能算法、云计算等技术的发展机器翻译技术又掀起一波新浪潮。伴随着该项技术不断发展的是一场由战争与压迫转为和平与发展的历史,同时这项技术的发展背后亦隐藏着巨大的权力纠纷。
【新智元导读】谷歌今日更新博客,介绍了谷歌神经机器翻译系统重大更新,实现了用单一模型对多语种通用表征。这种新的模型体积不仅与多语言翻译模型一样,参数相同,而且速度更快、质量更高。不仅如此,系统还实现“零数据翻译”,也即能够在从来没有见过的语言之间进行翻译。这意味着传说中的“巴别塔”有望成真。 (文/Mike Schuster,Melvin Johnson,Nikhil Thorat)过去10年中,谷歌翻译已从仅支持几种语言发展到了支持 103 种,每天翻译超过了 1400 亿字。为了实现这一点,我们需要构建
本文主要参考:https://zhuanlan.zhihu.com/p/96020318
机器之心(海外)原创 作者:Mos Zhang 参与:Panda 机器翻译(MT)是借机器之力「自动地将一种自然语言文本(源语言)翻译成另一种自然语言文本(目标语言)」[1]。使用机器做翻译的思想最早由 Warren Weaver 于 1949 年提出。在很长一段时间里(20 世纪 50 年代到 80 年代),机器翻译都是通过研究源语言与目标语言的语言学信息来做的,也就是基于词典和语法生成翻译,这被称为基于规则的机器翻译(RBMT)。随着统计学的发展,研究者开始将统计模型应用于机器翻译,这种方法是基于对双语
领取专属 10元无门槛券
手把手带您无忧上云