本期内容采编自 Renato & Michael 的播客节目《全球化说》第41期:“Podcast 041: Forecast 2018: What's Ahead for the Language
👆点击“博文视点Broadview”,获取更多书讯 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经7
机器之心原创 作者:邱陆陆 机器翻译领域正经历又一次骤雨疾风般的变革。2014 年,Yoshua Bengio 组做出了第一个循环网络编码器-解码器神经机器翻译模型。而后仅 3 个月,基于 LSTM 结构和注意力机制的神经机器翻译系统就达到了可以与统计机器翻译(SMT)媲美的水平。到了 2016 年,谷歌翻译正式将神经机器翻译用于八个英语与其他语言的语言对,让深度学习多了一个影响每个人的接口。 今年,网易有道上线了自主研发的 YNMT,让以中文为中心的、根据中文用户使用习惯定制的神经翻译系统服务于 6 亿有
2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 1 历经70载,机器翻译进入 深度学习驱动时代 机器翻译诞生于
微信互联网人每天必看的午新闻 小程序 1. 5 月 29 日,微信团队发布了「微信同声传译小程序插件」,免费开放了微信 AI 团队在机器翻译、智能语音领域的业界领先成果,使开发者简便地在小程序中加入机
NLP技术持续发展,各种预训练模型层出不穷,NLP结合产业应用在各行各业中形成爆发态势。本次会议聚焦NLP领域最新的技术以及产业应用场景。2月23日,欢迎报名参加。 为工程师提供顶级交流平台 CCF TF第94期 主题 NLP技术和产业化进展 2023年2月23日 19:00-21:00 长按识别或扫码报名 报名链接:https://conf.ccf.org.cn/TF94 从算法模型,到产业应用,NLP在各个子领域都在进行突破,也面临更多的挑战和机遇。随着NLP模型越来越大,参数量迅速膨胀,分布式训练
据《韩国先驱报》报道,早些时候在韩国举办的人机翻译大赛中,美国互联网巨头谷歌研发的人工智能语言软件得分高于同场竞技的其他人工智能机器。 2月21日,由四名专业译者组成的团队与三家人工智能翻译软件进行比
当今世界随着大数据、人工智能算法、云计算等技术的发展机器翻译技术又掀起一波新浪潮。伴随着该项技术不断发展的是一场由战争与压迫转为和平与发展的历史,同时这项技术的发展背后亦隐藏着巨大的权力纠纷。
国家情报总监办公室内的情报高级研究项目活动今天宣布了一项多年的研究努力,开发一种语言处理软件,称为“机器翻译”,用于英文检索各种语文的信息,使用户能够迅速开发和部署完全自动化的系统,使只有英语的人能够准确和有效地识别感兴趣的外国媒体新闻文件。 美国国家情报总监办公室(Office of the Director of National Intelligence)内的情报高级研究项目活动(Intelligence Advanced Research Projects Activity)宣布启动一项多年研究项目
机器之心报道 参与:机器之心编辑部 今日,微软研究团队表示,微软和微软亚研创造了首个在质量与准确率上匹配人类水平的中英新闻机器翻译系统。黄学东告诉机器之心,他们采用专业人类标注与盲测评分代替 BLEU 分值而具有更高的准确性,且新系统相比于现存的机器翻译系统有非常大的提升。因此,根据人类盲测评分,微软机器翻译取得了至少和专业翻译人员相媲美的效果。 微软亚洲与美国实验室的研究者称,其中英新闻机器翻译系统在常用的新闻报道测试集 newstest 2017 上达到了人类水平。该测试集由来自业界和学界的团队共同开发
作者:科大讯飞cobbyli、zmwang 摘自:36氪 (36kr.com) 不久前,一个实时翻译视频风靡网络,视频中两名分别说着英语和西班牙语的人借助Skype软件的实时翻译功能竟然实现了无障碍交
2011年,TA还只会“中-英”翻译这一项技能。但TA却用十年时间,在翻译这条路上不断打磨自己。
近年来,机器学习和人工智能迅速出现,为提高商业效率带来了希望。与此同时,研究人员几乎没有发现任何证据支持劳动生产率和经济活动因此取得的进展。
随着全球互联互通日益频繁,几乎人人都渴望着实时翻译这一“逆天”技术能早日变成现实,伴随这一代代科学家们不懈的努力,科幻正一步步照进现实。
---- 新智元报道 编辑:QQ 【新智元导读】 10月30日,字节跳动技术社区ByteTech将主办对外技术沙龙,大咖分享,圆桌论坛,等你围观参与! 字节跳动在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书,等等,产品和服务覆盖全球150个国家和地区。截至2021年6月,抖音日活跃用户数已经突破6亿,字节跳动旗下全线产品总MAU(月活跃用户)超过19亿。 一款全球化的产品,该如何冲破语言阻碍?将产品信息快速传达给不同语言背景的用户,提升产品价值?这是产品全球化过程中需要解决的
麻省理工学院一位经济学家撰写的新研究表明,改进后的翻译软件可以显著促进在线国际贸易——这是机器学习对经济活动产生明显影响的一个显著案例。研究发现,eBay在2014年改进了自动翻译程序后,可以使用这一新系统的两个国家的贸易额猛增了10.9%。
虽然神经机器翻译模型取得了巨大的性能提升,但是其成功主要依赖于大量的高质量的双语语料。然而,获得大量的高质量的双语语料的成本极高,需要花费大量的人力和物力。在实际应用场景中,有时并没有大量的双语语料可以使用,更加极端情况是没有任何双语语料用来训练翻译模型。因此,想要继续提升神经翻译模型的性能,需要减少模型对高质量双语语料的依赖。对于低资源甚至无资源的翻译场景,我们需要研究能够更加高效使用单语语料的翻译模型和训练方法。
自然语言处理果真是人工智能皇冠上的明珠,在走向摘取颗果实的路上,人类恐怕还只是走了一半。
【新智元导读】微软昨天宣布其研发的机器翻译系统首次在通用新闻的汉译英上达到了人类专业水平,实现了自然语言处理的又一里程碑突破。 由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队今天宣布,其研发的机器翻译系统在通用新闻报道的中译英测试集上,达到了人类专业译者水平。这是首个在新闻报道的翻译质量和准确率上媲美人类专业译者的翻译系统。 微软技术院士,负责微软语音、自然语言和机器翻译工作的黄学东博士表示,这是自然语言处理领域的一项里程碑式的成就。“这是我们的情怀,是非常有意义的工作,”黄学东告诉新智元:“消除语言障
【新智元导读】 随着AlphaGo战胜柯洁,AI 所激起的惊慌不仅在围棋界蔓延,而且扩展到了几乎每一个领域,翻译受到的冲击尤为严重。深度学习的出现极大地变革了机器翻译:2013年以来基于神经网络的机器翻译在速度和准确度将翻译水平提升到了新的台阶。当下,科技巨头的激烈争夺以及学术界百花齐放的研究下,机器翻译水平仍在不断地进化当中,超过人类水平只是时间问题。在新的智能时代中,翻译这个“古老”的职业会消失吗? “从事翻译的人很可能会看到一些工作机会在不断消失,他们必须要习惯一种‘创业思维’。” 5月27日,中国围
引言 北京时间6月26日,在刚刚结束的全国机器翻译大赛中(CWMT 2018)中,TEG以“腾讯基础研发部”名义参加比赛(由TEG springhuang 负责, bojiehu、ambyera 组成,jinghaoyan、alanpfhu、zhiqianglv 参与),经过几日通宵的鏖战,从25个参赛单位86个系统中脱颖而出,最终获得英汉翻译第一名,汉英,蒙(蒙古语)汉翻译亚军,维汉翻译第四名,藏汉翻译第七名的好成绩,并在综合总成绩上独占鳌头。 继团队在5月份获得世界机器翻译大赛获得亚军(参见文章《腾讯基
昨天,加州大学旧金山分校的Joseph Makin 等人在 Nature Neuroscience上发表了一篇论文,标题为《利用 encoder-decoder 框架,将大脑皮质活动翻译为文本》(Machine translation of cortical activity to text with an encoder–decoder framework)。
在本文中,在数据科学学习之旅中,我经常处理日常工作中的时间序列数据集,并据此做出预测
由于人工智能的飞速发展,机器翻译水平正在大幅提升,并逐渐赶超人类,这已经是不争的事实。然而,同在机器翻译这个赛道里的各位“赛手”,谷歌、有道等传统翻译产品或公司,也正在上演着一场激烈的角逐和比拼。 人工智能翻译大赛 谷歌竟然连败两场? 12月的一个早上,北京798软件园,一场机器翻译的pk赛正在进行。活动主办方品玩,是一家“有品好玩”的科技媒体。 这场人工智能翻译大赛的规则是三局两胜,第一局考验对话翻译,第二局考验识别能力,第三局是挑战图像翻译。 而三款同台竞技的翻译软件则是:Google翻译、有道翻译官和
本文介绍了神经网络翻译技术的基本原理、发展历程和主要应用。通过神经网络模型对大量语料进行训练,可以实现对句子进行分词、转换和翻译。目前,神经网络翻译技术已经广泛应用于各种场景,例如旅游、科技、新闻等领域。尽管神经网络翻译技术取得了显著的进展,但仍然存在一些问题,如领域适应、语料库建设和翻译质量等。
本文介绍了神经网络翻译和传统机器翻译的区别,以及目前机器翻译在领域适应、语料库、断句和语序等方面的技术革新。尽管机器翻译已经取得了很大的进步,但在某些情况下仍无法完全替代人类翻译,未来机器翻译的发展仍需与人类翻译者共同提高。
AI 科技评论按:比尔·盖茨曾说过,「语言理解是人工智能皇冠上的明珠」,沈向洋博士也说过「懂语言者得天下」。自然语言理解处在认知智能最核心的地位。它的进步会引导知识图谱的进步,会引导对用户理解能力的增强,也会进一步推动整个推理能力。自然语言处理的技术会推动人工智能整体的进展,从而使得人工智能技术可以落地实用化。 微软亚洲研究院副院长周明博士围绕这一观点有过不少系统的阐述。不论是在微软大厦举行的自然语言处理前沿技术分享会活动上,或是近日举办的 EmTech China 峰会上,周明博士围绕自然语言四个方面的进
编者按:12月18日,腾讯大数据峰会暨KDD China技术峰会在深圳举行,华为诺亚方舟实验室主任李航博士在会上做了题为《自然语言处理中的深度学习:过去、现在和未来》的演讲,AI科技评论根据现场演讲整
教程地址:http://www.showmeai.tech/tutorials/36
第十五届全国机器翻译大会(The 15th China Conference on Machine Translation, CCMT 2019)于2019年9月27日至29日在江西南昌举行。本次会议由中国中文信息学会主办,江西师范大学承办。CCMT旨在为国内外机器翻译界同行提供一个交互平台,加强国内外同行的学术交流,召集各路专家学者针对机器翻译的理论方法、应用技术和评测活动等若干关键问题进行深入的研讨,为促进中国机器翻译事业的发展,起到积极的推动作用。
神经网络是通过分析大量的训练数据学会执行计算任务,这是人工智能近代取得的最令人印象深刻的进步,包括语音识别和自动翻译系统。 然而在训练期间,神经网络不断地调整其内部设置,甚至连创建者也无法解释其原理。于是,最近在计算机科学领域的许多工作都聚焦于研发一种技术,确定神经网络如何发挥作用。 在最近的几篇论文中,麻省理工学院计算机科学和人工智能实验室(CSAIL)和卡塔尔计算研究所(QCRI,Qatar Computing Research Institute)的研究人员使用了最近研发的解释技术,该技术已经用于分析
精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将为学生搭建线上和线下学习、交流平台,帮助学生挖掘更多潜能。学生通过“十分精英圈”线上平台,随时获取前沿技术资讯、沉淀科研收获与心得;通过“智学研讨会”及“智享交流会”等线下平台,积极参与海内外顶级学术会议及学术专家交流活动;通过“精英研学营”进阶平台,对话产业
在过去的十几年里,受到算法设计、数据、算力三大关键因素的推动,深度学习取得了突破性进展,极大地变革了图像分类、机器翻译等领域。 然而在这个过程中,大模型以及数据集的使用是以大量计算需求为代价的。过往的一些研究表明,增强模型的泛化能力以及稳健性离不开大模型的支持,因此,在训练大模型的同时协调好与训练资源的限制非常重要。 一种可行的方法是利用条件计算,该方法不是为单个输入激活整个网络,而是根据不同的输入激活模型的不同部分。这一范式已经在谷歌提出的 Pathway(一种全新的 AI 解决思路,它可以克服现有系统
为了抗击新冠肺炎病毒疫情,腾讯云AI即日起免费为战疫开发者提供人脸识别、文字识别、语音识别、语音合成、机器翻译、腾讯智能对话平台TBP等服务,直至疫情结束。所有为政府部门、医疗机构等开发疫情服务,以及提供远程办公、教学等服务的开发者和服务商,都可以免费或以一定优惠额度享受服务。
本文介绍了未来可能颠覆世界的十大黑科技,包括能上网的隐形眼镜、人体器官培育、意志控制的读心术、复活的灭绝动物、能理解人类语言的机器翻译、随心所欲的变形、战胜癌症的纳米粒子、现实的钢铁侠、意识上传和太空移民等。这些技术或让人类的生活变得更便捷,或让人类拥有更强大的能力,或让人类拥有更长的寿命,或让人类拥有更强大的创造力。这些技术有的已经实现,有的尚待实现,但都展现出了巨大的潜力和广阔的前景。
---- 【新智元导读】首次正式亮相国际级会议的AI同传,腾讯翻译君不仅仅代表了自己,还代表了整个AI智能翻译业界。近几天AI同传遭遇社会嘲笑,对此,腾讯翻译君负责人李学朝,讯飞胡郁有话说。 这几天又有一个AI火了。 没错,我们说的是在2018年博鳌论坛担任同声传译的腾讯同传。 这个事件让人想起了2017年“3·15晚会”打假人脸识别,让人脸识别技术一夜走红,也让众多人脸识别公司躺枪。一年后的今天,公众对人脸识别的接受度已经明显提升,技术在不断发展,人脸识别的商业化应用在不断产生。 当时,人脸识别公司云
作者:刘光明 【新智元导读】近期,来自麻省理工学院计算机科学人工智能实验室(CSAIL)和卡塔尔计算研究所的研究人员已经通过新的解释技术,来分析神经网络做机器翻译和语音识别的训练过程。 神经网络通过分析大量的训练数据来学习并执行任务,这是近期人工智能领域最令人印象深刻的进展,包括语音识别和自动翻译系统。 然而,在训练过程中,神经网络以甚至其创造者都无法解释的方式来不断调整其内部设置。计算机科学最近的许多工作都聚焦于千方百计的弄清楚神经网络的工作原理。 在最近的几篇论文,来自麻省理工学院计算机科学人工智能实
论文链接:https://www.nature.com/articles/s41593-020-0608-8
选自Vas3k.com 作者:Ilya Pestov 英语版译者:Vasily Zubarev 中文版译者:Panda 实现高质量机器翻译的梦想已经存在了很多年,很多科学家都为这一梦想贡献了自己的时间和心力。从早期的基于规则的机器翻译到如今广泛应用的神经机器翻译,机器翻译的水平不断提升,已经能满足很多场景的基本应用需求了。近日,Ilya Pestov 用俄语写的机器翻译介绍文章经 Vasily Zubarev 翻译后发表到了 Vas3k.com 上。机器之心又经授权将其转译成了汉语。希望有一天,机器自己就能
导语 :一年一度的全国机器翻译大赛(CCMT 2019)于7月20日公布了比赛结果,来自TEG的腾讯民汉翻译团队自去年拿下英汉翻译冠军之后,再一次载誉而归。团队经过多日奋战,最终在30个参赛单位的角逐中脱颖而出,以绝对优势获得三个民族语种中“维吾尔-汉"、“蒙古-汉”任务冠军。而在一个月前国家部委举办的企业级机器翻译系统评测(非受限数据集)中,腾讯民汉翻译团队参加了两个项目,获得了藏语-汉语冠军,维吾尔语-汉语亚军的成绩,这些成绩彰显了腾讯在民族语言技术领域的核心竞争力。 第十五届全国机器翻译大赛(C
前几年曾经马少平老师的引荐,为某科普图书写过一篇短文介绍自然语言处理。如果只是介绍NLP的概念、任务和挑战,应该可以参考这篇小文。原文如下,仅供参考。 自然语言处理 Natural Language Processing 一、什么是自然语言处理 简单地说,自然语言处理(Natural Language Processing,简称NLP)就是用计算机来处理、理解以及运用人类语言(如中文、英文等),它属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。由于自然语言是人类区别于其他动
---- 新智元报道 作者:张乾 【新智元导读】今天,科大讯飞翻译机2.0版本全网开售。新版本增加了摄像头和屏幕,能够对中文与33种国外语言进行即时互译,目前支持国内四川话、广东话、东北话、河南话4种方言,功能强大。胡郁说,讯飞做翻译不是要做一个产品、一项技术或者是一个服务,它是在建立在我们在技术创新,能够改变人类世界坚定信念下的一个长期事业。 下一步,超越专八。 4月20日,科大讯飞执行总裁胡郁在“科大讯飞翻译战略暨新品上市发布会”上宣布,讯飞翻译已经超越中国大学英语6级(CET6)水平。 CET
随着大语言模型的快速崛起,人们对自然语言处理技术的关注度也在不断提升。近年来,BERT、GPT等语言模型各显神通,其模型结构均可溯源至Transformer。自2017年提出以来,Transformer已经迅速占据了整个自然语言处理领域,甚至在图像处理领域也开始发挥作用。目前火热的ChatGPT也是基于Transformer decoder结构的模型之一,其出色的表现广受好评。掌握Transformer基础知识已成为学术界和从业者的必修课程。 2023年4月27日(周四晚)18:30,来自东北大学自然语言处
在全球疫情背景下,国际间的线下学术交流变得十分困难。 这段时间以来,机器之心一直在围绕国际顶级学术会议在国内举办线下活动,促进国内 AI 领域的学术交流。 2020 年底,机器之心举办了 NeurIPS 2020 中国区 MeetUp,报名人数高达 1300 人,受到了国内 AI 社区的极大关注,众多高校、企业积极参与。 2021 年 6 月,机器之心又组织了 CVPR 2021 线下论文分享会,邀请到了虞晶怡(视频致辞)、陶大程、林达华、纪荣嵘、许春景这些业内顶级专家做主题演讲,同时也设置了 12 篇论文
该技术由火山引擎申报并参与“数据猿年度金猿策划活动——2020大数据产业创新技术突破榜榜单及奖项”评选。
机器之心专栏 作者:钱利华 本文提出了一种为单步并行生成进行词之间依赖关系建模的方法。基于该方法的模型GLAT在不久前的国际机器翻译大赛(WMT2021)上击败一众自回归翻译系统,夺得了德语到英语方向机器翻译自动评估第一。 目前机器翻译中常用的神经网络模型(例如 Transformer ,LSTM)基本上都是自回归模型(Autoregressive models)。自回归模型在输出句子时是逐词按顺序生成的,每一个输出的词都依赖于之前的输出词。 虽然自回归模型被广泛应用并取得了不错的效果,但是自回归模型要求
“ 精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将引进沟通技巧、商业分析、创新思维等定制课程,定期举办线上线下交流活动,全面提升学生综合素质。入选学生还将获得线上实名社群平台“十分精英圈”的在线访问权限,结识志同道合的科研伙伴,获取业界信息及资源。 ” 今年共有10大方向 81个子课题供大家选择 总有一
👆点击“博文视点Broadview”,获取更多书讯 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标语言(Target Language)。 图 1 通过计算机将一句汉语自动翻译为英语 一直以来,文字的翻译往往是由人完成的。 时至今日,人工智能技术的发展已经大大超越了人类传统的认知,用计
众所周知,参加学术会议是进入学术圈、走进学术前沿的重要方式。在学术会议上,不仅可以集中听取最新的成果报告,还有讲习班、工作坊、社交活动等形式,了解那些不会写到论文中的八卦与动态,结识学术大佬和朋友,走向学术人生巅峰。
领取专属 10元无门槛券
手把手带您无忧上云