学计算机的人通常有着比较系统的思维方式,按编程模式来看,即分为定义,分解,以及优化迭代的思路来解决问题。学语言的,极少数上过逻辑课,没有经过推理训练,一般偏向于模糊感性的思维方式。 机器翻译,则是理科
我们需要比较的,更多侧重在翻译工具的易用性与功能性上,也就是说,它能够在多大程度上照顾到我们的实际翻译需求。
通过https://cloud.tencent.com/register注册腾讯云账号
没错,就是 Hugging Face (抱抱脸)标星 26.9k 的 Transformer 项目。在最新更新的版本里,抱抱脸发布了 1008 种模型,正式涉足机器翻译领域。
11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - “腾讯辅助翻译”(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量。该产品采用业内领先的人机交互式机器翻译技术,融合神经网络机器翻译、统计机器翻译、输入法、语义理解、数据挖掘等多项前沿技术,配合亿级双语平行数据,为用户提供实时智能翻译辅助,帮助用户更好更快地完成翻译任务。产品旨在致敬人工翻译,辅助人工翻译更快、更好地完成任务,探索人工智能赋能翻译行业新思路。
模型涵盖 140 种不同语言组合,中文翻英文,英文译法语,法语翻阿拉伯语……还能一对多翻译。
目录 1. 什么叫“替代” 2. 用翻译专业的差异化优势给自己赋能 3. 未来的译者 4. 结语 1 什么叫“替代”? “替代”不是说将翻译职业彻底消灭,而是在某些具体场景下,机器翻译可以发挥作用,将人类解放出来。讨论这个话题,不是只有“替代”和“替代不了”两种情况,答案永远是:有的场景可以替代,有的场景替代不了。牛津大学的学者 Michael Osborne 和 Carl Frey 给出的研究结果就是翻译被取代的概率——33%。 📷 对于替代,这里给出两个具体场景。 场景一:一份本科生论文摘要,本来是要1
俞谦,携程度假大数据研发部算法工程师,主要负责机器翻译的研究与应用,目前专注于自然语言处理在垂域下的成熟解决方案。
入世21年,中国的产业经济、消费市场、技术创新、文化娱乐等各个方面的发展都紧密地与世界联系在一起。
机器之心报道 参与:机器之心编辑部 今日,微软研究团队表示,微软和微软亚研创造了首个在质量与准确率上匹配人类水平的中英新闻机器翻译系统。黄学东告诉机器之心,他们采用专业人类标注与盲测评分代替 BLEU 分值而具有更高的准确性,且新系统相比于现存的机器翻译系统有非常大的提升。因此,根据人类盲测评分,微软机器翻译取得了至少和专业翻译人员相媲美的效果。 微软亚洲与美国实验室的研究者称,其中英新闻机器翻译系统在常用的新闻报道测试集 newstest 2017 上达到了人类水平。该测试集由来自业界和学界的团队共同开发
前面我们讲了机器翻译的原理以及神经网络翻译的发展、以及面临的挑战,我们现在看一看,机器翻译现在有哪些应用?
【新智元导读】 2016年12月20日,哈佛大学自然语言处理研究组,宣布开源了他们研发的机器翻译系统 OpenNMT ,并声称该系统的质量已经达到商用水准。本文作者邓侃基于OpenNMT背后的论文,尝
上一周,清华大学AMiner发布了《2018自然语言处理研究报告》(下载地址:https://pan.baidu.com/s/1IXuZLgGVHjfYyyX63jcVHQ),因为时间原因,没能及时的更新,希望大家见谅。现在作者以初学者的态度整理了一下该报告的主要内容,希望能帮助大家。
作者:胡祥杰 【新智元导读】 不得不说,机器翻译已经和人类水平相差无几,现在要判断一段文字是机器翻译的还是人类翻译的,难度越来越大了。不信?去试试。 最近,我们注意到,有一个叫做“试译宝”的微信公众号发布了一个机器翻译人机PK:具体规则是给出三道题,每道题包含对一句话的四个版本的翻译(其中有一个答案是人类译员给出),参与者需要从这四个选项中选出一个自己认为最可能是人类译员提供的答案,选对了为人类加一颗星,选错了机器加一颗星。 翻译内容是英文版《金融时报》的材料,人类译员也是金融时报的资深翻译员,使用的机器翻
编者按:该讲座主题为 Facebook 机器翻译的两代架构以及技术挑战。 在昨日的 F8 会场,该讲座吸引了众多开发者到场,主讲者是 Facebook 语言翻译部门技术负责人 Necip Fazil
前百度研究院院长林元庆宣布离职,京东物流与怡康医药合作打造“医药云仓”| 大数据24小时
由于人工智能的飞速发展,机器翻译水平正在大幅提升,并逐渐赶超人类,这已经是不争的事实。然而,同在机器翻译这个赛道里的各位“赛手”,谷歌、有道等传统翻译产品或公司,也正在上演着一场激烈的角逐和比拼。 人工智能翻译大赛 谷歌竟然连败两场? 12月的一个早上,北京798软件园,一场机器翻译的pk赛正在进行。活动主办方品玩,是一家“有品好玩”的科技媒体。 这场人工智能翻译大赛的规则是三局两胜,第一局考验对话翻译,第二局考验识别能力,第三局是挑战图像翻译。 而三款同台竞技的翻译软件则是:Google翻译、有道翻译官和
本文介绍了神经网络翻译技术的基本原理、发展历程和主要应用。通过神经网络模型对大量语料进行训练,可以实现对句子进行分词、转换和翻译。目前,神经网络翻译技术已经广泛应用于各种场景,例如旅游、科技、新闻等领域。尽管神经网络翻译技术取得了显著的进展,但仍然存在一些问题,如领域适应、语料库建设和翻译质量等。
本文介绍了神经网络翻译和传统机器翻译的区别,以及目前机器翻译在领域适应、语料库、断句和语序等方面的技术革新。尽管机器翻译已经取得了很大的进步,但在某些情况下仍无法完全替代人类翻译,未来机器翻译的发展仍需与人类翻译者共同提高。
1949年7月15日,美国数学家Warren Weaver发表了《翻译备忘录》,提出了机器翻译的概念。2021年,作为国内规模最大的机器翻译引擎研发团队,小牛翻译团队携手东北大学自然语言处理实验室,决定在每年7月15日举办“小牛翻译论坛”,邀请国内外相关行业专家学者,围绕“机器翻译技术发展与产业应用”主题进行探讨,分享机器翻译技术前沿发展和行业落地方案。 近年来,随着深度学习技术能力的提升,机器翻译领域发展日新月异,各种机器翻译产品的创新层出不穷,在各行各业的应用也取得了蓬勃发展。本年度的“小牛翻译论坛”将
新智元 AI DAILY 1 Uber 投5亿美元打造全球地图,包括中国 据《金融时报》报道,Uber已经决定投资5亿美元打造全球地图项目,以摆脱对谷歌地图的依赖,同时为其无人驾驶汽车项目铺平道路。
你真的了解NLP吗?本文主要是对当前自然语言处理领域的主要研究内容进行了梳理,共包含五个部分:NLP概述、NLP相关技术分类、NLP研究人员分布、NLP的应用、NLP的发展趋势。该篇文章能够帮助刚刚入坑NLP的小伙伴尽快找到自己的定位,同时也能协助已经在坑中挣扎多年的小伙伴看清该领域的全貌。
就在我以为学生大多数都在家里打团战上分的时候,另一个数据惊到了我,“后浪”们远比想象中更好学。
刚接触 NLP 时常有个疑问,就是如何评估这样一个系统——其输出为文本,而非对输入分类。当把一些文本输入系统,得到的输出也为文本时,这类问题称为 seq2seq 或字符串转导(string transduction)问题。
本文将讲述如何使用 Serverless Cloud Function 开发语言翻译工具。
近年来迅速崛起的神经网络机器翻译大幅提升了人工翻译效率,实现翻译项目在时间、质量与成本的最佳平衡。在机器翻译领域,腾讯AI Lab不断探索新的翻译形态,已上线的腾讯TranSmart是第一个公开可用的人机交互翻译产品。由同济大学外国语学院、上海市科技翻译学会与江苏省科技翻译工作者协会联合主办第三届全国机器翻译与译后编辑大赛创新性地引入了基于腾讯TranSmart的交互翻译模式。在交互翻译模式下,机器翻译会自动根据已输入片断实时更新改进译文,帮助译员尽快得到满意的最终译文。 TranSmart交互翻译
耶和华说:“看哪,他们都是一样的人,说着同一种语言,如今他们既然能做起这事(建造巴别塔),以后他们想要做的事就没有不成功的了。”——《圣经》 《圣经》用巴别塔的故事解释了人类语言复杂性的起源,但是,千百年来,虽然面临重重阻碍,人类从未放弃过建造巴别塔的愿望,从职业翻译的出现到国际语的出现都是如此。 智能时代为跨语言交流提供了有力的武器——AI。机器翻译大大降低了翻译的门槛,并且,当下众多科技公司都是免费提供这一服务。如果要评选一个离大众最近的人工智能产品,机器翻译绝对不能忽略。 以时下用户量较大的微信为例
不管是技术层面,还是训练数据,当前的AI翻译距离取代人类还有好一段距离。 “一带一路”=“一条腰带和一条路”? 4月9日下午,“腾讯同传”在博鳌论坛现场上闹了一个大乌龙。 这是博鳌论坛首次采用AI同声传译技术,作为头一份的“腾讯同传”竟然还出现这种离谱的翻译错误。 另外,从网上一些上传的现场翻译图片来看,一些错误简直令人不忍直视: 按照官方所称,上面的错误简称“大面积单词无意义重复、大小写及字符混乱”。 首次亮相结果闹乌龙 说好的取代人类呢? 在博鳌论坛现场,基于自研的NMT(神经网络机器翻译)、语音识别
随着全球互联互通日益频繁,几乎人人都渴望着实时翻译这一“逆天”技术能早日变成现实,伴随这一代代科学家们不懈的努力,科幻正一步步照进现实。
说到腾讯的翻译大家都不陌生,QQ和微信聊天平台上的翻译,QQ浏览器上的翻译全页等功能都是由腾讯云的机器翻译提供强大支持的,但腾讯云的机器翻译到底是啥?它和百度,有道那些翻译APP有啥不同?我相信有这些疑惑的不止我一个人。所以,今天我要和大家分享的就是我初次接触使用腾讯云机器翻译的一些认识,希望本文章能给想要了解腾讯云机器翻译的伙伴们提供一些小小的帮助。
机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 18 个在机器翻译任务上曾取得 SOTA 的经典模型。 第 1 期:RNNsearch、Multi-task、attention-mode
百度机器翻译团队创新性地提出了全球首个感知上下文的机器同传模型,并基于此发布了最新的语音到语音的机器同传系统:DuTongChuan(度同传)。
选自arXiv 作者:Guillaume Lample等 机器之心编译 参与:张倩、路 近日,FAIR 研究人员提出两种机器翻译模型的变体,一种是神经模型,另一种是基于短语的模型。研究者结合了近期提出
机器之心整理 演讲者:李佳 全球机器智能峰会(GMIS 2017),是全球人工智能产业信息服务平台机器之心举办的首届大会,邀请了来自美国、欧洲、加拿大及国内的众多顶级专家参会演讲。本次大会共计 47 位嘉宾、5 个 Session、32 场演讲、4 场圆桌论坛、1 场人机大战,兼顾学界与产业、科技巨头与创业公司,以专业化、全球化的视角为人工智能从业者和爱好者奉上一场机器智能盛宴。 大会第二天,全天议程中最受关注的是多位重要嘉宾出席的领袖峰会,包括《人工智能:一种现代方法》的作者 Stuart Russell
基于深度学习的神经网络机器翻译已经在通用翻译、领域翻译、翻译评估和自动译后编辑等多个场景,产生了巨大的商业价值,但是仍然存在着两个典型问题。一方面,过译漏译等质量问题仍然存在;另一方面,端到端的神经网络黑盒架构使专家介入优化比较困难,传统离散知识不能很好融入模型算法。 在 2021 年 11 月 25 日和 26 日,AICon 全球人工智能与机器学习大会(北京)上,我们邀请到了华为文本机器翻译实验室主任杨浩,他将从离散知识和神经网络模型的融合角度为你带来《知识驱动的机器翻译研究和实践》,希望可以为你带来启发。
简单来说,机器翻译就是把一种语言翻译成另外一种语言,在这里,我用的例子都是从中文翻译成英文。上面的句子用Source标记,即源语言,下面用Target标记,即目标语言,机器翻译任务就是把源语言的句子翻译成目标语言的句子。
选自arXiv 机器之心编译 编辑:杜伟 当今世界上有 7000 多种语言,其中只有大约 100 种具有机器翻译系统,那其他语言怎么办呢?谷歌正在为这些小众语言创建通用的机器翻译系统。 过去十年,学术和商业机器翻译系统(MT)的质量已经得到了大幅度的提升。这些提升很大程度上得益于机器学习的进展和可用的大规模 web 挖掘数据集。同时,深度学习(DL)和 E2E 模型的出现、从 web 挖掘得到的大型并行单语言数据集、回译和自训练等数据增强方法以及大规模多语言建模等带来了能够支持超过 100 种语言的高质量机
论文链接:https://static.aminer.cn/misc/pdf/minrror.pdf
机器翻译一直是非常吸引研究者的「大任务」,如果某些方法被证明在该领域非常有效,那么它很可能可以扩展到其它问题上。例如 Transformer,它出生于机器翻译家族,却广泛应用于各种序列建模任务。
不管你在世界的哪个地方,美国、巴西、法国或者亚洲的婆罗洲岛,借助机器翻译,谷歌和Facebook这类软件都可以把平台上的几乎任何文字内容都翻译成当地语言。
在“机器翻译是如何炼成的(上)”的文章中,我们回顾了机器翻译的发展史。在本篇文章中,我们将分享机器翻译系统的理论算法和技术实践,讲解神经机器翻译具体是如何炼成的。读完本文,您将了解:
来源:环球科学ScientificAmerican 作者:陈宗周 本文长度为5200字,建议阅读5分钟 本文回顾机器翻译发展史,并分析这个曾一度陷入低潮的领域,是如何实现飞跃,并可能在不久的将来打破不同民族间的语言壁垒的。 2017年3月的全国“两会”上,李克强总理来到安徽代表团。讯飞公司董事长刘庆峰拿起桌子上一部手机模样的小设备,说出总理以前对讯飞的勉励——让世界聆听我们的声音,机器马上翻译成流利的英文。他又说“这个哈密瓜很甜”,机器立刻又翻译成流利的维吾尔语。这部叫晓译多语种翻译机的小机器,是讯飞公
【新智元导读】Facebook 今天宣布,从使用基于短语的机器翻译模型改为使用神经网络系统来处理其社交网络后端每天的翻译请求,每天翻译超过 45 亿次。与基于短语的系统相比,BLEU 平均相对提升了 11%。通过使用 Facebook 开源的深度学习框架 Caffe2,基于 RNN 的翻译能够迅速扩展。 Facebook 今天宣布,已经开始使用神经网络系统来处理其社交网络后端每天的翻译请求,总的翻译数量超过 45 亿次。通过使用 Facebook 在今年4月份开源的深度学习框架 Caffe2,基于 RNN
---- 新智元报道 作者:张乾 【新智元导读】今天,科大讯飞翻译机2.0版本全网开售。新版本增加了摄像头和屏幕,能够对中文与33种国外语言进行即时互译,目前支持国内四川话、广东话、东北话、河南话4种方言,功能强大。胡郁说,讯飞做翻译不是要做一个产品、一项技术或者是一个服务,它是在建立在我们在技术创新,能够改变人类世界坚定信念下的一个长期事业。 下一步,超越专八。 4月20日,科大讯飞执行总裁胡郁在“科大讯飞翻译战略暨新品上市发布会”上宣布,讯飞翻译已经超越中国大学英语6级(CET6)水平。 CET
云API团队在云学院上线了一套视频教程,目的是和大家分享如何进行API、SDK和CLI的使用。
【新智元导读】Facebook试图将机器翻译的成功扩展到低资源语言对,研究了在没有任何平行数据的情况下,实现无监督的机器翻译。他们提出的模型有效地学习了在不使用任何标记数据的情况下进行翻译。 论文下载链接:https://arxiv.org/pdf/1711.00043.pdf 原文来源:arxiv 作者:Guillaume Lample、Ludovic Denoyer、Marc’Aurelio Ranzato 「雷克世界」编译:嗯~阿童木呀、多啦A亮 相信大家都知道,最近在机器翻译领域取得了令人印象深刻的
项目地址:https://github.com/facebookresearch/XLM
选自arXiv 机器之心编译 参与:路雪、李泽南、蒋思源 神经机器翻译近期取得很大成功,但缺乏双语数据的语言对很难基于现有方式训练出好的机翻系统。近日,有研究者提出一种无监督新方法,无需使用平行语料库
原文标题:Releasing PAWS and PAWS-X: Two New Datasets to Improve Natural Language Understanding Models
近日,谷歌发布了包含 7 种语言释义对的全新数据集,即:PAWS 与 PAWS-X。BERT 通过该数据集的训练,在释义对问题上的精度实现了约为 3 倍的提升;其它先进的模型也能够利用该数据集将精度提高到 85-90%。谷歌希望这些数据集将有助于推动多语言模型的进一步发展,并发布了相关文章介绍了该数据集,我们将其整理编译如下。
领取专属 10元无门槛券
手把手带您无忧上云