开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

你能解释一下你是如何计算基线和自定义BLEU分数的吗？

计算基线和自定义BLEU分数是一种用于评估机器翻译质量的方法。下面是对这两个概念的解释：

计算基线（Calculating Baseline）：计算基线是指通过一种简单的方法或模型来计算机器翻译的基准分数。通常情况下，计算基线使用的是一种简单的翻译模型或规则，例如基于词典的翻译或者基于规则的翻译。计算基线的目的是为了提供一个参考分数，用于与其他更复杂的机器翻译模型进行比较。
自定义BLEU分数（Custom BLEU Score）： BLEU（Bilingual Evaluation Understudy）是一种常用的机器翻译质量评估指标。它通过比较机器翻译结果与人工参考翻译之间的相似度来计算分数。自定义BLEU分数是指在计算BLEU分数时，根据具体需求对其进行自定义的修改或调整。

自定义BLEU分数的计算通常包括以下几个步骤：

分词（Tokenization）：将机器翻译结果和参考翻译都进行分词处理，将其转化为一个个的单词或短语。
N-gram匹配（N-gram Matching）：计算机器翻译结果中N-gram（连续N个单词）与参考翻译中N-gram的匹配数量。
计算精确度（Precision）：根据N-gram匹配数量计算出机器翻译结果的精确度。
计算召回率（Recall）：根据N-gram匹配数量计算出参考翻译的召回率。
计算BLEU分数：根据精确度和召回率计算出BLEU分数，通常使用几何平均值来平衡精确度和召回率。

对于计算基线和自定义BLEU分数的具体实现，可以使用各种机器翻译评估工具或库来进行计算。例如，可以使用Python中的nltk库或者自定义脚本来实现这些计算。具体实现方法可以根据具体需求和使用的工具而有所不同。

腾讯云提供了一系列与机器翻译相关的产品和服务，例如腾讯云翻译（Tencent Cloud Translation），可以帮助用户实现高质量的机器翻译。您可以访问腾讯云翻译的产品介绍页面（https://cloud.tencent.com/product/tmt）了解更多信息。

相关搜索:这段代码的时间复杂度是多少，你能解释一下你是如何计算它的吗？你能追踪这个Haskell foldl lambda函数是如何工作的吗？你能给我解释一下环境变量是如何工作的吗？你能帮我解释一下这个函数是如何工作的吗？它使用内联、具体化、valueOf()和enumValues 你能告诉我比较是如何工作的吗，输入运算符== (参数)你能帮我理解一下异步等待在Node.js中是如何工作的吗？你能解释一下while(*++str1)和return (str1 - str2)是做什么的吗？代码的左侧是如何为counts和bin_edges赋值的？有人能简要解释一下这段代码吗？React Tic Tac Toe教程:你能解释一下一个数字是如何作为参数传递给click事件的函数的吗？我想创建一个文件并存储在HTTPS路径下，文件是为本地存储工作的，你能告诉我如何存储文件http路径吗？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

机器翻译质量评测算法-BLEU

本文介绍机器翻译领域针对质量自动评测的方法-BLEU，让你理解为什么BLEU能够作为翻译质量评估的一种指标，它的原理是什么，怎么使用的，它能解决什么问题，它不能解决什么问题。什么是BLEU？ BLEU (Bilingual Evaluation Understudy) is an algorithm for evaluating the quality of text which has been machine-translated from one natural language to anothe

03

ACL 2021 | 腾讯AI Lab、港中文杰出论文：用单语记忆实现高性能NMT

自然语言处理（NLP）领域顶级会议 ACL 2021 于 8 月 2 日至 5 日在线上举行。据官方数据, 本届 ACL 共收到 3350 篇论文投稿，其中主会论文录用率为 21.3%。腾讯 AI Lab 共入选 27 篇论文（含 9 篇 findings）。

03

加利福尼亚大学提出 EM-VLM4AD | 轻量级、多帧的视觉-语言模型，减少10倍的内存和浮点运算！

视觉-语言模型（VLMs）已经成为一种强大的工具，它们具备整体知识，能够解决视觉和语言交叉领域的问题。这使得它们在自动驾驶（AD）中具有巨大的潜力，允许驾驶员与VLM互动，VLM能够提供各种驾驶安全任务的易于理解的语言表示。此外，VLM可以作为端到端的自动驾驶系统，消除了在自动驾驶特定子任务（如感知和轨迹规划）的单独模型之间的集成和传播错误。这些潜在的好处推动了许多为自动驾驶应用量身定制的视觉-语言模型和多模态语言模型的发展。这些模型涵盖了自动驾驶的各个方面，包括闭环控制、感知任务和交通代理行为分析。

01

利用大型语言模型在药物分子与适应症之间进行翻译

今天为大家介绍的是来自Yanshan Wang团队的一篇论文。药物分子够改变生物体精神或身体状态。每种被批准的药物都有一个适应症，这指的是该药物用于治疗特定医疗条件的治疗用途。尽管大型语言模型（LLM）最近在将分子及其文本描述之间进行翻译方面显示出了有效性，但在利用这些模型帮助实现药物分子与适应症之间，或反之亦然的翻译方面，研究仍存在空白。这种能力对药物发现过程大有裨益，能够根据给定的适应症生成药物，这将允许发现针对特定疾病或靶点的药物，并最终为患者提供更好的治疗方案。

01

斯坦福NLP课程 | 第9讲 - cs224n课程大项目实用技巧与经验

教程地址：http://www.showmeai.tech/tutorials/36

04

NLP输出文本评估：使用BLEU需要承担哪些风险？

刚接触 NLP 时常有个疑问，就是如何评估这样一个系统——其输出为文本，而非对输入分类。当把一些文本输入系统，得到的输出也为文本时，这类问题称为 seq2seq 或字符串转导（string transduction）问题。

03

与谷歌翻译持平，华为诺亚方舟实验室全新深度机器翻译模型，提高译文忠实度

【新智元导读】华为诺亚方舟实验室在他们一篇被 AAAI 2017 录用的论文里提出了一个新的神经机器翻译（NMT）模型，引入基于重构的忠实度指标，结果显示该模型确实有效提高了机器翻译的表现。华为诺亚方舟实验室的研究人员表示，他们的 NMT 技术与谷歌持平。基于深度学习的机器翻译，简称深度机器翻译近两年来取得了惊人的进展，翻译的准确度综合评比已经超过传统的统计机器翻译，研究单位主要有蒙特利尔大学[1,2]，斯坦福大学[3,4]，清华大学[5,6]，谷歌[3,7,8]，微软[9]和百度[5,10]，以及华为诺

03

Meta这篇语言互译大模型研究，结果对比都是「套路」

机器之心报道机器之心编辑部你不能这样对比啊。今年 7 月初，Meta AI 发布了一个新的翻译模型，名为 No Language Left behind (NLLB)，我们可以将其直译为「一个语言都不能少」。顾名思义，NLLB 可以支持 200 + 语言之间任意互译，Meta AI 还把它开源了。平时你都没见到的语言如卢干达语、乌尔都语等它都能翻译。论文地址：https://research.facebook.com/publications/no-language-left-behind/ 开

02

类GPT模型训练提速26.5%，清华朱军等人用INT4算法加速神经网络训练

神经网络训练需要一定计算量，使用低精度算法（全量化训练或 FQT 训练）有望提升计算和内存的效率。FQT 在原始的全精度计算图中增加了量化器和去量化器，并将昂贵的浮点运算替换为廉价的低精度浮点运算。

02

基于 Python 的自动文本提取：抽象法和生成法的比较

本博客是对文本摘要的简单介绍，可以作为当前该领域的实践总结。它描述了我们（一个RaRe 孵化计划中由三名学生组成的团队）是如何在该领域中对现有算法和Python工具进行了实验。

02

【NLP】文本生成评价指标的进化与推翻

文本生成目前的一大瓶颈是如何客观，准确的评价机器生成文本的质量。一个好的评价指标（或者设置合理的损失函数）不仅能够高效的指导模型拟合数据分布，还能够客观的让人评估文本生成模型的质量，从而进一步推动text generation 商业化能力。

04

简单说 CSS的vertical-align

vertical-align属性，是CSS属性中一个比较重要的属性，也是比较不好理解的一个。我们今天就来说说它。

03

从Yoav Goldberg与Yann LeCun争论，看当今的深度学习、NLP与arXiv风气

选自Medium、Facebook 机器之心编译作者：Yoav Goldberg、Yann LeCun 参与：黄小天、吴攀、晏奇最近，来自以色列 Bar Ilan 大学的计算机科学高级讲师 Yoav Goldberg 撰文批评了蒙特利尔大学的新论文《Adversarial Generation of Natural Language》，指责了该论文作者，乃至整个 arXiv 目前出现的不良风气。Yoav 的言论引起了学界的关注，Yann LeCun 等人很快也发出了回应。机器之心对这篇文章和 Yann

07

SFFAI分享 | 张文：Recent Advances in NMT【附PPT与视频资料】

本次分享中，我们介绍一下近期的工作，分别以缓解上述三个问题为出发点，提出的三种方法：

03

ACL2020 | 使用强化学习为机器翻译生成对抗样本

本文介绍的是 ACL 2020 论文《A Reinforced Generation of Adversarial Examples for Neural Machine Translation》，论文作者来自南京大学、腾讯。

02

学界 | Google Brain提出基于固定尺寸记忆表示的注意力模型，翻译任务推理速度提高20%

AI科技评论按：Attention模型是近些年来自然语言处理领域重要的进展之一。注意力模型是从认知心理学中人脑注意力模型中引入的概念，在人观察世界时，对不同对象的关注程度是不同的，比如你在看书仔细品味文章中的一句话时，虽然你能看到整页的文字，但是注意力的焦点集中在这个句子上，其他文字虽然还在你的眼中，但是实际分配到的注意力是很少的。自然语言处理中也是同理，输入文本的不同部分对输出的贡献是不同的，即需要分配的注意力权重不同。使用注意力模型能够得到更好的生成结果。由于标准的基于内容的attention机制主要

05

VMware SDDC 分析工具介绍----第一篇

在接下来的一段时间，笔者会分享VMware SDDC体系架构中分析工具，vROps和LogInsight。由于篇幅有限，我会以连载的方式，先介绍vROps（预计会有三篇），再介绍Log Insight。分析工具用于分析数据。谈到数据的类型，可以分为结构化数据和非结构化数据。在VMware的SDDC解决方案中，两种数据我们都有相应的分析方法。针对与结构化数据，主要指的是虚拟化环境中的：性能、告警、事件类的信息，通过vROps与vCenter进行通讯进行收集，经过分析后，用报表的形式展示给用户。对于非结构化数

千层Transformer问世！多语种机器翻译水准刷新多项SOTA

---- 新智元报道编辑：David 拉燕【新智元导读】近日，微软研究院的研究人员搞出了一个1000层的Transformer，在多语种机器翻译任务上刷新多项SOTA 近年来，追求大规模的Transformer模型成为了一种潮流。从一开始的百万级的模型参数，到十亿级，再到万亿级，参数规模极大增加。大规模的模型可以在大量任务中可以有更棒的表现，在小样本和零样本学习的情况下也展现出了出色的能力。尽管参数的数量越来越大，参数的深度却一直在被Transformer训练的不稳定性所局限。2019年，科

02

浅谈用Python计算文本BLEU分数

BLEU，全称为Bilingual Evaluation Understudy（双语评估替换），是一个比较候选文本翻译与其他一个或多个参考翻译的评价分数。

机器翻译之BLEU值

BLEU（Bilingual Evaluation Understudy），相信大家对这个评价指标的概念已经很熟悉，随便百度谷歌就有相关介绍。原论文为BLEU: a Method for Automatic Evaluation of Machine Translation，IBM出品。

04

Elasticsearch Top 51 重中之重面试题及答案

问题列表和答案来自国外博客（原文答案不准确，有错误），为避免误导，我对每个问题做了属于自己的理解和解答。

02

AI读心术震撼登顶会！模型翻译脑电波，人类思想被投屏｜NeurIPS 2023

然而，在最近的NeurIPS大会上，来自GrapheneX-UTS的研究人员带来了更震撼的应用场景——AI读心术BrainGPT！

01

模型压缩95%，MIT韩松等人提出新型Lite Transformer

虽然推出还不到 3 年，Transformer 已成为自然语言处理（NLP）领域里不可或缺的一环。然而这样流行的算法却需要极高的算力才能实现足够的性能，这对于受到算力和电池严格限制的移动端来说有些力不从心。

02

神经网络机器翻译技术及应用（上）

简单来说，机器翻译就是把一种语言翻译成另外一种语言，在这里，我用的例子都是从中文翻译成英文。上面的句子用Source标记，即源语言，下面用Target标记，即目标语言，机器翻译任务就是把源语言的句子翻译成目标语言的句子。

03

[DeeplearningAI笔记]序列模型3.6Bleu得分/机器翻译得分指标

表示 n 元词组这一项的 BLEU 得分，为了使用一个数值来评价一个机器翻译系统，需要将

02

【论文】赛尔原创 | EMNLP 2019基于知识库检索器的实体一致性端到端任务型对话系统

任务型对话系统可以用来帮助用户完成订购机票、餐厅预订等业务，越来越受到研究者的关注。近几年，由于序列到序列(sequence-to-sequence)模型和记忆网络(memory-network)的强大建模能力，一些工作直接将任务型对话建模为端到端任务型对话任务。如图一所示，输入输出定义如下：

03

【源头活水】mBART：多语言翻译预训练模型

“问渠那得清如许，为有源头活水来”，通过前沿领域知识的学习，从其他研究领域得到启发，对研究问题的本质有更清晰的认识和理解，是自我提高的不竭源泉。为此，我们特别精选论文阅读笔记，开辟“源头活水”专栏，帮助你广泛而深入的阅读科研文献，敬请关注。

03

Hinton等人最新研究：大幅提升模型准确率，标签平滑技术到底怎么用?

作者 | Rafael Müller , Simon Kornblith, Geoffrey Hinton

00

对话搜狗口语机器翻译团队：全球夺冠只为验证技术，更看重落地商用

在今年的国际顶级口语机器翻译大赛IWSLT上，搜狗战胜科大讯飞、阿里等众多国内外好手，一举夺魁。

03

LLM基础知识

💥通常，大语言模型 (LLM) 是指包含数千亿 (或更多) 参数的语言模型(目前定义参数量超过10B的模型为大语言模型)，这些参数是在大量文本数据上训练的，例如模型 GPT-3、ChatGPT、PaLM、BLOOM和 LLaMA等.

01

AAAI 2020 | 计算所冯洋组：引入评估模块，提升机器翻译流畅度和忠实度（已开源）

本文是对计算所冯洋组完成，被 AAAI2020 录用的论文《Modeling Fluency and Faithfulness for Diverse Neural Machine Translation》进行解读，相关工作已开源。

01

Attension is All You Need 论文笔记

主流的序列转换模型(dominant sequence transduction models)都是基于复杂的递归神经网络或者卷积神经网络，包括一个编码器(encoder)和一个解码器(decoder)

03

一个模型库学习所有：谷歌开源模块化深度学习系统Tensor2Tensor

选自Google.research 机器之心编译参与：黄小天、李泽南在谷歌提交热点论文《Attention Is All You Need》和《One Model To Learn Them All》不久之后，这家公司很快就发布了最新研究的模型和训练集。昨天，谷歌发布了一个名为 Tensor2Tensor（T2T）的 TensorFlow 开源系统，希望能够以此提高机器学习社区的研究和开发速度，其中包含了谷歌近期提出的多个最新模型。此外，T2T 将深度学习所需的各个组件以模块化呈现，这意味着开发者和研究

08

自定义损失函数Gradient Boosting

互联网上有很多关于梯度提升的很好的解释(我们在参考资料中分享了一些选择的链接)，但是我们注意到很少有人提起自定义损失函数的信息：为什么要自定义损失函数，何时需要自定义损失函数，以及如何自定义损失函数。

03

一个真实数据集的完整机器学习解决方案（上）

我们到底应该怎么学会、灵活使用机器学习的方法？技术宅做过小小的调研，许多同学会选择一本机器学习的书籍，或是一门机器学习的课程来系统性地学习。而在学完书本、课程后，并不清楚如何将这些理论、技术应用到实际的项目流程中。

01

中到英新闻翻译媲美人类，微软机器翻译新突破

机器之心报道参与：机器之心编辑部今日，微软研究团队表示，微软和微软亚研创造了首个在质量与准确率上匹配人类水平的中英新闻机器翻译系统。黄学东告诉机器之心，他们采用专业人类标注与盲测评分代替 BLEU 分值而具有更高的准确性，且新系统相比于现存的机器翻译系统有非常大的提升。因此，根据人类盲测评分，微软机器翻译取得了至少和专业翻译人员相媲美的效果。微软亚洲与美国实验室的研究者称，其中英新闻机器翻译系统在常用的新闻报道测试集 newstest 2017 上达到了人类水平。该测试集由来自业界和学界的团队共同开发

05

青少年女性抑郁症的内在神经回路

请点击上面“思影科技”四个字，选择关注我们，思影科技专注于脑影像数据处理，涵盖（fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动）等，希望专业的内容可以给关注者带来帮助，欢迎留言讨论，也欢迎参加思影科技的其他课程。(文末点击浏览）

01

500亿参数，支持103种语言：谷歌推出「全球文字翻译」模型

在过去的几年里，由于神经机器翻译（NMT）的发展，机器翻译（MT）系统的质量得到了显著提升，打破了世界各地的语言障碍。但 NMT 的成功很大程度上要归功于有监督的训练数据。那么，数据较少甚至没有数据的语言该怎么办呢？多语言 NMT 是一种有效的解决方法，它有一种归纳偏见，即「来自一种语言的学习信号应该有助于提高其他语言的翻译质量」。

04

500亿参数，支持103种语言：谷歌推出「全球文字翻译」模型

在过去的几年里，由于神经机器翻译（NMT）的发展，机器翻译（MT）系统的质量得到了显著提升，打破了世界各地的语言障碍。但 NMT 的成功很大程度上要归功于有监督的训练数据。那么，数据较少甚至没有数据的语言该怎么办呢？多语言 NMT 是一种有效的解决方法，它有一种归纳偏见，即「来自一种语言的学习信号应该有助于提高其他语言的翻译质量」。

01

ICLR论文评分「高台跳水」：领域主席急刹车，评审结果8分变1分

无独有偶，近日 reddit 上一名网友发文质疑 ICLR 2020 一篇论文的评审结果，这篇论文最初的三位审稿人都分别给出了 8-8-8 的高分，但经领域主席介入后另指派两位审稿人重新对这篇论文展开评审，结果竟给出了 1-1 的超低分，如此巨大的反转引发了社区的热议。

01

ICLR论文盲审大反转：三个“8”完美过关，又来两个“1”彻底拒绝

新模型将随机-梯度MCMC和循环自编码变分贝叶斯相结合。不仅能够捕获句子内的单词依赖性，还可以捕获句子和句子内部主题依赖性的时间迁移。

01

NLP 中评价文本输出都有哪些方法？为什么要小心使用 BLEU？

我经常被 NLP 领域的入门者问到的一个问题就是，当系统输出文本而不是对输入文本的一些分类时，该如何去评价这些系统。在模型中输入文本然后模型输出其它文本的这类问题，就是我们都知道的序列到序列（sequence to sequence）或者字符串转导（string transduction）问题。

04

前端面试那些坑

HTML Doctype作用？严格模式与混杂模式如何区分？它们有何意义? HTML5 为什么只需要写？行内元素有哪些？块级元素有哪些？空(void)元素有那些？页面导入样式时，使用link和@

06

微软发布代码智能新基准数据集CodeXGLUE，多角度衡量模型优劣

编者按：代码智能（code intelligence）目的是让计算机具备理解和生成代码的能力，并利用编程语言知识和上下文进行推理，支持代码检索、补全、翻译、纠错、问答等场景。以深度学习为代表的人工智能算法，近年来在理解自然语言上取得了飞跃式的突破，代码智能也因此获得了越来越多的关注。该领域一旦有突破，将大幅度推动 AI 在软件开发场景的落地。

04

合规基线：让安全大检查更顺利

说起安全检查，安全从业人员可能都非常熟悉“安全标准”概念。所有企事业单位网络安全建设都需要满足来自于国家或监管单位的安全标准，如等保2.0、CIS安全标准等。安全标准，还有一个叫法就是“安全基线”。字典上对“基线”的解释是：一种在测量、计算或定位中的基本参照，如海岸基线，是水位到达的水位线。因此，可以认为安全基线就是最低的安全要求。

01

学界 | 普适注意力：用于机器翻译的2D卷积神经网络，显著优于编码器-解码器架构

深度神经网络对自然语言处理技术造成了深远的影响，尤其是机器翻译（Blunsom, 2013; Sutskever et al., 2014; Cho et al., 2014; Jean et al., 2015; LeCun et al., 2015）。可以将机器翻译视为序列到序列的预测问题，在这类问题中，源序列和目标序列的长度不同且可变。目前的最佳方法基于编码器-解码器架构（Blunsom, 2013; Sutskever et al., 2014; Cho et al., 2014; Bahdanau et al., 2015）。编码器「读取」长度可变的源序列，并将其映射到向量表征中去。解码器以该向量为输入，将其「写入」目标序列，并在每一步用生成的最新的单词更新其状态。基本的编码器-解码器模型一般都配有注意力模型（Bahdanau et al., 2015），这样就可以在解码过程中重复访问源序列。在给定解码器当前状态的情况下，可以计算出源序列中的元素的概率分布，然后使用计算得到的概率分布将这些元素的特征选择或聚合在解码器使用的单个「上下文」向量中。与依赖源序列的全局表征不同，注意力机制（attention mechanism）允许解码器「回顾」源序列，并专注于突出位置。除了归纳偏置外，注意力机制还绕过了现在大部分架构都有的梯度消失问题。

02

面向可解释的NLP：北大、哈工大等提出文本分类的生成性解释框架

【导语】北大、哈工大和加州大学圣巴巴拉分校在 ACL 2019 的一篇论文中联合提出了一个全新的生成性解释框架，该框架能够对分类策略进行学习，并同时提供细粒度的解释。这项研究还提供了解释因子以及最小化风险训练（minimum risk training）方法，以便进行学习并产生更加合理的解释。

03

学界 | 谷歌联合英伟达重磅论文：实现语音到文本的跨语言转录

选自arxiv 机器之心编译参与：吴攀、李亚洲、蒋思源机器翻译一直是人工智能研究领域的重头戏，自去年谷歌推出了神经机器翻译（GNMT）服务以来，相关技术的研发并没有止步不前，在多语言翻译和 zero-shot 翻译上也取得了引人注目的进展。近日，谷歌大脑和英伟达联合发布的一篇论文《序列到序列模型可以直接转录外语语音（Sequence-to-Sequence Models Can Directly Transcribe Foreign Speech）》将机器翻译这方面的研究又向前推进了一步，实现了从一种语

09

Echarts中常用的参数总结以及参数自定义示例

本文主要讲解使用Echarts时setOption里面的属性以及常见的问题，参数都是本人项目里的具体参数。设置内容都是在 setOption({ })中。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭