首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

动态 | 百度NLP团队登顶微软MARCO阅读理解测试

AI 科技评论消息,2 月 21 日,百度 NLP 团队提交的 V-Net 模型以 46.15 的 Rouge-L 得分位列微软的 MS MARCO 机器阅读理解测试第一名。...MS MARCO 全称为 Microsoft MAchine Reading Comprehension,即「微软机器阅读理解」,官网资料显示其正式发布于 NIPS 2016。...与 SQuAD 不同,MARCO 数据集中的问题全都基于来自微软必应搜索(BING)引擎和微软小娜人工智能助手(Cortana)的已匿名处理的真实查询。...可以说,数据集的建立完全是根据用户在 BING 中输入的真实问题模拟搜索引擎中的真实应用场景,其研发团队也曾表示,「MS MARCO 是目前同类型中最有用的数据集,因为它建立在经过匿名处理的真实世界数据基础之上...在每一个问题中,MARCO 提供多篇来自搜索结果的网页文档,系统需要根据这些文档来回答给定的问题。

1.2K70

业界 | 百度提出机器阅读理解技术V-NET,登顶MS MARCO数据集榜单

MS MARCO 排行榜 ?...此次百度登顶的数据集是微软基于搜索引擎 BING 构建的大规模英文阅读理解数据集 MS MARCO,包含 10 万个问题和 20 万篇不重复的文档。...MARCO 数据集中的问题全部来自于 BING 的搜索日志,根据用户在 BING 中输入的真实问题模拟搜索引擎中的真实应用场景,是该领域最有应用价值的数据集之一。...据介绍,相比 SQuAD,MARCO 的挑战难度更大,因为它需要测试者提交的模型具备理解复杂文档、回答复杂问题的能力。...对于此次登顶 MS MARCO 数据集榜单,百度自然语言处理首席科学家兼百度技术委员会主席吴华表示,「此次在 MARCO 的测试中取得第一,只是百度机器阅读理解技术经历的一次小考。

68690
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    《Spring实战》摘录 - 27

    AlertServiceImpl类中,并使用它来创建Connection,使用这个Connection来创建Channel,然后使用这个Channel发布消息到Exchange上 272 Q: #18.0-1 | 全双工意味着服务器可以发送消息给浏览器...,浏览器也可以发送消息给服务器。...Spring 4.0为WebSocket通信提供了支持,包括 A: 发送和接收消息的低层级API; 发送和接收消息的高级API; 用来发送消息的模板; 支持SockJS,用来解决浏览器端、服务器以及代理不支持..." /> //将Marco Handle映射到“/marco” <bean id="marcoHandler" class="marcopolo.MarcoHandler...内容分发网络(英语:Content delivery network或Content distribution network,缩写:CDN)是指一种透过互联网互相连接的计算机网络系统,利用最靠近每位用户的<em>服务器</em>

    41620

    Spring消息之WebSocket

    在建立连接后,WebSocket服务器端和客户端都能主动的向对方发送和接收数据,就像Socket一样。     WebSocket 的由来?...3、所有浏览器都支持 HTTP 协议,WebScoket 可以会遇到不支持的浏览器(可通过SockJS解决) 4、HTTP长连接中,每次数据交换除了真正的数据部分外,服务器和客户端还要大量交换HTTP.../*WebSocket*/ var url = 'ws://localhost:8080/marco2'; var sock = new WebSocket(url); sock.onopen =...; sock.send("Marco!") }     接下来看看服务端这边如何建立起WebSocket的服务: 1、pom 依赖 <!...1、WebSocket 是一个较新的协议规范,在Web浏览器和应用服务器上可能没有得到一致的支持。 2、防火墙代理通常会限制所有除HTTP以外的流量。

    1.1K41

    来看DAX之父如何看《DAX权威指南》一书

    下文来自DAX之父、微软Power BI首席工程经理王予彤(Jeffrey Wang)老师 ---- 我与Alberto Ferrari和Marco Russo相识已十年多,他们很早就成为微软商业智能相关产品的权威人士...从对已发布功能的市场反馈到对未来功能的设计建议,他们的意见一直受到微软研发部门主要负责人及设计人员的高度重视,Marco甚至直接加入了极少数精英才能入选的Power BI贡献者计划。...当我刚加入SQL Server Analysis Services引擎研发团队时,微软的多维数据库OLAP服务器产品开始占据越来越大的市场份额,那时他们已是SQL Server Analysis Services...Alberto和Marco没有因为被迫进行技术转型而苦恼,而是积极地拥抱变革,把这次技术革新当作一次新的机遇。...▊《DAX权威指南》 [意] Marco,Russo(马尔·科鲁索),Alberto,Ferrari(阿尔贝托·拉里) 著 高飞 译 DAX里程碑式经典教材,亚马逊4.8分(总分5分) 本书的目的,让你真正掌握

    89320

    10x单细胞测序技术揭示肝脏细胞全景图

    两个不同的人肝巨噬细胞群 作者研究的一个重要发现是存在两个不同的人肝巨噬细胞群,似乎能够分为促炎和免疫调节两种表型,例如MARCO这一标志仅在非炎性KCs细胞中表达。...使用流式细胞仪观察到了一个亚群巨噬细胞表面表达MARCO marker。免疫组化的结果表明MARCO阳性细胞的分布集中在门静脉区域。...MARCO+ 巨噬细胞响应LPS / IFN-γ的刺激而分泌的TNF-α少于CD68 + MARCO- 巨噬细胞,表明CD68 + MARCO-细胞更具促炎性。...MARCO在肿瘤微环境中的表达与人乳腺癌的较差结果有关。MARCO也在临床前小鼠结肠癌模型中进行了检查,观察到MARCO的表达定义了抑制性肿瘤相关巨噬细胞(TAMs)的亚型。...这些TAMs可以通过抗MARCO抗体极化为炎症表型,促进了肿瘤免疫原性。 这些发现为检查肝内单核细胞/巨噬细胞亚群在肝病的建立和进展中的作用提供了参考。 ? ?

    3.9K31

    MT-BERT在文本检索任务中的实践

    基于上述原因,我们主要将精力放在基于MS MARCO的文档检索和排序任务上。...我们得出这个结论是基于对两部分语料中top-10000高频词的分析,我们发现MARCO的top-10000高频词和BERT基线使用的语料有超过40%的差异。...由于MS MARCO属于大规模语料,我们可以直接使用该数据集中的文档内容对BERT进行预训练。我们在第一阶段使用MLM和NSP预训练目标函数在MS MARCO上进行预训练。 两阶段精调 ?...通过在大规模数据集MS MARCO的实验,充分验证了该模型的优越性,希望这些能对大家有所帮助或者启发。...特别感谢中国科学院软件所研究员金蓓弘老师在MARCO比赛和文章撰写过程中给予的指导和帮助。 ---------- END ----------

    1.6K10

    Citus 11 for Postgres 完全开源,可从任何节点查询(Citus 官方博客)

    │ │ public │ ref_102040 │ table │ marco │ │ public │ test_102105 │ table │ marco │ │ public │ test..._102107 │ table │ marco │ └────────┴──────────────┴───────┴───────┘ 在 Citus 11 中,当您连接到任何工作节点时,您会看到分布式表和引用表...│ │ public │ ref │ table │ marco │ │ public │ test │ table │ marco │ └────────┴────...│ │ public │ ref │ table │ marco │ │ public │ ref_102040 │ table │ marco │ │ public │ test...│ table │ marco │ │ public │ test_102105 │ table │ marco │ │ public │ test_102107 │ table

    1K20

    双塔模型的瓶颈究竟在哪?

    作者从Reddit、Stack-Overflow等网站爬取了20亿个社区问答对数据来为模型提供丰富的语义相关信息,这部分数据通常易于收集,但噪声很大,因此在微调阶段,模型将在人工标注的检索数据集(MS-MARCO...神奇的是,「虽然仅使用10%的训练数据会导致模型的域内泛化能力下降,但却提升了模型的域外泛化能力」,这表明预训练能够同时提升模型的域内和域外泛化能力,也表明MS MARCO的数据分布并不能代表通用领域(...general domain)的分布,使用全量的MS MARCO数据训练模型会导致模型对MS MARCO的数据分布产生轻微的过拟合。...一方面,随着模型的增大,除了GTR-PT(仅预训练)以外,其余模型的性能都变得越来越好;另一方面,微调对模型的域外泛化能力也有较大的影响,如果没有在MS MARCO数据集上微调,模型在BEIR基准上的NDCG...另外作者也对比了模型分别在MS MARCO和在Natural Questions上微调的表现。

    19710
    领券