某中心研究人员在EMNLP 2021会议上发表的23篇论文中,大部分聚焦于两个核心领域:自然语言理解(即文本语义解析)和问答系统,这些技术在某中心智能助手、云服务和电商平台等业务中具有重要应用价值。其余10篇论文涵盖自学习、信息检索、语言建模和机器翻译等多个方向。
在自然语言理解领域,研究人员运用半监督学习、少样本学习和对比学习等技术,解决了多个子问题:
关键技术论文包括:
在问答系统方面,研究人员实现了多项技术突破:
重要研究成果:
公平性研究:云服务团队提出消除机器翻译模型中性别偏见的新方法(《GFST:基于性别过滤自训练的翻译精度提升》)
信息检索创新:
语言建模优化:
机器翻译改进:通过数据混合和弹性权重整合实现多领域自适应
文本复述生成:弱监督下的复述生成技术助力自然语言处理任务数据增强
利用隐式反馈信号自动改进机器学习模型:
针对对话场景的文本摘要技术提出创新解决方案(《对话摘要的实用技巧集》)
本文内容基于EMNLP 2021会议论文技术细节整理,聚焦自然语言处理领域的技术架构与方法论创新。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。