前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >对腾讯文档AI助手技术架构的简单分析

对腾讯文档AI助手技术架构的简单分析

作者头像
小小鱼儿小小林
发布2024-05-25 15:59:03
730
发布2024-05-25 15:59:03
举报
文章被收录于专栏:灵儿的笔记灵儿的笔记

腾讯文档全面接入了AI,今天腾讯技术大佬tensorchen作者发表了一篇文章《腾讯文档AI助手技术实践》

里面讲解了从技术应用架构以及AI大模型赋能角度,介绍腾讯文档AI智能助手的探索和实践之路。作为一款集多功能为一体的AI产品,腾讯文档全品类与AI进行了深度融合,全面提升用户生活和办公中的效率。

通过腾讯文档AI,你脑海中灵光一现的Idea可以快速转化为详细的内容,在各种类型的文档中同源流转。

大家一定要去体验一下AI加持的新的腾讯文档

我们对腾讯文档AI助手的技术进行简单的分析一下

技术架构:

  1. AICopilot:提供AI侧边栏对话入口服务,主要负责对话的意图识别工具分发,意图保持,柔性处理,缓存逻辑,会话存档等能力。
  2. AIServer:提供各品类独有浮层助手能力。
  3. AIAgent:定位于AI智能体,目前主要提供文档各品类的能力工具集合,被上层服务的意图识别后所实际的驱动的接口。
  4. AIEngine:文档的AI引擎服务,涉及对AI相关能力的抽象和封装,保持统一抽象定义(主要包含文生文,文生图,TTS,ASR,OCR,Embedding等AI能力的抽象),屏蔽不同AI能力间的差异,奠定文档可以在不同AI能力进行无缝切换的基础。
  5. AIOperation: 文档AI相关的灰度策略,隐私授权(柔性),运营操作。
  6. AIExtension:AI拓展服务,主要包含和规划为AI应用落地过程中的其他支撑能力,例如文本搜索,图片搜索,Python执行引擎。

文档AI中台:

文档AI中台的概念初始于腾讯文档这款产品本身就存在10种品类,期望以中台解决方案的形式为不同品类进行赋能,同时也是这样实践和落地。此不仅仅在于腾讯文档产品本身,依据部门内整体产品矩阵,也更需要将文档xAI基础能力作为中台,交付和赋能不同的产品。

技术方案:

  1. RAG(Retrieval-Augmented Generation)搜索增强生成技术,用于处理大模型中各种复杂的知识密集型任务,如知识问答。
  2. 通过PromptID为唯一任务索引,将能力标准化工具化,通过As Code形式对任务进行编排。

多意图识别:

方案一:多轮Function Call 方案二:生成代码最终选择生成代码的方案,因为多轮function call实现上无法解决任务顺序问题,而通过生成的代码是可行的。

数据增强方法:

  1. 收集种子指令:收集新需求,人工编写简单种子指令。
  2. 指令多样化:参考self instruct、evol instruct 宽度变换的做法,对种子指令进行多样性变换,覆盖更多的领域、主题、形式等。
  3. 指令复杂化:参考evol instruct 深度变换操作,为种子指令添加约束,让指令变得复杂,为每个指令增加3-10个约束条件。
  4. 指令泛化:对进化后的指令同意改写,进一步丰富表达方式和形式,每个指令改写3-5种形式。

对比学习方式:

针对差别较小,难以区分的任务,例如:约束漏点、否定约束、数字要求等任务,专门构造对比样本,加入sft或者进行强化学习。这类样本可以加入sft阶段学习,可以构造pair数据,加入偏好学习阶段。

公式生成:

使用思维链(COT)+代码生成(POT)的方式,解决公式嵌套带来的效果不稳定的问题。COT迫使模型将推理过程划分为中间步骤,类似于人类的认知过程,将复杂的挑战分解为更小、更易于管理的部分。PoT提供了一个更清晰、更具表达力和基础的答案推导模型,提高了准确性和理解力。

图表生成:

图表生成的核心部分包括6个模块,其中拒识、分步改写、代码生成三个模块是基于大模型的推理模块,背后模型均经过了模型精调。拒识模型能够识别用户问题和表格的相关性,对与表格无关的问题或非绘图问题进行拒绝回复。分步改写模型针对不同表格和不同问题,将绘图步骤拆解为多个可执行步骤。代码生成模型根据绘图步骤生成python表格可视化代码。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-05-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 技术架构:
  • 文档AI中台:
  • 多意图识别:
  • 数据增强方法:
  • 对比学习方式:
  • 公式生成:
  • 图表生成:
相关产品与服务
TI-Matrix 应用平台
TI-Matrix 应用平台是基于腾讯云和腾讯优图强大技术能力打造的全栈式人工智能服务平台,致力于帮助加速企业的数字化转型及促进 AI 行业生态共建。平台支持快速接入各种数据、算法和智能设备,并提供可视化编排工具进行服务和资源的管理及调度,进一步通过 AI 服务组件集成和标准化接口开放,降低 AI 应用开发成本。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档