首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

活动报名|大模型玩手机?腾讯开源AppAgent,多模态大模型作为智能体的研究与探索

报告主题:AppAgent,多模态大模型作为智能体的研究与探索

报告日期:1月9日(周二)14:30-15:30

主题简介:

如果将语言大模型比喻成一个能思考能交流的大脑,多模态语言大模型则是给大脑赋予了眼睛,让它能够像人一样看到世界。本次报告我将介绍团队在多模态大模型方向的努力与尝试。包括如何更高效的构建图文大模型训练数据集以及图文大模型的应用。

在此次报告中,我将介绍我们团队近期在多模态语言模型方面的研究成果(StableLLava, ChartLlama)与Agent应用(AppAgent)。我将重点介绍我们最近在多模态智能体(Agent)方向的研究成果AppAgent:让图文大模型像人一样操作手机App。

主页地址:https://appagent-official.github.io/

论文地址:https://arxiv.org/abs/2312.13771

报告嘉宾:

张驰博士,现就职于腾讯公司担任研究科学家。2021年博士毕业于新加坡南洋理工大学计算机学院。他的博士研究课题专注于高效低成本的机器学习和计算机视觉算法,目前的研究方向是大模型时代下的多模态模型与AIGC模型。曾在CVPR、ICCV、NeurIPS、TPAMI等顶级国际会议期刊上发表多篇学术论文。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OLDx98NR7SMlcs7RytD3GqPA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券