首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

零一万物回应大模型架构争议:其研发大模型基于GPT成熟结构 对模型和训练的理解做了大量工作

【零一万物回应大模型架构争议:其研发大模型基于GPT成熟结构 对模型和训练的理解做了大量工作】《科创板日报》14日讯,李开复旗下AI企业零一万物开源大模型被指责完全使用LLaMA的架构 ,只对两个张量(Tensor)名称进行修改。对此,零一万物表示:GPT是一个业内公认的成熟架构,Llama在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。(记者 黄心怡)

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Ozg5GiECQ6slGDuagORTLn2g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券