观点网讯:11月14日,李开复旗下AI企业零一万物回复了关于开源大模型被指责完全使用LLaMA的架构,只对两个张量名称进行修改的争议。
零一万物表示,GPT是一个业内公认的成熟架构,Llama在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。
零一万物也表示,在大量训练实验过程中,由于实验执行需求对代码做了更名,将尊重开源社区的反馈,将代码进行更新,也更好的融入Transformer生态。
据悉,此前相关人士质疑零一万物新模型就是 LLaMA 的架构,但是为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。
领取专属 10元无门槛券
私享最新 技术干货