巴比特讯,10 月 28 日,智子引擎发布多模态大模型“元乘象 Chatimg3.0”,支持多图理解、物体定位、OCR 等功能。据介绍,与 Chatimg2.0 相比,Chatimg3.0 主要进行了两方面的升级,包括第一阶段的预训练(描述、检测、OCR 等多任务训练)以及第二阶段的指令微调(高质量的人工精筛指令集)。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货