IT之家 10 月 10 日消息,上海人工智能实验室推出首个图文混合创作大模型书生・浦语灵笔(InternLM-XComposer)并宣布开源,同时上线 GitHub、Hugging Face 及魔搭社区。
据介绍,浦语灵笔基于书生・浦语大语言模型(InternLM),有着强大的多模态性能,可接受视觉和语言模态输入,还可以“一键生成”图文混合文章。
值得一提的是,研究人员采用 5 个主流的多模态大模型评测对 InternLM-XComposer-VL-7B 的能力进行了详细测试,包含:
MME Benchmark: 包括 14 个子任务的多模态模型全面评测,关注模型的感知(Perception)和认知(Recognition)能力;
MMBench: 包括 20 个能力纬度和使用 ChatGPT 循环评估策略的多模态评测;
MMBench-CN:简体中文版本问题和答案的 MMBench 评测;
Seed-Bench: 提供包括人工标注的 1.9 万道多模态多选题目的多模态评测;
CCBench: 针对中国文化理解的中文多模态评测。评测结果显示,在上述 5 项中英文多模态评测中,浦语灵笔均体现出卓越性能。
MME Benchmark 关注模型的感知(Perception)和认知(Recognition)能力,浦语灵笔综合性能领先。MMBench 包括了 20 个能力项,浦语灵笔取得了最佳成绩。
目前,浦语灵笔已开源其中的智能创作和对话(InternLM-XComposer-7B)及多任务预训练(InternLM-XComposer-VL-7B)版本,并提供免费商用。IT之家附官方地址:
开源链接:https://github.com/ InternLM / InternLM-XComposer
技术报告:https://arxiv.org/ abs / 2309.15112
领取专属 10元无门槛券
私享最新 技术干货