2023年12月11日,国产多模态大模型智工迎来重磅推新。
中工互联(北京)科技集团有限公司创始人、董事长智振表示:此次更新,智工·工业大模型不仅在模型深度训练上进入了新的阶段,还在多模态融合上进行了一系列引领式的创新。
智工·工业大模型迎来重磅更新
2023年,我国在人工智能领域取得了令人瞩目的成就,尤其是在大模型行业应用领域。随着大数据和计算能力的不断提升,多模态智能成为了人工智能领域的热点之一。毕马威、中关村产业研究院共同发布的《人工智能全域变革图景展望:跃迁点来临(2023)》报告中指出,多模态预训练大模型将逐渐成为人工智能产业标配。这一次,中国人工智能创新领域再次传来了振奋人心的消息。
国产多模态大模型智工被寄予了与谷歌Gemini一较高下的期望。
智工·工业大模型VS Bard(谷歌Gemini)
智工多模态大模型表现如何?通过三个问题,智工·工业大模型和Bard(谷歌Gemini)展开了比拼。
问题01:蓝球和橙色球哪个球更大?
蓝球和橙色球哪个球更大?
智工·工业大模型回答:在这个场景中,一个较大的球(蓝色)与一个较小的球(橙色)相互比较。蓝色球比橙色球大,因此蓝色球是更大的球。
智工回答1号问题
Bard(谷歌Gemini)回答:从图像中可以明显看出,橙色篮球比蓝色篮球更大。橙色篮球的直径约为8英寸,而蓝色篮球的直径约为6英寸。这意味着橙色篮球的体积约为蓝色篮球的1.7倍。
Bard(谷歌Gemini)的答案有待商榷。
谷歌Gemini回答01号问题
问题02:在地图上,飞机模型压在了哪个国家上面?
飞机模型压在了哪个国家上面?
智工·工业大模型回答:在这幅世界地图中,飞机模型压在了美国上面。
智工回答02号问题
Bard(谷歌Gemini)回答:从图片中可以看到,飞机模型的尾翼正好位于美国西海岸。因此,可以推断飞机模型压在了美国上面。
谷歌Gemini回答02号问题
问题03:在这个场景下发生了什么?我们应该做些什么?
在这个场景下发生了什么?
智工·工业大模型回答:在这个场景中,一个大火焰在黑暗中燃烧着,形成了一个巨大的火焰。如果火灾是由人为引起的,我们应该立即通知当地消防部门,以便他们能够快速响应并防止火灾扩散。如果火灾是自然的,我们应该立即离开火场并寻求帮助,以避免受到伤害或死亡。无论是哪种情况,我们都应该保持冷静,遵循当地的安全规定,并尽快向当地消防部门或其他相关机构寻求帮助。
智工回答03号问题
Bard(谷歌Gemini)回答:图片显示了一场火灾。火焰从黑暗中燃烧起来,看起来非常危险。根据图片的背景和标题,这场火灾可能是野火或火灾。如果这场火灾是野火,我们应该立即报警。野火非常危险,可能造成生命财产损失。如果这场火灾是火灾,我们应该立即采取措施灭火。火灾可能会造成严重的损失,甚至危及生命。如果您看到这场火灾,您应该立即拨打当地消防部门的电话。
谷歌Gemini回答03号问题
实测发现,智工·工业大模型的表现与谷歌Gemini相比难分轩轾。
更强大的全能型“数字工人”
国产多模态大模型的崭露头角,成为业界和学术界关注的焦点。
第一,智工·工业大模型在多模态融合方面进行了深入研究。通过有效地融合图像、文本和语音等多种数据类型,使得模型能够更全面地理解和处理信息。这种融合不仅提升了模型的综合智能水平,还为智工·工业大模型在工业领域的应用提供了更加强大的支持。智工·工业大模型将更好地适应不同工业场景和企业个性化的需求,成为全能型的“数字工人”。
第二,多模态大模型智工在模型预训练方面进行了精心设计。借助大规模的数据集和先进的训练技术,智工·工业大模型在模型参数数量和训练效果上都取得了显著的突破。这使得智工·工业大模型在处理复杂工业任务时表现出色,同时也为其在多领域应用中展现出了强大的通用性。
第三,在性能上,智工·工业大模型的表现也让人眼前一亮。从自然图像到工业语言推理上,多模态大模型智工都堪称当前最先进的工业领域大模型产品。
众议智工多模态大模型
智工·工业大模型研发总监鲁曼女士透露,在世界范围内,美国、中国、欧洲等是多模态大模型研究和应用的领先者。中工互联在多模态大模型的研究上布局较早,在文本、图像、视频、音频、工业代码等多个任务上开展了多模态大模型的研究。智工在多模态领域新的突破,对于提升产品在工业领域中的应用至关重要。
智工·工业大模型研发总监鲁曼
在研发过程中,智工·工业大模型注重对于工业领域复杂、专业化语义的理解和上下文推理能力的培养。通过引入“增量预训练+知识编辑+向量数据库”学习方法,智工大模型在和利时领域问答、ST代码知识等方面的问答准确度,实现了对ChatGPT的超越。中工互联进行的Agent模式的研发,也处于行业领先地位。
中工互联首席科学家、复旦大学自然语言实验室教授张奇教授表示:多模态大模型可以用于回答包含图像、音频、视频等信息的开放式问题。面向未来,国产多模态大模型智工的应用领域非常广泛,可以在工业视觉质检、产品设计、实验模拟、设备故障预警等场景下一展所长,赋能工业企业。
中工互联创始人、董事长智振表示:随着智工多模态大模型的推出,国产大模型在世界人工智能领域内的领先地位将进一步巩固,中国将拥有真正服务于高端智能制造的大模型产品。智工不仅代表了我国在大模型和多模态智能领域的技术实力,更为我国在人工智能创新和发展方面注入了新的活力。国产多模态大模型智工将为“工业互联网+大模型”领域带来新的发展契机,成为国产智能科技的亮丽名片,为新型工业化充分赋能。
中工互联创始人、董事长智振
未来应用前景
作为工业领域更强大的多模态大模型,智工·工业大模型将工业企业提高生产效率、降低成本、提升产品质量,实现智能化转型。
在生产制造领域,智工多模态大模型可以提高生产制造的效率和准确性,可以用于工业视觉检测,识别生产线上的产品是否存在缺陷;可用于工业机器人控制,提高机器人的操作精度和灵活性。
智工具身智能工厂演示系统
在工业研发设计领域,智工多模态大模型可以辅助产品研发和设计,可以用于分析产品的性能数据、识别产品设计图纸缺陷,进行产品的优化设计。
此外,在工业经营管理、供应链管理方面,智工多模态大模型也将发挥重要的作用。随着智工多模态大模型技术的不断发展,这些潜在的应用场景将逐步实现。在人工智能时代,传统工业企业将迎来新的范式革命。
领取专属 10元无门槛券
私享最新 技术干货