2023年,OpenAI凭借聊天机器人ChatGPT一跃成为AI大模型领域的一哥,2024年序幕拉开之时,这家风头无两的明星初创公司再次揭开了其庞大野心的神秘面纱。
2月16日凌晨,OpenAI 首个文生视频模型Sora正式亮相,颠覆了全球AI生成视频市场的格局。至此,大模型,GPU和人形机器人两大硬件领域,搜索、文生视频软件领域都有OpenAI的身影。
据介绍,OpenAI发布的新AI产品Sora,用户只需输入文本,即可生成一段极其逼真且富有想象力的视频。OpenAI称,Sora能够根据文本指令生成一段60秒的视频,同时保持视觉质量。
Sora可生成具有多个角色、特定类型运动、精确主题和背景细节的复杂场景。还可以在单个生成视频中创建多个镜头,准确保留角色和视觉风格。分析人士称,这是一个新的研究方向,也是2024年值得关注的一个趋势。
根据OpenAI科学家Tim Brooks表示:“建立一套大模型,能够理解视频,理解我们世界中所有这些非常复杂的交互,是未来所有AI系统的重要一步。”
谷歌加速修复AI助手Gemini问题
可以说是,AI世界无处不Open。2 月 18 日消息,谷歌(GOOG.US)近期对其人工智能项目进行了一次重大更新,将 Bard 更名为 Gemini 并发布了诸多新功能,例如支持移动端使用。
谷歌还更新了 Gemini 应用,使其在用户说完话后自动输入语音请求。此举旨在让使用 Gemini 的感觉更接近于使用经典的谷歌助手。Gemini 的移动应用最初仅在美国提供,但现在已经扩展到更多国家/地区。
时至今日,AI企业掏出了年度“杀手锏”,以 ChatGPT 的火爆全球作为开局,以支持图像输入的多模态大模型 GPT-4 的推出作为契机,大模型的潜力开始在内容生成领域发挥技术优势,全球顶尖的科技公司和想要抓住 AI风口的企业开始争先恐后入局。
微美全息加速向AI集中
无疑,2024年是AI元年,资料显示,AI视觉前锋企业微美全息(WIMI.US),涉及生成式AI、大型语言模型推理和训练,3D图形渲染、模型模拟等场景,致力成为AI大模型时代的引领者和普及者,以提供更好的面向企业客户的AI解决方案。
自GPT-4横空出世后,数字人朝着智能化、便捷化、精细化、多样化方向发展,进入加速增长阶段。伴随AI模型的智能水平、学习能力大幅增强,落实到虚拟人制作环节,即可用少量样本的学习完成虚拟人形象的生成,对制作效率的提升显著。据介绍,借着AI的东风,微美全息已在AI数字人赛道火了一把,更多数字人以新面貌出现,逐步向智能化迈进。
随着AI技术的不断升级,在AI的赋能下,微美全息通过提供集成平台,降低制作门槛,AI数字人可以进行实时互动直播、数字讲解等等。并且迅速实现B端流量的商业化变现,微美全息AI技术有望推进虚拟人产业在企业端的普及和流量变现,刺激B端对虚拟人的需求增加,推动产业加速发展。
未来随着政策的支持以及行业技术供给能力持续增强,生成式AI产业规模将持续扩大,行业发展前景广阔。需要注意的是,微美全息旗下的全息云平台,为加速资源向AI的集中,专门负责AI技术研发,旨在推动AI快速向前发展做好了充分准备。面向未来,微美全息或将成为新一代生成式AI和大规模AI模型的可靠推动者。
结尾
回溯来看,在这场AI公司、资本交织的游戏中,技术迭代一直是跳跃式的。未来的世界和AI行业究竟会驶向何方?还难以断言,但眼下,必将又是刺激的一年。目前唯一可以确定的是,2024年,AI又将更加深刻地影响大众每一个人的生活,在通往通用人工智能的道路上,如何保持对 AI 技术领域的持续高投入,将成为今年各大厂必须面对的课题。
领取专属 10元无门槛券
私享最新 技术干货