首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI发布首个视频生成模型Sora,谷歌/微美全息全面进军AI科技领域

2023年,OpenAI凭借聊天机器人ChatGPT一跃成为AI大模型领域的一哥,2024年序幕拉开之时,这家风头无两的明星初创公司再次揭开了其庞大野心的神秘面纱。

2月16日凌晨,OpenAI 首个文生视频模型Sora正式亮相,颠覆了全球AI生成视频市场的格局。至此,大模型,GPU和人形机器人两大硬件领域,搜索、文生视频软件领域都有OpenAI的身影。

据介绍,OpenAI发布的新AI产品Sora,用户只需输入文本,即可生成一段极其逼真且富有想象力的视频。OpenAI称,Sora能够根据文本指令生成一段60秒的视频,同时保持视觉质量。

Sora可生成具有多个角色、特定类型运动、精确主题和背景细节的复杂场景。还可以在单个生成视频中创建多个镜头,准确保留角色和视觉风格。分析人士称,这是一个新的研究方向,也是2024年值得关注的一个趋势。

根据OpenAI科学家Tim Brooks表示:“建立一套大模型,能够理解视频,理解我们世界中所有这些非常复杂的交互,是未来所有AI系统的重要一步。”

谷歌加速修复AI助手Gemini问题

可以说是,AI世界无处不Open。2 月 18 日消息,谷歌(GOOG.US)近期对其人工智能项目进行了一次重大更新,将 Bard 更名为 Gemini 并发布了诸多新功能,例如支持移动端使用。

谷歌还更新了 Gemini 应用,使其在用户说完话后自动输入语音请求。此举旨在让使用 Gemini 的感觉更接近于使用经典的谷歌助手。Gemini 的移动应用最初仅在美国提供,但现在已经扩展到更多国家/地区。

时至今日,AI企业掏出了年度“杀手锏”,以 ChatGPT 的火爆全球作为开局,以支持图像输入的多模态大模型 GPT-4 的推出作为契机,大模型的潜力开始在内容生成领域发挥技术优势,全球顶尖的科技公司和想要抓住 AI风口的企业开始争先恐后入局。

微美全息加速向AI集中

无疑,2024年是AI元年,资料显示,AI视觉前锋企业微美全息(WIMI.US),涉及生成式AI、大型语言模型推理和训练,3D图形渲染、模型模拟等场景,致力成为AI大模型时代的引领者和普及者,以提供更好的面向企业客户的AI解决方案。

自GPT-4横空出世后,数字人朝着智能化、便捷化、精细化、多样化方向发展,进入加速增长阶段。伴随AI模型的智能水平、学习能力大幅增强,落实到虚拟人制作环节,即可用少量样本的学习完成虚拟人形象的生成,对制作效率的提升显著。据介绍,借着AI的东风,微美全息已在AI数字人赛道火了一把,更多数字人以新面貌出现,逐步向智能化迈进。

随着AI技术的不断升级,在AI的赋能下,微美全息通过提供集成平台,降低制作门槛,AI数字人可以进行实时互动直播、数字讲解等等。并且迅速实现B端流量的商业化变现,微美全息AI技术有望推进虚拟人产业在企业端的普及和流量变现,刺激B端对虚拟人的需求增加,推动产业加速发展。

未来随着政策的支持以及行业技术供给能力持续增强,生成式AI产业规模将持续扩大,行业发展前景广阔。需要注意的是,微美全息旗下的全息云平台,为加速资源向AI的集中,专门负责AI技术研发,旨在推动AI快速向前发展做好了充分准备。面向未来,微美全息或将成为新一代生成式AI和大规模AI模型的可靠推动者。

结尾

回溯来看,在这场AI公司、资本交织的游戏中,技术迭代一直是跳跃式的。未来的世界和AI行业究竟会驶向何方?还难以断言,但眼下,必将又是刺激的一年。目前唯一可以确定的是,2024年,AI又将更加深刻地影响大众每一个人的生活,在通往通用人工智能的道路上,如何保持对 AI 技术领域的持续高投入,将成为今年各大厂必须面对的课题。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OyNj6ungGEf-E2e4Mq6-Bz1Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券