「逼真」大概是我们对于表现力极高的一种赞扬,比如在《霸王别姬》中,「袁四爷」看到程蝶衣出神入化的演技后,发出「虞姬再生」的感叹。搜狗 3D AI 主播又何以做到逼真?
说到文生图大模型,Stability AI 在 2022 年推出的 Stable Diffusion 可谓是其中的翘楚,不断地为富有创意的故事讲述者提供他们所需要的 AI 工具。不过,该模型主要用于 2D 图像生成。
看起来,她长得有点儿像新华社记者赵琬微,却可以一秒换装、实时换发型,还可以同时穿梭在不同的虚拟演播室中。
这个AI合成主播就可以——坐姿、站姿零失误播报是基操,而且还是3D,360度取景也hold得住。
前有DALL.E文本生成图像,现有将文字变成 3D场景。近日,苹果 AI 团队发布最新 AI 模型 GAUDI,它是基于 3D 场景的神经架构 NeRFs,可以根据文字生成 3D 室内场景。
衡宇 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT给AI行业注入一剂鸡血,一切曾经的不敢想,都成为如今的基操。 正持续进击的Text-to-3D,就被视为继Diffusion(图像)和GPT(文字)后,AIGC领域的下一个前沿热点,得到了前所未有的关注度。 这不,一款名为ChatAvatar的产品低调公测,火速收揽超70万浏览与关注,并登上抱抱脸周热门(Spaces of the week)。 △ChatAvatar也将支持从AI生成的单视角/多视角原画生成3D风格化角色的Ima
最近,文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮,模型的多模态能力引起广泛关注。
昨日,Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后,又为社区带来了 3D 视频生成大模型「Stable Video 3D」(简称 SV3D)。
本文最初发布于 Medium 网站,经原作者授权由 InfoQ 中文站翻译并分享。
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 这边AI画画的热度还没下去,OpenAI已经连“3D版”AI画画都搞出来了。 没错,用文字生成3D点云模型,还是超——快的那种! 只需要一张英伟达V100卡,两分钟就能生成一个3D小物件,比谷歌的文生3D模型DreamFusion快了接近600倍 (但它们生成的不是同一种3D模型)。 项目代码开源后在网上爆火,英伟达AI科学家Jim Fan甚至大胆预测: 2023年会是3D模型爆发年,可以期待一波3D版Stable Diffusion和MidJourn
生成式 AI 在 3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 只用一部手机,现实中的2D照片就能渲染出3D模型? 没错,无需再手动上传电脑或安装激光雷达,苹果手机自带APP就能生成3D模型。 这个名叫Luma AI的“NeRF APP”,正式上架App Store后爆火: 小如3D装饰模型,兼具灯光和形状细节: 大到整个墓园的3D场景渲染版,都能被很好捕捉: 这样无论是风景、3D物体还是人物,都可以被很好地保存进手机,并快速生成对应的3D模型。 所以这个APP究竟包含什么功能,它又具体要如何使用? NeRF手
来源:新智元本文共2100字,建议阅读9分钟青海羊曲大坝建筑项目将由核心AI操控无人工程车队,用3D打印技术建造。 据《南华早报》和Insider杂志报道,据参与该项目的科学家称,中国正在利用人工智能实质上将青藏高原上的一个水坝项目变成世界上最大的3D打印机。 羊曲大坝将成全球最大3D打印出的建筑物 黄河干流上游的青海羊曲水电站将采用3D打印的相同增材制造工艺,「逐片」建造。工程参与者是无人驾驶的挖掘机、卡车、推土机、摊铺机和压路机,全部由AI规划与控制。 如果工程能按期结束,羊曲水电站将在2024
---- 新智元报道 编辑:袁榭 【新智元导读】青海羊曲大坝建筑项目将由核心AI操控无人工程车队,用3D打印技术建造。 据《南华早报》和Insider杂志报道,据参与该项目的科学家称,中国正在利用人工智能实质上将青藏高原上的一个水坝项目变成世界上最大的3D打印机。 羊曲大坝将成全球最大3D打印出的建筑物 黄河干流上游的青海羊曲水电站将采用3D打印的相同增材制造工艺,「逐片」建造。工程参与者是无人驾驶的挖掘机、卡车、推土机、摊铺机和压路机,全部由AI规划与控制。 如果工程能按期结束,羊曲水电站将
作者 | 李梅 编辑 | 陈彩娴 如今,每隔一段时间就有新的文本生成图像模型释出,个个效果都很强大,每每惊艳众人,这个领域已经是卷上天了。 不过,像 OpenAI 的 DALL-E 2 或谷歌 的 Imagen 等 AI 系统,都只能生成二维图像,如果文字也能变成三维场景,那带来视觉体验势必加倍提升。 现在,来自苹果的 AI 团队推出了 3D 场景生成的最新神经架构—— GAUDI 。 它可以捕捉复杂和逼真的 3D 场景分布,从移动摄像机中进行沉浸式渲染,还能根据文本提示来创建 3D 场景!该模型以 An
作者:王咏刚,SeedV实验室创始人/CEO,创新工场AI工程院执行院长 编者按:ChatGPT/GPT-4的横空出世,已经彻底改变了NLP领域的研究态势,并以其多模态的潜能,点燃了人们心中通往AGI的第一簇火花。 AI 2.0时代因此而至。但新时代的技术列车将通往何方?全新的商业机会又埋藏在何处?SeedV实验室创始人/CEO、创新工场AI工程院执行院长王咏刚认为:多模态算法正处在“寒武纪大爆发”的早期。 以下为王咏刚的笔记全文分享。 △王咏刚 我既是软件工程师,也是投资人和创业者。我曾参与多个成功A
允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI OPPO Find X,世界杯激战正酣时已在巴黎发布。 为了这款承载“未来手机”探索的国产旗舰,OPPO从代言人内马尔,到发布会地点选址,
机器之心报道 编辑:泽南、杜伟 文本到 3D 模型生成的速度一下提升了 600 倍,代码也已开源。 文本生成图像的 AI 最近已经火到了圈外,不论是 DALL-E 2、DeepAI 还是 Stable Diffusion,人人都在调用 AI 算法搞绘画艺术,研究对 AI 讲的「咒语」。不断进化的技术推动了文生图生态的蓬勃发展,甚至还催生出了独角兽创业公司 Stability AI。 技术发展的脚步并没有停止,下个突破可能是 3D 模型生成了:本周,OpenAI 开源的 3D 模型生成器 Point-E 引
从《阿凡达》到《流浪地球》,从好莱坞科幻 3D 电影之最到中国科幻 3D 电影之最,从 2009 年到 2019 年,近十年的岁月,见证了中国 3D 影视制作的快速成长和繁盛,也刺激着赵天奇探索人工智能与影视制作结合应用的信心。
最近,高通展示了他们使用自监督神经网络单眼深度估计,在AR眼镜和智能手机上实现实时3D重建的过程。
【新智元导读】The Inquirer网站称,苹果iOS 12系统将支持横向Face ID解锁,而2018年秋季新品发布会发布的三款iPhone手机,也都将支持Face ID解锁。苹果引领了3D视觉+AI的潮流,旷视对标苹果,整合技术、构建完整产业链,发布“软硬一体”的移动端3D感知全栈解决方案。
内容生产,特别是创意工作,一向被认为是人类的专属和智能的体现。牛津大学计算机学院院长迈克尔·伍尔德里奇2019年写作的《人工智能全传》一书中,“撰写有趣的故事”被列为人工智能“远未实现”的任务之一。
NVIDIA 在 SIGGRAPH 推出首个全球元宇宙平台,并赢得了最佳展示奖。目前处于公测阶段,它对 NVIDIA RTX 和 GeForce RTX GPU 用户免费开放。用户在安装完 NVIDIA Studio 驱动程序后,即可获得更新支持。
作者:胡 璇 腾讯研究院高级研究员 胡晓萌 腾讯研究院研究员、博士后 内容生产,特别是创意工作,一向被认为是人类的专属和智能的体现。牛津大学计算机学院院长迈克尔·伍尔德里奇 2019 年写作的《人工智能全传》一书中,“撰写有趣的故事”被列为人工智能“远未实现”的任务之一。 如今,AI 正大步迈入数字内容生产领域。AIGC(AI Generated Content)不仅在写作、绘画、作曲多项领域达到“类人”表现,更展示出在大数据学习基础上的非凡创意潜能。2023 年 3 月 15 日,多模态信息处理标杆 GP
Facebook正在缓解3D深度学习的麻烦,一次解决一个问题。去年它发布了Mesh R-CNN,该系统可以从2D形状渲染3D对象。今年它发布了PyTorch3D。
就在昨天(8月8日),旷视发起了一场“3D视觉产业先锋研讨会”,并正式对外推出了“软硬一体”的移动端3D感知全栈解决方案。
在现代社会中,人工智能技术得到了广泛的应用。其中,装修设计 AI 软件是一种非常有用的工具,可以帮助人们更加快速、高效地完成装修设计。
你能相信Stable Diffusion只有4个月大,而ChatGPT的出现还不到一个月吗?
对象检测一直是计算机视觉中研究最广泛的问题之一。作为最基本和最基本的检测形式之一,并且其用途无与伦比,对象检测已在许多基于商业计算机视觉的应用中使用。
来自密歇根大学、网易伏羲AI实验室、北航的团队共同研发了一款AI项目——Neural Magic Eye,就专门从2D图像中识别3D物体来。
内容一览:本期整理了 HyperAI超神经官网近期更新的 9 个数据集,涉及人脸识别、姿态估计、自动驾驶三个领域。
基于Stable Video Diffusion的Stable Video 3D(SV3D),只用一张图片就能生成高质量3D网格。
中国女孩偶像组合SNH48最新发布圣诞音乐视频,六位最受欢迎的明星一起唱歌和跳舞,值得注意的是,这六人都有假“替身”。
这一波生成式 AI 技术的爆发,让我们 AI 从业者看到了 AGI(通用人工智能)的曙光。
近日,腾讯优图首个医疗AI深度学习预训练模型MedicalNet正式对外开源。这也是全球第一个提供多种3D医疗影像专用预训练模型的项目,将为全球医疗AI发展提供基础。 许多研究表明,深度学习的发展非常依赖数据量。自然图像领域中存在着许多海量数据集,如ImageNet,MSCOCO。基于这些数据集产生的预训练模型推动了分类、检测、分割等应用的进步。不同于自然图像,医疗影像大部分都是3D结构形态的,同时,由于数据获取和标注难度大,数据量稀少,目前尚未存在海量数据集及对应的预训练模型。 MedicalNet
有别于传统的AI可思考、推理或解决抽象的问题,许多研究人员开始推测,体现AI将成为未来AI技术主流,例如请机器人帮你拿放在楼上书桌上的手机,或者借由一个配戴装置协助视障人士驾驭不熟悉的地铁系统
从大规模的数据中进行预训练,在计算机视觉中得到了广泛应用,也是在特定任务上得到高性能模型的基础。
随着深度学习技术的快速发展,3D检测技术作为关键发展方向之一,在机器人视觉、城市视觉、增强现实等领域发挥重要作用。传统依靠激光雷达的3D检测方法存在传感器昂贵,难以大规模广泛部署、点云缺失纹理信息、分辨率低等问题。建立单目3D检测模型,有效地利用了图像相对于点云的各个优势,以更低的成本部署到实际应用场景。
你一定觉得,AI这种前沿科技,主要活在硅谷西二旗的科技公司、大学和研究院的论文、还有资本的热捧里。
旗下顶级AI实验室腾讯优图,对外开源了腾讯首个医疗AI项目——深度学习预训练模型MedicalNet。
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 10年前,乃至100年前,你长大的那条街道长什么样? △大谷Spitzer 现在,除了用AI修复老影像资料,谷歌还发布了新的「时光旅行」方案。 就像这样,用3D视角,一览1890年到1970年曼哈顿切尔西区的建筑变化。 是不是有点历史更迭内味儿了? 这样一台「时光机器」的引擎,是谷歌推出的基于浏览器的工具集rǝ(音return),主要由3部分组成: 一个众包平台。用户可以上传城市历史地图,将其与现实世界的坐标进行匹配,完成地理修正,并将其矢
许多研究表明,深度学习的发展非常依赖数据量,在医疗图像领域,目前缺乏基于大数据基础的专用预训练模型。 本项目MedicalNet将多个3D医疗数据集集合成大数据集,基于此数据集提供了完整的3D-ResNet系列预训练模型与相应的迁移学习训练代码。 MedicalNet适用的场景 MedicalNet提供的预训练网络可迁移到任何3D医疗影像的AI应用中,包括但不限于分割、检测、分类等任务。 尤其适用小数据医疗影像AI场景,能加快网络收敛,提升网络性能。 MedicalNet功能介绍 支持单卡、多卡训练 支持
之前,我们提到了【两分钟论文#161】AI创建用户界面,前端将失业?神器pix2code!搞得前端界人心惶惶。现在告诉前端界一个好消息,You are not alone!3D建模领域未来也将被彻底颠
AiTechYun 编辑:nanan 2D图像转换为3D 今年1月,Fleisher和Shirin Anlen(该AI的开发人员)写了一个关于图像转换的AI,用来从视频中剔除角色。最近,通过交互式AI
近期新版本更新后,快手App上新增了AR换脸特效,与常见的点缀式手机AR特效不同,这个AR角色的面孔可以由用户自定义。
这句话不是我臆想出来的,而是伊普斯威奇的“未来学家”伊恩皮尔森在迪拜举行的世界政府首脑会议上发表演讲时提出的。此外,皮尔森还称,人类可以通过把大脑和人工智能连接起来,从而使人类和AI具有相同的智商防止AI掌控人类。这个假设中人都成为了“半机器人”。
作者:吴小含 导语 Steering Behaviors 意在使游戏中的AI个体具备真实的运动行为,通过对力的施加与整合,使游戏个体具备类生命体般的运动特征。这项技术并不基于寻路或者别的宏观算法,而是
最近有不少群友运用 AIGC 工具来提升工作效率,我听说连 3D 数字资产的渲染贴图素材都能生成了。
腾讯光影研究室 Tencent GY-Lab 影像前沿 创意无限 魅力光影 与你同行 校招同学敲重点!!! 1 团队介绍 腾讯光影研究室(Tencent GY-Lab)致力于探索泛娱乐综合解决方案,将前沿的AI能力、3D渲染技术,先进的玩法SDK赋能产品,让拍摄特效更丰富,让创作编辑更智能。团队在语义分割、目标检测、分类识别、GAN生成对抗等方面均有深厚的技术积累,目前,QQ、微视等超20款业务产品中均有光影研究室技术的身影。 2 光影的工程能力 Light3D渲染引擎 光影研究室内部开发的L
领取专属 10元无门槛券
手把手带您无忧上云