暂无搜索历史
2026年6月3日至7日,国际权威学术会议The IEEE/CVF Conference on Computer Vision and Pattern Reco...
刚刚,Anthropic放出藏了俩月的大杀器——Claude Fable 5和Mythos 5,无异于扔下一枚炸弹。
不是因为他发了篇CNS,而是因为他干了一件让很多人手心出汗的事——把几篇顶刊论文的底裤给扒了。而且扒得很成功。
2026 年 6 月,八点八数字正式官宣:旗下 AI 短剧协作平台 AniShort 完成近亿元融资,由北京泰中合领投,多家机构跟投、老股东全线加码。这不仅是企...
拍照、扫描、建模......听上去似乎很简单,可如果你真的动手试试,得到的往往是布满孔洞、边缘扭曲的残缺结果。
近年来,视觉基础模型正在快速改变深度估计、分割、生成等视觉任务,但立体匹配的核心迭代架构却几乎没有发生变化。从经典的 RAFT-Stereo,到 IGEV、Se...
具身智能赛道的竞争,已经从“造机器”的硬件内卷,切入到了“建生态”的下半场。这一次,头部玩家智元(AGIBOT)直接拿出了真金白银来“交朋友”。
在城市街景场景中,Proxy-GS在保持细粒度视觉细节的同时,实现了稳定的实时渲染。我们的方法显著减少了需要解码的锚点(anchors)数量,从而在内存效率和渲...
那个被Anthropic藏了两个月、说「太危险不能公开」的Mythos级模型,第一次交到了所有人手上。
LeCun的LeJEPA到底有没有构建出世界模型?他本人最新发表的论文,解答了这个问题。
这流畅的游戏动作,简直堪比是技术流游戏玩家的实况画面。尤其是茶杯头的躲避跳跃踩灵魂一气呵成,让我们自愧不如。我要有这么快的反应和操作水准,玩丝之歌真不至于红温。
近年来,大语言模型在数学、代码等任务上的表现不断刷新上限,但到了医疗诊断、故障排查这类真实世界任务里,真正困难的是让多个智能体在不确定的动态环境中持续协作推理。
论文标题:HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generati...
从自然图像中准确估计目标数量,是计算机视觉长期关注的基础任务之一。过去十多年,人群计数、车辆计数、细胞计数等方向已取得了长足进展,模型能够在遮挡、密集分布和尺度...
还有AI Agent、GitHub Copilot、Windows开发者工具,全给端上了桌!!!
✨导读:高精地图造价高昂、更新繁琐,一直是自动驾驶规模化落地的拦路虎。澳门大学联合千里科技提出DriveVLN全新任务,依托视觉+自然语言实现无地图自动驾驶导航...
临床诊断本质上是一个多模态进、多模态出的过程。一位放射科医生看疑似肺部病变时,会综合胸片、既往 CT、病史,然后产出多种互补结果:描述发现的文字报告、标注病灶位...
微软正式开源新一代 3.8B 文生图基础模型 Lens。不同于仅发布模型权重的开源方式,本次 Lens 同时公开了模型权重、技术报告、代码仓库、Hugging ...
2026 年 5 月 29 日,WorldArena 世界模型评测榜单最终结果正式公布。同济大学计算机科学与技术学院空间智能团队主导研发的“无界”世界模型,在这...
过去两年,视频生成模型的发展速度,已经快到让人感觉到有点“魔幻现实主义”。前脚大家还在感叹 AI 终于能生成不抽搐的人脸,后脚 Sora、Kling、Seeda...
暂未填写公司和职称
暂未填写个人网址