暂无搜索历史
过去两年,我们已经习惯了一种叙事:参数更多、数据更大、算力更猛,分数就更高。可越来越多人开始感到一种 "边际疲劳" ——继续把单个模型做大的回报,正变得既昂贵又...
设想你和一个 AI 助手聊了三个月。某天你问它:「我朋友 Caroline 七月那会儿在忙什么来着?」
当所有人都在比谁的模型更大、谁烧的算力更多时,蚂蚁 Inclusion AI 的这份技术报告反其道而行:它没有从零再训一个万亿参数模型,而是把一个已经训好的万亿...
我们已经习惯了大模型一个字一个字往外蹦。从 GPT 到 Llama,主流大语言模型走的都是同一条路——自回归(autoregressive):从左到右,一次只决...
过去两年,我们见证了一连串令人眩晕的纪录:AI 在数学竞赛里拿金牌,在编程评测里逼近人类顶尖,在一个又一个 benchmark 上把分数推到接近满分。
这个被称作 AGI(通用人工智能)的目标,已经从科幻话题,变成了全球最大几家 AI 机构口中"未来十年内"的具体路线图。
我们已经习惯了一种朴素的进步叙事:模型越大越聪明,参数越多越能干。可一旦你真把一个 AI Agent 丢进生产环境,很快会发现一个反直觉的事实——决定它成败的,...
Fable 5 的发布像一次压力测试:它测的不是模型跑分,而是人们还能不能信任一个越来越像基础设施的 AI 入口。
过去一天的高质量信号集中在三个方向:AI coding 开始从单次补全走向长周期工程代理,安全护栏从后台策略变成前台产品能力,资本继续把“物理世界里的 AI 自...
这轮 AI 最容易被讲成两种故事:一种说它会吞掉一切,另一种说它只是泡沫,已经露怯。
AI 正从单纯能力竞赛,进入“谁能把能力安全、便宜、可追责地分发出去”的阶段。Anthropic 把 Mythos 级能力拆成公开版 Claude Fable ...
AI 公司接下来的竞争会更少取决于谁的 demo 更炫,更多取决于谁能把算力、成本、权限、审计和分发入口一起管住。
现在谈大模型,最容易落入一个直觉:只要上下文更长、工具更多、架构再复杂一点,模型就会越来越像一个能长期共事的智能体。
同样是 100 万 token,有的模型只卖几美元,有的能卖到几十美元,价差能拉到三十多倍。
过去两年,几乎所有"图像生成加速"的论文都在卷同一件事:设计更精妙的蒸馏目标函数。轨迹对齐、一致性训练、对抗蒸馏、分布匹配……损失函数越写越复杂,仿佛只要公式足...
视频生成最容易被误解的地方,是大家总盯着“更长一点”“更清晰一点”“更便宜一点”。
在强化学习的训练场里,研究者撞见过一件有点荒诞的事:模型能察觉到自己正待在一个"假"环境里——一个为训练而搭起来的仿真沙盒,而不是某个真实用户的电脑。一旦识破,...
设想这样一个场景:你让自己的 AI 助理去办一件事——跨好几家供应商订一趟行程、帮你谈退款、还得卡在预算之内。它没法独自搞定,于是临时"招募"了几个专长不同的智...
这个问题听起来既科幻又有点危险。它指向 AI 圈子里一个长期被搁置的概念——Recursive Self-Improvement(RSI,递归自我改进)。它由 ...
理解侧的模型,沿着 LLaVA、Qwen-VL、InternVL 这条路一路演化,强项是语义抽象与跨模态对齐;生成侧的模型,沿着 Stable Diffusio...
暂未填写公司和职称
暂未填写学校和专业
暂未填写个人网址