发布

机器之心

专栏成员
9548
文章
7253504
阅读量
286
订阅数
不吹不黑,拿到邀请码一手实测Manus,还有人0天就复刻出了开源版
昨天,一个叫「Manus」的通用 AI Agent 产品引起热议。它可以完成从文件处理、数据分析、代码编写到内容创作等多种任务,比如帮助用户生成旅行计划、分析股票数据、筛选简历或开发简单的网页游戏。
机器之心
2025-03-07
550
千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
新产品 Mistral OCR 是一种光学字符识别 API,它为文档理解树立了新标准。与其他模型不同,Mistral OCR 能够以前所未有的准确度和认知能力理解文档的每个元素(媒体、文本、表格、公式)。它以图像和 PDF 作为输入,并从有序交错的文本和图像中提取内容。
机器之心
2025-03-07
610
CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集
为此,北京大学、上海人工智能实验室、南洋理工大学联合推出 DiffSensei,首个结合多模态大语言模型(MLLM)与扩散模型的定制化漫画生成框架。
机器之心
2025-03-07
470
DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络(Multi-head Latent Attention, MLA)是其经济推理架构的核心之一,通过对键值缓存进行低秩压缩,显著降低推理成本 [1]。
机器之心
2025-03-07
640
强化学习成帮凶,对抗攻击LLM有了新方法
事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。强化学习也是如此。它既能帮助 AlphaGo 击败顶级围棋棋手,还能帮助 DeepSeek-R1 获得强大的推理能力,但它也可能被恶意使用,成为攻击 AI 模型的得力武器。
机器之心
2025-03-07
440
从自我进化视角出发,全面解析LLM的推理能力技术演进路径
在人工智能领域,大型语言模型的复杂推理研究正成为学术界和工业界关注的焦点。随着 OpenAI 的 O1 以及后续 DeepSeek R1 等突破性成果的发布,这一领域的研究热度持续升温,引发了广泛的学术讨论和实践探索。这些里程碑式的研究成果不仅推动了相关技术的快速发展,也激励着研究者们不断尝试复现并拓展其应用边界。
机器之心
2025-03-07
420
当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?
2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。与此同时,一个隐藏在超大规模模型身后的技术命题浮出水面:如何让千亿参数超大规模 AI 模型真正达到商业级推理速度?这一问题的答案,隐藏在推理引擎 SGLang 的代码仓库中。该项目由 LMSYS Org 发起,并受到 xAI、NVIDIA、AMD 等巨头的青睐,正在通过多项关键技术突破,重新定义 LLM 推理的效率边界。
机器之心
2025-03-07
560
英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。
机器之心
2025-03-06
790
大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC
真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。
机器之心
2025-03-06
570
大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达
该论文的第一作者是清华大学计算机系研究生温佳鑫,蚂蚁技术研究院副研究员关健为共同第一作者。
机器之心
2025-03-06
550
半个世纪后,著名的麦凯猜想终获证明!数学家夫妇终结了一个未解群论难题
故事始于 2003 年,一位名叫 Britta Späthen 的德国研究生首次接触到了麦凯猜想(McKay conjecture),这是数学群论中最大的未解难题之一。
机器之心
2025-03-04
600
北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准
本文是北京大学彭宇新教授团队在多轮交互式商品检索的最新研究成果,已被 ICLR 2025 接收并开源。
机器之心
2025-03-04
870
DeepSeek推出后,移动端AI风向要变
DeepSeek R1 正在对整个科技领域产生巨大影响,颠覆人们有关 AI 的认知。在移动端,革新正在快速发生。
机器之心
2025-03-04
470
多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%
近段时间,DeepSeek R1 推理模型引爆了国内外社交媒体,让人们见识到了大语言模型类人的深度思考能力。
机器之心
2025-03-04
660
ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
近年来,自动驾驶技术快速发展,萝卜快跑已经无缝融入了武汉的交通,不少车企的智驾系统也都上路了。
机器之心
2025-03-04
800
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多次报道过该技术,比如《DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法》。
机器之心
2025-03-03
1090
千万网友围观,两个语音AI开始加密通话,网友:中间真没骂我两句?
两个 AI 智能体语音对话这件事听起来平平无奇,这不就是基操吗?但当他们确认彼此的 AI 身份后,一切变得超乎想象了。
机器之心
2025-03-03
870
ICLR 2025 | 机器人安灯泡、切东西都能拿捏,可操控轨迹跟踪的DexTrack来了
现实世界的机器人距离科幻小说里的机器人世界还有多远?通用灵巧操控何时才能实现?朝着这一伟大的目标,研究通用灵巧操控轨迹跟踪的 DexTrack 便应用而生。
机器之心
2025-03-03
790
DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
就在所有人以为 DeepSeek 预告的 5 天开源告一段落时,今天中午 12 点 11 分,官方 𝕏 帐号再次更新,宣告「开源周」还在继续。不过这第六天 DeepSeek 并没有开源新的软件库,而是介绍了 DeepSeek-V3/R1 的推理系统。
机器之心
2025-03-03
470
16G显存4499元起香爆!AMD RX 9070系列显卡震撼发布,游戏、AI性能狂飙
昨天,芯片巨头 AMD 举办了最新发布会,正式发布了最新的 AMD RDNA 4 图形架构,并推出了采用该架构的 Radeon RX 9000 系列显卡,包括 RX 9070 和 RX 9070 XT 两个型号。这意味着,中高端显卡市场迎来了又一重量级选手,为玩家们提供了更多样的选择。
机器之心
2025-03-03
900
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档