首页
学习
活动
专区
圈层
工具
发布

#论文

信息越来越多,但我们真的更理解技术了吗|从信息流到主题结构:一次技术观察系统的实验

用户2771172

AI 论文每天数百篇,新开源项目不断出现,各家公司持续发布工程博客与技术实践。对技术从业者来说,获取信息已经不再困难——甚至可以说,从未如此容易。

500

只用RGB人类视频学会灵巧手操作:VIDEOMANIP把“看视频学抓取”变成可执行策略

用户2771172

多指灵巧手最难的不是控制器本身,而是训练数据昂贵: 传统方案常依赖可穿戴设备、动捕系统或机器人遥操作采集。本文提出 VIDEOMANIP,目标是直接从普通 RG...

1400

AgenticPay:用自然语言谈生意,大模型议价能力全面测评

用户2771172

想象一下,未来的电商平台上,AI代理代替你去议价砍价——从二手手机到企业软件采购,从度假租房到商业并购,统统交给智能体去谈判。这听起来很美好,但问题是:当前的大...

900

注意力预测模型融合路径规划新策略

用户2771172

在十字路口场景中,自动驾驶车辆面对减速的邻车往往陷入决策困境:选择超车还是跟随?传统系统将预测与规划模块割裂处理,导致系统无法准确理解其他车辆的意图,只能做出保...

900

法律AI评测新基准:模型自主推理能力超越人工设计

用户2771172

当大模型纷纷宣称具备法律推理能力时,一个残酷的现实是:现有评测基准无法真正评估其逻辑推演过程。它们往往将事实记忆与深度推理混为一谈,或将完整的法律论证拆解为孤立...

900

ALIGN:图文推理定位事故点误差<5米

用户2771172

7.95 km——传统文本定位在孟加拉语车祸报道中的平均误差,足以让救护车拐进河里。ALIGN以3步视觉推理将误差骤降至466米,80.5%的事故坐标直接落入5...

100

多智能体编排实现事故响应100%可执行决策

用户2771172

生产事故发生时,海量遥测数据在秒级内涌现,但工程师平均需要8-12分钟才能形成可执行的应对方案。最新研究显示,单智能体LLM在事故响应中表现令人失望——仅能生成...

800

视觉生成中交织文本推理的新路径

用户2771172

当前AI绘画模型在长序列构图与多实体关系理解上的准确率仍低于40%,即使最先进的扩散模型也频繁出现空间关系和逻辑层次的误判。作者指出,传统方法仅在生成前规划或生...

2200

WAR-Re:语义推理让API推荐快3倍

用户2771172

“固定Top-5”常把简单mashup硬塞冗余API,又把复杂场景砍成残血。该论文提出的WAR-Re框架干脆扔掉N值,引入<API_start/stop>令牌,...

1300

视觉轻量模型让自动驾驶秒懂人话

用户2771172

38%碰撞率、300ms延迟、4G OTA——7B车端大模型仍难落地。该论文提出VLDrive,将参数量压至1.3B,视觉token锐减70%的同时导航精度不降...

1500

CT读腹新法:症状秒定位器官

用户2771172

“右上腹隐痛” 输入对话框,Med-SORA在3D CT上即时标红肝、胆、胰,并以概率排序将首诊准确率推高3.2个百分点;该研究首次把“症状→腹部多器官”做成端...

1300

Code LLM推理步数砍半,准确率反升12%

用户2771172

DeepSeek-R1把推理步数翻倍,BigCodeBench通过率却暴跌27%;Gemini-2.0-FT用更多步数将难题成功率抬升79%。这项研究指出,步数...

1100

TPS-BENCH:AI智能体复合任务规划能力首测

用户2771172

复合任务中AI智能体失败率超35%——该论文通过TPS-Bench首次量化这一困境。200个真实场景任务暴露核心痛点:现有基准完全忽略工具调度能力,迫使模型在效...

1100

Kosmos:AI科学家12小时完成6个月科研工作

用户2771172

科学家平均花费6个月验证一个假设,而Kosmos在12小时内完成了42,000行代码分析和1,500篇文献精读。现有AI系统在跨领域科研中始终面临行动链断裂的瓶...

1300

大模型生成科研新思路,概念网络激发创新突破

用户2771172

传统AI构思方法在真实科研场景中的准确率不足40%,仅能识别关键词关联,却难以捕捉科学概念间的深层语义联系。面对海量文献,研究者亟需能够生成兼具创新性与可行性的...

700

浏览器内模糊测试突破AI防御:10轮攻击击溃74%安全机制

用户2771172

用户的AI浏览器助手可能在看不见的地方悄悄执行恶意指令。最新研究发现,主流AI浏览器在10轮攻击测试后,防御崩溃率高达58%-74%。

1800

EDR:多智能体框架让企业AI研究成本降75%

用户2771172

企业研发团队投入数百万构建的AI研究代理,在真实业务场景中的准确率不足40%。面对分散在邮件、数据库和内部报告中的海量信息,传统AI系统如同一个封闭的黑箱。

400

通义 AI 研究员开源:33 亿参数模型超越闭源系统

用户2771172

完成一项深度研究需要多少小时?人类研究员平均耗时3-5小时,而AI研究员仅需数十分钟。当OpenAI、Google等巨头将深度研究系统封闭在黑箱中,研究过程变得...

2100

LocAgent:图引导大模型精准代码定位方案

用户2771172

开发者在调试过程中平均有66%的时间用于定位代码问题。在面对百万行规模的代码库时,手动追踪一个bug常常需要数小时甚至更长时间。传统检索工具频繁失效,难以准确识...

900

NCC发文:高分生态学期刊与论文正在背叛实验

疯狂学习GIS

有一个问题,做遥感的人心里其实都清楚,但很少有人愿意在高分期刊上大声说出来:卫星数据再多、机器学习模型再复杂,也没办法替代一个设计良好的野外控制实验。

1300
领券