暂无搜索历史
深度学习作为当今科技领域的关键驱动力,其发展离不开高效的深度学习框架支持。本文聚焦于深度学习领域的两大主流框架 PyTorch 和 TensorFlow,对二者...
导读:这篇由慕尼黑工业大学团队撰写的论文提出了一种创新的感知-语言-动作(PLA)框架,旨在解决当前自动驾驶系统在复杂开放环境中面临的关键挑战。
导读:论文提出了一种名为VPP(Video Prediction Policy)的新型机器人策略框架,通过利用视频扩散模型内部的预测性视觉表示来指导机器人动作学...
导读:文章首先概述了UP-VLA模型的核心创新点及其在机器人控制领域的突破性贡献,随后对论文的各个组成部分进行了深入剖析,包括引言部分揭示的研究背景与问题、相关...
导读:论文针对四足机器人集成机械臂后形成的复杂系统控制难题,提出了一种创新性的解决方案,通过将显式运动学模型融入强化学习框架,有效解决了传统方法面临的局部最优问...
论文提出了一种创新的多传感器紧耦合SLAM框架,通过融合激光雷达、偏振视觉、惯性测量单元、磁力计和光流等多种传感器数据,显著提升了在退化环境(如低纹理、特征稀缺...
本文从摘要介绍到实验验证,系统剖析这一结合大语言模型(LLM)与多智能体强化学习(MARL)的创新框架。论文提出了一种名为YOLO-MARL的新方法,通过单次L...
本文对字节跳动Seed团队发布的GR-3技术报告进行全面解读,该报告展示了一种新型的大规模视觉-语言-动作(VLA)模型及其配套机器人系统ByteMini。文章...
这篇综述论文,系统性地回顾了视觉与语言导航(VLN)领域在基础模型时代的最新进展与研究范式转变。论文摘要开宗明义地指出,随着基础模型(Foundation Mo...
项目地址:https://pku-epic.github.io/TrackVLA-web/
项目地址:https://prince687028.github.io/OpenUAV/
论文明确了人形机器人执行多步操作任务的两大核心矛盾:仿人形态带来的环境兼容性优势与高维控制复杂性之间的冲突,以及单技能演示成功与长时程任务自主性之间的鸿沟。
导读:文章介绍了灵巧抓取在机器人学中的基础地位与现有研究的局限性,并详细剖析了DexGraspVLA框架的层次化架构设计理念与核心创新点。通过对方法部分的深度解...
自动驾驶技术在过去二十年中取得了长足进步,但依然面临着学习复杂性、常识推理不足、可解释性差等核心挑战。香港中文大学、北京航空航天大学和滴滴出行Voyager R...
论文直指机器人灵巧操作领域的核心挑战——数据稀缺问题。作者团队敏锐地观察到,尽管多指灵巧手在理论上具有执行复杂操作的潜力,但现有方法普遍受限于演示数据的规模和质...
论文针对人形机器人执行复杂多步操作任务的挑战,提出了一个创新的三层分层规划与控制框架。研究的核心内容:通过结合低层强化学习控制器、中层模仿学习技能策略和高层视觉...
模仿学习作为机器人获取操作技能的重要范式,近年来取得了显著进展。然而,现有方法在面对新物体、新场景等条件变化时,其泛化能力往往受限。论文提出了一种创新框架,通过...
这篇论文针对视觉语言导航(VLN)领域长期存在的数据稀缺问题,提出了一种创新的数据增强范式RAM(Rewriting-driven AugMentation)。...
项目地址:https://github.com/April-Yz/ManiGaussian_Bimanual
项目链接:https://mit-realm.github.io/def-marl/
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市