近日,电车之家获悉毫末智行将发布业内首个自动驾驶生成式大模型毫末DriveGPT雪湖·海若,该技术目前已经完成了40000万公里的量产车驾驶数据训练,参数规模达到1200亿。
毫末智行 CEO 顾维灏介绍,毫末推出的人驾自监督认知大模型就已借鉴了 ChatGPT 的实现思路,采用 RLHF(人类反馈强化学习)技术,通过引入真实人驾接管数据,对自动驾驶认知决策模型进行持续优化。
目前,毫末 DriveGPT 已完成模型搭建和第一阶段数据的跑通,参数规模可对标 GPT-2 的水平。接下来,DriveGPT 将持续引入大规模真实接管数据,通过人驾数据反馈的强化学习,来不断提升测评效果。
领取专属 10元无门槛券
私享最新 技术干货