自动驾驶也来蹭Chat GPT,究竟是起名字还是真有料?
今天,毫末智行宣布自动驾驶认知大模型“DriveGPT”正式升级,并将在2023年4月的HAOMO AI DAY上公布最新重要进展。
毫末称这是全球首个自动驾驶认知大模型,他们通过“人类反馈强化学习(RLHF)”技术对自己的自动驾驶汽车进行不断优化。
他们的自动驾驶决策算法经历了三个阶段的进化。他们构建了一个包含“旧策略、接管策略、人工label策略”的Pairwise排序模型,并在此基础上构建了自动驾驶决策的奖励模型。通过这一大模型,在各种规划场景情况下做出最优的决策。
毫末DriveGPT已完成模型搭建和第一阶段数据的跑通,参数规模可对标GPT-2的水平。下一步,DriveGPT将持续引入大规模真实接管数据,通过人驾数据反馈的强化学习,来不断提升测评效果。同时,DriveGPT也将被用来评估车端小模型的驾驶效果。
领取专属 10元无门槛券
私享最新 技术干货