2025年12月23日,清华大学智能产业研究院(AIR)研究团队提出“具身认知增强的端到端自动驾驶”新范式。该技术首次将人类驾驶员的脑电信号认知特征融入模型训练,在不增加硬件成本的前提下,显著提升了系统在复杂环境下的规划能力与安全性。
2025年12月23日,清华大学智能产业研究院(AIR)在自动驾驶与具身智能交叉领域取得重要研究进展。团队提出的创新方法旨在解决当前端到端自动驾驶模型在应对突发状况时泛化能力不足的行业痛点。
该研究的核心是独特的“驾驶-思考”(Driving-Thinking)两阶段训练框架。研究团队首先采集了包含道路视频与同步驾驶员脑电信号(EEG)的多模态数据集,并利用通用脑电大模型(LaBraM)提取人类驾驶过程中的潜在认知特征。通过对比学习技术,让自动驾驶的视觉网络在训练中“模仿”人类大脑对交通环境的认知反应。

这项技术的最大优势在于其巧妙的部署方式。在第一阶段通过脑电数据完成认知能力学习后,第二阶段及实际应用中,系统仅需输入常规的车载摄像头视频即可运行,无需在车端额外部署昂贵的脑电采集设备,实现了“以脑教眼”的知识迁移。
实验验证取得了显著成果。在nuScenes数据集和Bench2Drive闭环仿真平台上的测试表明,引入人类认知特征后,主流端到端自动驾驶模型的规划轨迹误差显著降低,碰撞率相对下降了约18%至26%。特别是在前车突然切入等高风险场景下,增强后的模型展现出了类似人类驾驶员的防御性驾驶策略。

业内专家认为,这是首次将人类驾驶认知直接用于增强端到端自动驾驶规划任务的成功尝试。该成果不仅为提升自动驾驶安全性提供了新思路,也为脑启发人工智能(Brain-inspired AI)与具身智能的融合发展提供了重要的理论与实践参考。相关研究成果已被国际人工智能顶级会议NeurIPS 2025接收。

