权威发布:中国人工智能协会自动驾驶入门秘籍
10月12日,中国人工智能学会发布中国人工智能系列白皮书,雷锋网作为邀请媒体见证了白皮书的发布。本文将对《中国人工智能系列白皮书——智能驾驶》进行介绍和精编。
智能汽车是新一轮科技革命背景下的新兴技术,集中运用了现代传感技术、信息与通信技术、自动控制技术、计算机技术和人工智能等技术,代表着未来汽车技术的战略制高点,是汽车产业转型升级的关键,也是目前世界公认的发展方向。
智能汽车在减少交通事故、缓解交通拥堵、提高道路及车辆利用率等方面具有巨大潜能。在此大背景下,中国人工智能协会出台《中国人工智能系列白皮书——智能驾驶2017》,概述汽车智能化发展,分析国内外技术发展现状,从安全性、经济性、互联性、行业性方面具体阐述智能驾驶的社会效益与影响,并详细介绍智能驾驶的技术,包括传感感知技术、定位与导航技术、V2X网联通信技术、决策规划技术结构体系、传感信息融合、任务决策、规划规划、异常处理这些关键决策规划的关键环节。此外,本白皮书还系统地介绍了自动驾驶控制的核心技术组成部分,包括车辆的纵向控制、横向控制、自动驾驶的控制方法、自动驾驶控制技术方案。除了详细技术介绍之外,该白皮书还介绍了模拟仿真技术,包括需求分析、技术方案、并预期未来发展的技术挑战和趋势。
本白皮书是中国人工智能学会理事长、中国工程院院士李德毅、科大讯飞执行总裁胡郁、重庆邮电大学教授王国胤、中国科学院院士谭铁牛等产学研的专家撰写而成,引用了104篇国内外论文、著作等。
以下为白皮书的精编内容:
开篇
自20世纪80年代,在美国国防部先进研究项目局(DARPA,Defense Advanced Research Projects Agency)的支持下掀起了智能车技术研究热潮。1984年由卡耐基梅隆大学研发了全世界第一辆真正意义的智能驾驶车辆,该车辆利用激光雷达、计算机视觉及自动控制技术完成对周边环境的感知,并据此做出决策,自动控制车辆,在特定道路环境下最高时速可达31km/h。
汽车智能驾驶技术的内涵
汽车智能驾驶具有“智慧”和“能力”两层含义,所谓“智慧”是指汽车能够像人一样智能地感知、综合、判断、推理、决断和记忆;所谓“能力”是指智能汽车能够确保“智慧”的有效执行,可以实施主动控制,并能够进行人机交互与协同。自动驾驶是智慧和能力的有机结合,二者相辅相成,缺一不可。
为实现“智慧”和“能力”两方面内容,自动驾驶技术一般包括环境感知、决策规划和车辆控制三大部分。类似于人类驾驶员在驾驶过程中,通过视觉、听觉、触觉等感官系统感知行驶环境和车辆状态,自动驾驶系统通过配置内部传感器和外部传感器获取自身状态及周边环境信息。内部传感器主要包括车辆速度传感器、加速传感器、轮速传感器、横摆角速度传感器等;主流的外部传感器包括摄像头、激光雷达、毫米波雷达以及定位系统等。通过这些传感器提供海量的全方位行驶环境信息。不同传感器的量测精度、适用范围都有所不同,为有效利用这些传感器信息,需要利用传感器融合技术将多种传感器在空间和时间上的独立信息、互补信息以及冗余信息按照某种准则组合起来,从而提供对环境综合的准确理解。决策规划子系统代表了自动驾驶技术的认知层,包括决策和规划两个方面。决策体系定义了各部分之间的相互关系和功能分配,决定了车辆的安全行使模式;规划部分用以生成安全、实时的无碰撞轨迹。车辆控制子系统用以实现车辆的纵向车距、车速控制和横向车辆位置控制等,是车辆智能化的最终执行机构。 “感知”和“决策规划”对应于自动驾驶系统的“智慧”;而“车辆控制”则体现了其“能力”。
汽车智能驾驶技术 分级
美国高速公路安全管理局(NHTSA)将汽车智能化水平分成五个等级:无自主控制;辅助驾驶;部分自动驾驶;有条件自动驾驶;高度自动驾驶。
《中国制造2025》将智能汽车分为DA,PA,HA,FA四个等级,并划分了各自的界限。其中,DA指驾驶辅助,包括一项或多项局部自动功能,如ACC,AEB,ESC等,并能提供基于网联的智能提醒信息;PA指部分自动驾驶,在驾驶员短时转移注意力仍可保持控制,失去控制10秒以上予以提醒,并能提供基于网联的智能引导信息;HA指高度自动驾驶,在高速公路和市内均可自动驾驶,偶尔需要驾驶员接管,但是有充分的移交时间,并能提供基于网联的智能控制信息;FA指完全自主驾驶,驾驶权完全移交给车辆。
自动驾驶VS无人驾驶
自动驾驶是指可以帮助驾驶员转向和保持在车道内行驶,实现跟车、制动以及变道等操作的一种辅助驾驶系统,驾驶员可以随时介入对车辆的控制,并且系统在特定环境下会提醒驾驶员介入操控。同自动驾驶汽车相比,无人驾驶汽车也配备有各类传感器和相应的控制驱动器,但是取消了方向盘、加速踏板和制动踏板,汽车在没有人为干预的情况下自主完成行驶任务。
1921年World Wide Wireless期刊上出版的一篇论文中提出,通过无线通信技术实现无人驾驶技术。1955年美国Barret Electronics公司研制出了第一台自动引导车辆系统AGVS(Automated Guided Vehicle System)。
期后的半个世纪,慕尼黑联邦国防军大学、美国俄亥俄州立大学、德国联邦国防军大学都在推进无人驾驶的研究。
除高校在自动驾驶领域的积极研究外,众多汽车厂商也相继开展了相关研究计划。其中以特斯拉最广为人知,特斯拉开发了自动驾驶系统Autopilot,并安装在了8万辆Model S上。
此外,以谷歌为代表的IT公司在自动驾驶领域的表现也十分活跃,谷歌公司于2009年开始研发无人驾驶技术。2013年,苹果公司也开始想汽车领域进军,开发了智能车载系统CarPlay。CarPlay能够支持“电话”、“音乐”、“地图”、“信息”和第三方音频应用程序。
相比之下,国内在自主驾驶方面研究的起步稍晚。从80年代末开始,国防科技大学先后研制出基于视觉的CITAVT系列智能车辆。后来清华大学在国防科工委和国家“863计划”的资助下从1988年开始研究开发THMR系列智能车。吉林大学、重庆大学也在自主驾驶方面取得一定的成果。国内一汽集团、上汽集团、长安汽车等车企也纷纷涉足自动驾驶。
国内互联网百度公司也在2013年开始了百度无人驾驶汽车项目,其技术核心是“百度汽车大脑”,包括高精度地图、定位、感知、智能决策与控制四大模块。
其中公开性智能驾驶比赛也对智能驾驶发展具有重要的推动作用,比如美国国防部先进研究局所举办的DARPA挑战赛,,掀起了智能驾驶技术研发的热潮。
汽车自动驾驶产业概述
进入了21世纪后,自动驾驶产业得到了足够的重视和发展。传统的车企倾向于从辅助驾驶到自动驾驶的逐步递进方案。图为我国学者于2012年调研得到的辅助驾驶系统的消费认知度情况。
智能驾驶的社会效益
2012年我国平均每天约 280人因交通事故伤亡,相当于一次重大空难。同时,驾驶员是导致交通事故的主要因素。
智能驾驶不受人的心理和情绪干扰,遵守交通法规,按照规划路线行驶,可以有效减少人为所造成的交通事故和拥堵。同时,智能驾驶汽车能够比人类更加精准地计算和使用路权,通过车联网共享交通资源信息,可以最大化利用城市的道路资源。
此外,智能驾驶可以有效地促进节能减排,可以更合理地操控和切换驾驶模式,控制车辆的提速和减速,避免由于驾驶员的不良驾驶习惯导致的车辆能源消耗和尾气排放等问题。
倘若智能驾驶汽车与智能交通、云计算相结合,将可以构建城市智能车指挥调度服务中心,共享交通资源,实现最优的交通出行,将会大大地减少汽车的保有量,从而达到节能减排的效果。
智能驾驶将带来汽车下游产业链的巨大变革,比如汽车驾校的低迷、陪练市场的萎缩、出租车行业的失业、代驾行业的彻底消失、汽车维修行业和保险行业的改变等。
智能汽车从根本上改变了传统的“人一车一路”闭环控制方式,将不可控的驾驶员从该闭环系统中请出去,减少了人为影响因素,由机器驾驶脑实现精确的机器控制,从而大大提高了交通系统的效率和安全性。
国内外相关政策
由于智能驾驶是新兴的技术,各国政策也在研究甚至出台智能驾驶的相关政策。
美国内华达州一直领导着允许智能驾驶汽车上路的立法工作。2011年,内华达州立法委员会通过了美国第一部允许测试智能驾驶汽车的法案。
欧盟在顶层设计、重大研发规划上做了很多工作,未来交通研究计划中强调了车车、车路通信,强调了人车路一体化和道路安全。
法国已于2016年年底前实现全国数千公里道路的联网,并推动道路交通法律法规的修订,满足无人驾驶汽车上路要求。此外,还将向全球汽车生产商开放道路进行无人驾驶汽车的试验。英国政府已表示2017年首次允许无人车在高速公路及重要道路上进行试驾。为迎接无人驾驶汽车的到来,英国还将修改相关的道路交通法规,目前已由英国科学部与交通部开始着手研究。
日本国土交通省则决定最早将于2017年秋季制定有关在高速公路同车道行驶的自动驾驶安全法规。
目前,我国由工信部组织起草的智能网联汽车标准体系方案已形成标准框架体系,该标准体系框架包括基础、通用规范、产品与技术应用、相关标准四个主要部分。
环境感知
智能驾驶的核心不在车而在人,是物化驾驶员在长期驾驶实践中,对“环境感知-决策规划-控制执行”过程的理解、学习和记忆。环境感知作为第一环节,处于智能驾驶车辆与外界环境信息交互的关键位置,其关键在于使智能驾驶车辆更好地模拟人类驾驶员的感知能力,从而理解自身和周边的驾驶态势。
相机、雷达、定位导航系统等为智能驾驶车辆提供了海量的周边环境及自身状态数据,这些以图像、点云等形式呈现的数据包含了大量与驾驶活动无关的信息。选择性注意作为人类自然感知的重要特征,可以帮助智能驾驶车辆聚焦当前驾驶行为,确保智能驾驶的安全性和实时性。环境感知需要遵照近目标优先、大尺度优先、动目标优先、差异性优先等原则,采用相关感知技术对环境信息进行选择性处理。
智能驾驶车辆上安装的每类传感器也都有自身的感知盲区。智能驾驶过程中,通过组合使用多类传感器和运用时序关联的感知技术,可以缩小感知盲区的范围,一般不会影响正常驾驶。
环境感知功能系统构成
智能驾驶车辆获取和处理环境信息,主要用于状态感知和V2X网联通信。V2X(即Vehicle to Everything,车辆同所有交通参与者)网联通信强调了车辆、道路、使用者三者之间的联系, 主要利用RFID(Radio Frequency Identification,射频识别)、拍照设备、云服务器等获得实时路况、道路信息、行人信息等一系列交通信息,从而提高驾驶安全性和驾驶效率。
状态感知主要通过车载传感器对周边及本车环境信息进行采集和处理,包括交通状态感知和车身状态感知。V2X网联通信是利用融合现代通信与网络技术,实现智能驾驶车辆与外界设施和设备之间的信息共享、互联互通和控制协同。
按照获取交通环境信息的途径,可将这些传感器分为两类:1)被动环境传感器,主要包括相机等视觉传感器和麦克风阵列等听觉传感器2)主动环境传感器,主要指激光雷达、毫米波雷达和超声波雷达。
系统硬件配置方案
可用于智能驾驶环境感知的硬件设备有很多,主要包括相机、激光雷达、毫米波雷达、超声波雷达、GPS、BDS、INS等。目前智能车上采用的配置方案往往是多种型号或多种类型设备的组合。如下图
-
相机
无论是单目相机、双目相机,还是多目相机、深度相机,无论像素再清晰、采样速率再高,也无法解决所有图像采集和处理的难题。由于道路环境、天气环境的多样性、复杂性以及智能驾驶车辆本身的运动特性,相机容易受到光照、视角、尺度、阴影、污损、背景干扰和目标遮挡等诸多不确定因素的影响。
-
雷达
雷达对光照、色彩等干扰因素具有很强的鲁棒性,但是无论安装多少数量/种类的雷达、选取多高的采样速率,都不可能彻底解决凹坑反射、烟尘干扰和雨、雪、雾等恶劣天气条件下的探测难题。
-
定位系统
定位导航系统为智能驾驶提供了高精度、高可靠定位、导航和授时服务,RTK(Real-Time Kinematic,载波相位差分技术) + INS组合更是为实时精准定位和位置精度保持奠定了重要基础。但是无论位置服务公共平台多好、陀螺精度多高,还是存在采样频率不够、地理环境过于复杂、初始化时间过长、卫星信号失效等问题,因此定位导航系统总是存在缺陷。
传感感知技术
感知功能的实现既需要合适的感知设备,也离不开相应的感知技术。按照传感器获取的信号类型,可分为相机视觉、雷达传感和听觉传感。
-
相机视觉
在智能驾驶中,相机取代人类视觉系统作为交通环境感知的传感器之一。相较于其他传感器,视觉传感器安装使用的方法简单、获取的图像信息量大、投入成本低、作用范围广,并且近些年更是得益于数字图像处理技术的快速发展和计算机硬件性能的提高。但是在复杂交通环境下,视觉传感器依然存在目标检测困难、图像计算量大、算法难以实现的问题,视觉感知技术在应对道路结构复杂、人车混杂的交通环境时也还存在很多不足。
视觉感知技术主要包括三种:
-
1)单目视觉技术,即通过单个相机完成环境感知任务,具有结构简单、算法成熟并且计算量较小的优点,但是感知范围有限、无法获取场景目标的深度信息;
-
2)立体视觉技术,基本原理是采用2个(或多个)相机从不同视点观察同一目标,并通过计算图像像素间位置偏差恢复三维场景,难点在于寻找多个相机图像中匹配的对应点;
-
3)全景视觉技术,成像视野较宽,但图像畸变较大、分辨率较低。
-
雷达传感
在国内外智能驾驶车辆开发过程中,传感感知技术研究的重点除了视觉就是雷达。雷达通过对目标发射电磁波并接收目标回波来获得目标的距离、方位、距离变化率等信息。
(1)雷达传感器
雷达传感器一般由发射机、发射天线、接收机、接收天线、显示器、处理部分以及电源设备、数据录取设备、抗干扰设备等辅助设备构成。按照电磁波的波段,雷达分为三类:激光雷达、毫米波雷达、超声波雷达。
雷达受外界环境影响小,获取的深度信息可靠性高,测距范围和视角大、准确度高。另外,雷达每帧接收的点云数据量远小于相机记录的图像信息,更能满足智能驾驶对实时性的需求。雷达的最大缺点在于制造工艺复杂、成本很高,在一定程度上使其广泛应用受到限制。
目前激光雷达常用的感知技术主要有:
-
障碍物检测与跟踪,关键在于同一时刻障碍点的聚类和不同时刻障碍物的匹配,基于深度学习的雷达障碍物检测逐渐成为近年来的研究热点,雷达与图像融合的障碍物检测技术研究也取得了一定成果;
-
路面检测,主要是为了区分路面和道路上的其他目标障碍物,还可以通过检测路面材质和坡度为智能驾驶车辆决策和控制提供数据参考;
-
定位与导航,基于激光雷达的SLAM在智能车定位中可以发挥重要作用,智能车通过检测路边障碍物位置判断道路走向并实现基于雷达的自主导航;
-
三维重建,利用激光雷达获取的深度信息即可以实现智能车周围环境的三维场景重建。
目前大部分智能驾驶车辆仅依靠视觉感知和雷达感知,已经能够完成绝大多数交通环境感知任务,因此往往忽略了听觉感知。交通环境中有许多声音也会携带重要信息,例如喇叭、警笛等智能驾驶车辆同样需要对环境中的声音有所感知并做出反应。
-
听觉传感器
按照相对于智能车辆位置区域的范围,听觉感知能力可分为三类:1)个域听觉感知2)局域听觉感知3)广域听觉感知。
听觉感知系统主要涉及三种关键技术:声源定位技术、音频识别技术和软件无线电技术。
目前常用的声源定位技术按其定位原理可分为三大类:
-
基于最大输出功率的可控波束形成技术,关键在于对接收的信号的滤波及加权求和,并控制阵列波束指向最大输出功率对应的方向;
-
基于高分辨率谱估计的定位技术,通过求解所接收信号与阵列间的相关矩阵确定信号源方向和位置;
-
基于声达时间差的定位技术,主要是利用声源信号到每个麦克风阵元的时间差估计来实现测向和测距。
定位与导航技术
智能驾驶的基础是自主导航,不仅需要获取车辆与外界环境的相对位置关系,还需要通过车身状态感知确定车辆的绝对位置,因此定位与导航也是环境感知的关键技术之一。
-
感知态势的基准
智能驾驶车辆的位置数据不可能脱离感知态势的基准,目前在智能驾驶中常用的基准包括:大地坐标系(WGS-84/ CGCS 2000)、摄像机坐标系、图像坐标系、雷达坐标系、驾驶员认知坐标系等。
目前主要有GPS、北斗卫星导航系统、GLONASS和GALILEO四大全球卫星导航系统,我国常用的为GPS和北斗卫星导航系统。
卫星导航定位技术按照定位方式分为单点定位技术和相对定位技术。
相对定位又分为静态定位和动态定位两种类型,其中实时动态定位RTK技术是一种新的常用的卫星定位测量方法。RTK是一种基于载波相位观测值的定位技术,利用了参考站和移动站之间观测误差的空间相关性。与以前的静态定位和动态定位不同,RTK无需事后结算即可在野外实时得到厘米级的定位精度,成为卫星定位应用的重大里程碑。
(2)惯性导航系统
惯性导航系统(简称惯导)由陀螺仪和加速度计构成,通过测量运动载体的加速度和角速率数据,并将这些数据对时间进行积分运算,从而得到速度、位置、姿态和航向。
惯性导航系统能够提供包括水平姿态、方位、速度、位置、角速度和加速度等的全面的导航信息,而且数据更新率高、连续性好、噪点低、短期精度和稳定性高。惯导也存在其固有缺陷:定位误差会随时间而增大,数据的长期精度较低,而且无法获取时间信息。另外,惯导在每次使用之前需要较长时间的初始化,在智能驾驶过程中如果出现断电等突发状况,往往需要重新初始化。
交通环境复杂多变,单一的导航系统往往会受限于自身的不足而无法确保精准定位和导航,因此当前的智能驾驶车辆大多采用GPS/BDS + INS的组合导航方式。
-
姿态和状态感知
智能驾驶车辆环境感知系统对车体的感知包括两部分:车身姿态感知和车身状态感知。
(1)车身姿态感知:主要指对车辆航向角、侧倾角和俯仰角的感知,一般通过惯导或者陀螺仪来获取这些参数。
(2)车身状态感知:主要包括对车辆行驶速度、纵向加速度、发动机转速、方向盘转角、节气门开度、制动主缸压力等车辆状态信息的感知。
测试技术
智能驾驶对定位导航系统的性能有一定的要求,需要通过测试得到性能指标数值作为衡量依据。
测试指标一般包括:
1)首次定位时间,用于测试接收终端搜索信号的速度;
2)定位测速精度,一般包括水平和高程定位精度;
3)失锁重捕时间,能够反应接收终端在信号失锁后恢复定位的快慢;
4)跟踪灵敏度,主要评估定位状态下接收机维持定位精度所需的最小信号功率;
5)捕获灵敏度,代表了失锁状态下接收机捕获弱信号的能力。
实际驾驶时,车辆在不同场景下对导航系统的定位性能需求不同,因此导航系统的性能测试一般会有针对性地设置特定场景。地图也包括数字地图、驾驶地图等两种形式。
-
V2X网联通信技术
近年来,随着物联网、大数据、“互联网+”等新技术的兴起,智能交通系统(ITS,Intelligent Transport System)在智能网联、车联网方面也有了长足发展。
V2X网联是基于物联网,运用D2D(Device to Device,终端直通)以及信息通信等技术实现车辆与外界互联的无线通信技术。2017年9月19日,我国首部V2X应用层团体标准《合作式智能交通系统 车用通信系统应用层及应用数据交互标准》正式发布。
智能驾驶对V2X网联通信提出了以下几点技术要求:网络接入时间短、传输时延低、传输可靠性高、干扰性低、信息安全性高、频谱可再利用。另外,还需要对海量数据进行分析与处理,这就要求V2X技术可以合理借助各类感知传感器,并从获取的数据中探索规律进行有效表示。
V2X技术的实现一般基于RFID、拍照设备、车载传感器等硬件平台。V2X网联通信产业分为DSRC(Dedicated Short Range Communication,专用短程协议)和LTE-V2X两个标准和产业阵营。
DSRC的设备组成包括车载单元(OBU,On Board Unit)、路边单元(RSU,Road Side Unit)、控制中心等。DSRC的优势在于技术成熟可靠,能够保证低时延和安全可靠性,因此依然是当下市场主流的V2X标准。DSRC能够支持的最高车速为200km/h,数据传输速率一般为12Mbps,反应时间为100ms以内,低时延达到20ms。另外也存在一些不足,包括覆盖范围小、传输速率低、易受到建筑物遮挡、处理大量数据较慢、建设成本较高等。
目前,DSRC在不停车收费(ETC系统)、车队管理、出入控制、信息服务等领域已经有广泛应用。
LTE-V2X
LTE-V2X基于现有蜂窝移动通信支持(3G/4G),拥有自主知识产权。
工信部、发改委和科技部等政府部门和高通、华为等公司也在大力推动LTE-V2X技术的产业化发展。LTE-V2X技术按照通信方式分为集中式(LTE-V-Cell)和分布式(LTE-V-Direct)两种,如图2-6所示。LTE-V-Cell以基站为分布中心,需要现有蜂窝网络的支持,具有带宽大、覆盖广的通信特点,能免实现远距离通信;LTE-V-Direct独立于蜂窝网络,是一种车辆与周边环境节点直接通信的技术,具有低时延、高可靠的优势。
目前,LTE-V2X仍在研发测试阶段,但是已形成可运营的完整网络体系,能够在高频段(5.9GHz)、高车速(250km/h)、高车流量的环境下提供可靠的通信能力,并且在大容量、低时延、抗干扰性以及可管理性等方面更为成熟。
决策规划
决策规划是自动驾驶的关键部分之一,决策规划按照划分的层面不同可分为全局规划和局部规划两种。
全局规划是由获取到的地图信息,规划出一条在一些特定条件下的无碰撞最优路径;局部规划则是根据全局规划,在一些局部环境信息基础上,能避免撞上未知的障碍物,最终到达目标点的过程。
轨迹规划是智能汽车自主驾驶行为必须涉及到的一项研究,运动轨迹规划是在静态路径规划的基础上考虑时间因素和车辆的运动学、动力学约束条件,并根据车辆当前的位姿以及传感器收集到周围环境的状态信息,考虑智能汽车的内在约束条件( 如非完整约束) 和车辆的运动学、动力学约束条件对轨迹生成的影响,规划出可行的参考轨迹。最后将轨迹以控制量的方式供给到后续的控制系统,使得车辆可以沿着相应的轨迹行驶,避免碰撞。
决策规划技术结构体系
决策规划技术结构体系包括分层递阶式体系结构、反应式体系结构、混合式体系结构。以下的三张图为三种体系结构的图解。
决策规划系统的关键环节
智能驾驶决策规划系统的开发和集成基于递阶系统的层次性特征,可分为四个关键环节,分别是信息融合、任务决策、轨迹规划和异常处理。
传感信息融合是将多个传感器的输出信息统一在车辆坐标系下,建立具有时间标记的数据关联和融合,以保证场景数据信息的连贯性和适用性。任务决策作为智能驾驶的智能核心部分,接收到传感感知融合信息,通过智能算法学习外界场景信息,从全局的角度规划具体行驶任务,从而实现智能车辆拟人化控制融入整个交通流。轨迹规划是根据局部环境信息、上层决策任务和车身实时位姿信息,在满足一定的运动学约束下,为提升智能汽车安全、高效和舒适性能,规划决断出局部空间和时间内容车辆期望的运动轨迹,包括行驶轨迹、速度、方向和状态等。
异常处理作为预留的智能驾驶系统安全保障机制,一方面是在遇到不平及复杂路面易造成车辆机械部件松动、传感部件失效等问题时,通过预警和容错控制维持车辆安全运行;另一方面是决策过程某些算法参数设置不合理、推理规则不完备等原因导致智能汽车在行为动作中重复出现某些错误并陷入死循时,能够建立错误修复机制使智能汽车自主的跳出错误死循环,朝着完成既定任务的方向继续前进,以减少人工干预来解决问题,这是提高车辆智能化水平的必需。
决策规划技术方法
决策规划是智能汽车导航和控制的基础,从轨迹决策的角度考虑的,可分为全局规划和局部规划两个层次。
-
全局规划方法
(1)基于状态空间的最优控制轨迹规划方法
在状态空间进行轨迹规划的方法主要有最优控制方法。最优控制方法是指通过最优控制理论找到可行的控制量 ,使得系统 能够沿着可行轨迹 行驶,该轨迹能够使得评价函数 最小。将评价函数和系统的状态方程联系起来,只有系统状态方程的约束条件满足,评价函数才能置零,求得可行的轨迹 。
(2)基于参数化曲线的轨迹规划方法
B样条曲线由一组称作控制点的向量来确定,这些控制点按顺序连接形成一个控制多边形,B样条曲线就是逼近这个控制多边形。通过确定控制点的位置,可以控制曲线的形状。由于B样条曲线具有曲率连续的优点,在相邻曲线段的节点处曲率也是连续的[31],且具有局部支撑性等特点,如果轨迹局部的约束条件不满足,可以通过调整相应控制点的方法来对轨迹进行修正,而不影响其它的轨迹段,具有应用性强的特点。
(3)基于基于系统特征的轨迹规划方法
微分平坦法是基于系统特征的一种轨迹规划方法。微分平坦是指可以找到一组系统输出,使得所有状态变量和输入变量都可以由这组输出及其导数决定(不需积分)。不过该方法在规划轨迹的过程中没有考虑最大曲率和最大曲率变化率的约束条件。文献针对路径规划给定的路径函数信息,通过微分平坦的方法规划出系统输入及状态的时间相关的轨迹函数,在满足车辆侧向加速度约束的情况下使得系统的某性能指标最优。
-
局部规划方法
局部路径规划的方法主要包括以下两个关键部分:(1)建立环境模型,即将智能汽车所处现实世界抽象后,建立计算机可认知的环境模型;(2)搜索无碰路径,即在某个模型的空间中,在多种约束条件下,选择合乎条件的路径搜索算法。
-
路权分配技术
路权(Right of Weight,ROW),是指道路使用者依据法律规定,在一定的时间对一定的道路空间使用的权力。在智能驾驶中,路权可以用来描述满足车辆当前安全行驶所需要的道路空间。
路权与车速强相关,可分为期望路权和实际路权,当两者不一致时,就需要进行调节来解决冲突。自主驾驶是智能汽车在任意时刻对路权的检测和使用,多车交互是车群在任意时刻对路权的竞争、占有、放弃等协同过程。自主驾驶的不确定性,体现在车辆行驶中拥有的路权在不停地发生变化。
控制工程篇
智能驾驶的整个流程归结起来有三个部分,首先,是通过雷达、像机、车载网联系统等对外界的环境进行感知识别;然后,在传感感知融合信息基础上,通过智能算法学习外界场景信息,规划车辆运行轨迹,实现车辆拟人化控制融入交通流中;其次,跟踪决策规划的轨迹目标,控制车辆的油门、刹车和转向等驾驶动作,调节车辆行驶速度、位置和方向等状态,以保证汽车的安全性、操纵性和稳定性。如果能够默契地进行,那么整个智能驾驶流程就算完成了。
智能驾驶的系统将驾驶认知形式化,利用驾驶认知的图表达语言,设计通用的智能驾驶软件架构。在这一架构中,智能决策模块基于多传感器的感知信息、驾驶地图和车联网通信等先验信息综合形成的驾驶态势完成自主决策。智能驾驶试验平台软件的架构如图所示。
自动驾驶控制核心技术组成
自动驾驶控制的核心技术是车辆的纵向控制和横向控制技术。纵向控制,即车辆的驱动与制动控制;横向控制,即方向盘角度的调整以及轮胎力的控制。实现了纵向和横向自动控制,就可以按给定目标和约束自动控制车运行。
-
纵向控制
车辆纵向控制是在行车速度方向上的控制,即车速以及本车与前后车或障碍物距离的自动控制。巡航控制和紧急制动控制都是典型的自动驾驶纵向控制案例。这类控制问题可归结为对电机驱动、发动机、传动和制动系统的控制。各种电机-发动机-传动模型、汽车运行模型和刹车过程模型与不同的控制器算法结合,构成了各种各样的纵向控制模式,典型结构如图所示。此外,针对轮胎作用力的滑移率控制是纵向稳定控制中的关键部分。
-
横向控制
车辆横向控制指垂直于运动方向上的控制,对于汽车也就是转向控制。目标是控制汽车自动保持期望的行车路线,并在不同的车速、载荷、风阻、路况下有很好的乘坐舒适性和稳定性。车辆横向控制主要有两种基本设计方法,一种是基于驾驶员模拟的方法;另一种是给予汽车横向运动力学模型的控制方法。
自动驾驶控制方法
传统的汽车控制方法主要有:PID控制、模糊控制、最优控制、滑模控制等,这些算法应用都较为广泛。相对于传统的控制方法,智能控制方法主要体现在对控制对象模型的运用和综合信息学习运用上,主要有基于模型的控制、神经网络控制和深度学习方法等,目前这些算法已逐步在汽车控制中广泛应用。
-
基于模型的控制
基于模型的控制,一般称为模型预测控制(Model predictive control,MPC),又可称为滚动时域控制(Moving horizon control,MHC)和后退时域控制(Receding horizon control,RHC),它是一类以模型预测为基础的计算机优化控制方法,在近些年来被广泛研究和应用的一种控制策略。其基本原理可概括为:在每个采样时刻,根据当前获得的当前测量信息,在线求解一个有限时域的开环优化问题1,并将得到的控制序列的第一个元素作用于被控对象,在一个采样时刻,重复上述过程,再用新的测量值刷新优化问题并重新求解。在线求解开环优化问题获得开环优化序列是模型预测控制与传统控制方法的主要区别。预测控制算法主要由预测模型、反馈校正、滚动优化、参考轨迹四个部分组成,最好将优化解的第一个元素(或第一部分)作用于系统。
-
神经网络控制
神经控制是研究和利用人脑的某些结构机理以及人的知识和经验对系统的控制[60]。利用神经网络,可以把控制问题看成模式识别问题,被识别的模是映射成“行为”信号的“变化”信号。神经控制最显著的特点是具有学习能力。它是通过不断修正神经元之间的连接权值,并离散存储在连接网络中来实现的。它对非线性系统和难以建模的系统的控制具有良好效果。一般情况下,神经网络用于控制系统有两种方法:一种是用其建模,主要利用神经网络能任意近似任何连续函数和其学习算法的优势,存在前馈神经网络和递归神经网络两种类型;另一种是直接作为控制器使用。
-
深度学习方法
深度学习源于神经网络的研究,可理解为深层的神经网络]。通过它可以获得深层次的特征表示,免除人工选取特征的繁复冗杂和高维数据的维度灾难问题。 深度学习在特征提取与模型拟合方面显示了其潜力和优势。对于存在高维数据的控制系统,引入深度学习具有一定的意义,近年来, 已有一些研究关注深度学习在控制领域的应用。目前较为公认的深度学习的基本模型包括基于受限玻尔兹曼机 (Restricted Boltzmann machine,RBM)的深度信念网络 (Deep belief network,DBN)、基于自动编码器 (Autoencoder,AE)的堆叠自动编码器 (Stacked autoencoders, SAE)、卷积神经网络 (Convolutional neural networks, CNN)、递归神经网络 (Recurrent neural networks,RNN)。无人驾驶系统需要尽量减少人的参与或者没有人的参与,深度学习自动学习状态特征的能力使得深度学习在无人驾驶系统的研究中具有先天的优势。如何充分利用和发挥深度学习在无人驾驶系统中的优势并发展深度学习在环的无人驾驶系统控制是目前的研究方向。
自动驾驶控制技术方案
根据从行驶环境到驾驶动作的映射过程,自动驾驶控制技术可以分为间接控制和直接控制两种不同方案。
-
基于规划-跟踪的间接控制方法
自动驾驶间接控制是一类基于规划-跟踪的主流智能驾驶车辆控制方法。根据当前车辆行为需求,在满足车辆自身运动学和动力学约束条件下规划出一条空间上可行且时间上可控的无碰撞安全运动轨迹,然后设计适当的控制律跟踪生成的目标轨迹,从而实现自主驾驶。如下图所示
-
基于人工智能的直接控制方法
自动驾驶的直接控制是一类基于人工智能的智能驾驶车辆自主控制决策方法。自动驾驶直接控制方法采用人工智能等手段,建立了从行驶环境到驾驶动作的直接映射过程,具体讲是在认知的范畴内试图建立一种先进的驾驶员模型以完成实际复杂驾驶过程,此外控制过程无需建立被控对象的数学模型,具有较强的机动性和实时性。
基于人工智能决策控制模型本质上是模拟人脑对外界环境信息和车体本身信息的感知(图 4-7),同时由驾驶经验并同在线学习机制来获得持续稳定输出的过程。
人机交互系统
人机交互系统作为智能驾驶的关键技术之一,对于智能汽车发展和应用有着十分重要的作用和意义,包括:进一步提高智能汽车的可靠性和安全性;拥有更强的实用性和更加出色的用户体验;增强智能汽车的灵活性和机动性;提高智能汽车的任务执行力。
智能汽车人机交互系统发展现状目前世界上比较主流的人车交互系统主要有以下几种:奥迪MMI、奔驰COMMAND、宝马iDrive、丰田G-BOOK、苹果CarPlay等人机交互系统。
人机交互系统的核心技术人机界面技术的研究主要针对驾驶员和车辆驾驶信息的交互。
人机交互的核心技术
驾驶员信息交互的研究开始于1970s,但直到1990s车辆导航系统的出现才真正应用到商业产品中。在过去十年间,人们通过驾驶员负荷测量技术研究了驾驶员在利用HMI信息时的精神负担,这方面的研究结果对HMI的设计起到十分重要的作用,并且进一步推动了相关标准和设计准则的制定。
-
人机共驾技术
人机共驾技术的研究主要面向先进驾驶辅助系统。对于辅助驾驶系统,人机交互是其中很重要的一环。随着越来越多的辅助驾驶系统进入产品化的阶段,系统对于车辆的控制权变得越来越大,越来越复杂。因此,如何将多个辅助驾驶系统和驾驶员之间进行集成已经成为当前的一个研究热点。ADAS系统本身就被定义为辅助驾驶系统,这就不可避免的需要考虑到和驾驶员行为之间的交互关系。如果辅助驾驶系统不考虑驾驶员的操纵行为反而会增加车辆行驶过程中的危险性。
-
驾驶行为特性研究
驾驶员在真实道路中的驾驶行为研究是人机共驾技术中十分重要的一部分,也是智能辅助系统的研究的基础。计算机图形学和计算性能的发展使得道路结构和交通车行为的虚拟建模成为可能,这就使得驾驶模拟器可以模拟更为广泛的道路和交通状况。再加上处理器处理能力的发展和成本的下降,驾驶模拟器再次成为驾驶员行为特性研究的有力工具。和真实道路试验相比,驾驶模拟器具有可重复性好,工况设定更为灵活,耗时少,效率高,风险低等优点。尽管驾驶模拟器现在被广泛的应用于驾驶员特性研究中,但是对于通过驾驶模拟器获得的驾驶员特性数据和真实道路试验获得的驾驶员特性数据相比,其可靠性仍然需要进一步的验证。
人机交互系统的发展趋势
通过对目前人机交互系统的研究现状的分析,未来有关人机界面,人机交互和人机共驾可能的发展趋势包括:
在人机交互设计过程中,需要考虑不同人群的需求,这也是未来HMI设计标准和准则的制定方向。
车辆中和驾驶员操纵输入密切相关的部分,如转向盘力感,踏板脚杆,座椅舒适度,体感等,依然会是未来的研究方向之一。更适合驾驶员的操纵输入和身体感知将是一个需要持续努力的研究方向。
对于ADAS系统,驾驶员在获得辅助驾驶的同时,也会分散注意力增加驾驶负担,这是ADAS系统面临的一个重要问题。如何协调好驾驶员基本操纵行为和辅助驾驶系统之间的关系需进一步研究。
未来车辆以及交通领域不仅仅是驾驶员和车之间关系的研究,这一领域所面临的问题可能会是更为广泛的社会问题,需要更多领域的研究人员参与进来,如城市规划师,社会学家,人类学家等。
目前各国虽然都获得大量的驾驶员行为信息的数据库,但是如何将这些数据应用于工程系统中仍有待研究。
测试验证
自动驾驶将历经4至5个阶段才能进入完全无人驾驶的时代。目前可以实用化的技术是高级辅助驾驶(ADAS),而高级自动驾驶、完全无人驾驶等技术正在实验室和封闭、半封闭测试区紧锣密鼓的进行。只有经过长期的测试验证,自动驾驶车辆才能为大众提供安全可靠的出行服务。具体的讲,自动驾驶测试包括软件在环(SIL)、硬件在环(HIL)、车辆在环(VIL)、场测、路测等环节,测试内容包括传感器、算法、执行器、人机界面等等各个环节,测试目的从应用功能、性能、稳定性和鲁棒性、功能安全、形式认证等等。
自动驾驶汽车的开发测试,需要大量的训练数据采集和标注工作。如何有效采集数据,以及如何标记数据,是当前自动驾驶领域的一个热门话题。测试数据的简单标注可以自动化,复杂标注仍然需要大量人力。首先要有标记和训练学习的工作,把环境关键因素提取出来,然后要用图像处理等方式提取与环境其他要素之间的时空关系,这样形成的数据就可以拿来分析建模,包括后续的算法开发和功能测评都可以用。除了训练数据采集,一个全面的评测数据集和合理的评测指标也非常关键。对于不同的任务,不同的技术阶段,需要有不同的评测指标和方法。
在智能驾驶领域,技术的每一步发展都必须以保障个人安全为丈量,于是它的发展除了将带给人们欢喜鼓舞的便利之外,也引发了对其安全性的担忧。自动驾驶汽车的实际道路测试有很大的局限性,需要用模拟仿真测试来弥补。谷歌、特拉斯、Zoox等很多公司借助模拟仿真的方法力图使无人驾驶车的行驶里程尽快达到十亿英里。从软件到硬件的模拟仿真被合理建模时,就会为公司实验和测试他们的无人驾驶汽车模式提供了可能性。它包括各种各样的应用场景,实时交通、司机行为、天气以及道路环境等。
技术方案
Waymo的自动驾驶模拟仿真软件Carcraft
最初开发Carcraft是作为一种“回放”无人车在公共道路行驶经历场景的方式,之后慢慢发展成了仿真,并在Waymo自动驾驶项目中发挥了重大作用。Waymo可以在一天内沿着一条特别复杂的道路模拟行驶数十万次,总行驶里程达到800万英里左右。2016年,与谷歌IRL自动驾驶汽车在实际公共道路上运行的300多万英里相比,Waymo已经行驶了25亿英里的虚拟路程。
仿真测试是Waymo自动驾驶汽车研发中的一部分,仿真将Waymo自动驾驶原型车在实际道路中的测试与中央谷地一个叫做「城堡」(Castle)的秘密基地进行的“结构化测试”项目紧密结合在了一起。Waymo 此前从未公布过「城堡」的内部运作细节。在实际公共道路上进行的测试能够让开发人员知道需要在哪种地形进行额外训练。随后他们将这种地形在秘密基地「城堡」中复刻,使得测试车辆能够在不同的场景中进行训练。在这两种实体测试中,Waymo的自动驾驶原型车捕获了足够数据,未来可以在任何时候进行全数字化的仿真模拟测试。
未来发展的技术挑战和趋势
对于模拟的里程效用真的有用吗?大家所持观点不一。支持一方认为,模拟可以用来模拟罕见情况和基线数据,罕见的情况是指难以重现或足够随机的场景。如果无人驾驶能够提供99%的可靠性,因为大部分场景已经通过模拟得以优化。而AI或ML的一些未来技术迭代则允许我们在没有事先数据预备的情况下,对极端情况做出反应。排除特殊情况之外,仿真对于构建基础数据集也非常有用,并且在此基础上不断进行进一步的测试。反对一方则认为与此相对应的是:模拟环境不够好以至于不能高效地生成模型。通常,这是一个环境与车辆交互的场景,并且很难在现实场景中复现。此外,还存在着图像保真度过低的情景等等。
为了帮助解决有关数据质量的一些问题,研究人员正在测试将虚拟图像输入转化为现实模型的可能性,以改进模拟实验。谷歌曾放出消息,虽然许多政府机构还不愿意将模拟英里数作为规定中的自主驾驶测试所需里程的一部分,但随着对模拟的监管变得更加明确,这种情况可能会发生变化。
如果精确度足够高,那么模拟是有价值的。诚然,模拟可能不会解决的最后1%的自主驾驶问题。但如果技术可靠,那么在未来可以让模型完成更好的场景识别或应对更大范围的场景。许多公司对此表示赞同,包括特斯拉,Zoox,Comma.ai,Drive.ai等。
模拟仿真技术的使用还能够扩展到无人驾驶领域之外。比如,我们可以借此理解无人机如何感知周围的世界,也能更好地明白交通、驾驶行为,甚至是行人行为的潜在逻辑。一个模拟环境中,存在足够多的特定模型和动态生命,因此我们还可以更好地理解机器人,它们将与我们的真实世界和数字世界发生交互。
以上为雷锋网 (公众号:雷锋网) 对中国人工智能学会智能驾驶白皮书的精编,如需下载完整报告请回复(中国人工智能协会智能驾驶)关键词,再次感谢中国人工智能学会对雷锋网的支持。转载请联系雷锋网。
。