9月28日,中国工程院外籍院士,清华大学智能产业研究院讲席教授兼院长张亚勤发表演讲,以下为演讲整理(未经演讲者本人确认)。
今天我讲的题目叫“走向无人驾驶”。无人驾驶是人类的一个梦想和科学幻想,需要很多的投入与攻坚,我们孜孜不倦地追求这个梦想,现在我们离这个现实已经不远了,正从科学幻想变成科学。
人工智能技术是最近大的趋势。在无人驾驶背后最重要的技术驱动力量就是人工智能,所以每次人工智能的发展往前走,无人驾驶就上一个台阶,如果没有人工智能发展,无人驾驶是不可能发展的,特别是大模型和生成式AI对于无人驾驶的一些新的促进。
人工智能最重要的是深度学习,过去三年,特别是去年年底Chat GPT出现之后,大模型、预训练、多模态、生成式成为主流,这其中产生了很多新的框架、新的算法和系统。我认为大模型、生成式AI是通向通用人工智能的一个渠道,虽然可能还没有达到通用人工智能的阶段,但已经给我们指出了一条路。未来,大模型和生成式AI的走向主要包括多模态、新算法、新模型、自主智能、具身智能、生物智能。
整体来讲,这是一个大的趋势。我经常讲,大模型、生成式AI有三层含义:第一,是人类首次通过图灵测试的一个智能体。ChatGPT是第一个通过图灵测试的智能。第二,它是通向通用人工智能的一个渠道,可能还没有达到通用人工智能,但是已经给我们指出一条路。第三,是新的AI时代的操作系统,就像PC时代的Windows,就像移动时代的安卓和IOS,是新的人工智能时代的操作系统,所以是一个及时性的贡献。
未来,大模型和生成式AI往哪个方向走呢?现在差不多有200多个大模型,我估计其中190多个都会死掉,剩下的10个会扮演很重要的角色,当然哪个会生存、哪个会被淘汰,需要市场化的因素,不能靠政府去指定,要靠市场的竞争。
我们需要新的算法,现在大模型的效率很低,GPT4比起人大脑的效率至少低1000~5000倍,现在的算法当然学习得很好,但是遇到那种新的、不在它的数据集里面的信息,学习起来就有一些困难,需要强化学习来加强新的信息,这对无人驾驶来说很重要。同时还需要新的模型,模型之间的交互、联动,包括模型如何上车、如何进入手机端,以及如何把大模型转换成小模型,都是我们需要破解的难题。
如果大家注意特斯拉,特斯拉做新能源车了不起,但更了不起的是机器人、无人驾驶。虽然我国在新能源汽车方面全球领先,但是我们的新能源汽车企业要有长远的目光,特别是其中获得成功的企业,要看到新能源汽车赛道未来的制高点和决胜点在于智能驾驶、无人驾驶,而不仅仅是电动化。
此外,生物智能同样重要,大模型和大脑连接会有很大的能量、很强的能力,但同时也会带来很多风险。我一直呼吁,在大模型以及无人驾驶方面,需要政府更多地参与,这种参与包括对大模型的内容以及整个体系的综合治理。我们的AI以后要更加可控、可信和安全,因为大模型不仅有目前信息安全方面的问题,可能还会有幻觉,也可以被人滥用,甚至对生存带来一些风险,因此我们必须在发展技术的同时兼顾风险。
由于场景复杂、任务复杂,更重要的是高可靠性、高安全性,行业普遍认为,无人驾驶要比人类驾驶安全10倍才可以大规模推广。无人驾驶有很多关键的问题,包括市场的力量和非市场的力量。市场的力量包括技术可行性、用户需求、产业生态、商业模式。非市场的力量则包括政策、法规、伦理、隐私,以及一些非人为的因素。
我一直相信L4+,也就是无人驾驶是可以实现的。因此我们把很多时间、精力和资源都投入到了这里面,这是一个无人区,总要有人去探索、去尝试。具体怎么实现,特斯拉说他只要视觉,我认为不仅要有视觉,还要有激光雷达,不仅仅需要单车智能,也需要V2X,车路协同会增加安全度、冗余度,同时还需要开源。我们相信不仅仅新势力车企有机会,传统车企也有机会。
自动驾驶很复杂,从怎么采集数据、怎么做传感的融合、做智能的感知,去认知、规划、决策、行为到回来的平台,里面有仿真、车辆的平台、V2X的平台、车辆的平台,怎么闭环回到车辆,这是一个相当复杂的问题,是个大系统。
但无人驾驶会慢慢进入市场,无人驾驶进入市场后大部分还是有人在驾驶,有人驾驶和无人驾驶一定会并行存在很多年,无人驾驶要了解人的驾驶行为,才可以不断去适应大的环境。
无人驾驶最重要的是安全。一方面是单车驾驶安全,一方面是车路协同技术安全。V2X可以增加安全性,但是无法确定具体系数,所以需要理论模型,包括场景分布的模型、感知车辆交互模型、安全评价模型,做出理论公式形成分布。V2X在很多场景可以比单车智能大幅度提高安全性,比如无保护的左转,安全可以提高10倍,从理论以及实际运用中可以证明,V2X是十分重要的。
我觉得无人驾驶的确是一个征程,我们正在把科学幻想变成科学、把梦想变成现实,中国完全可以成为全球最领先的无人驾驶强国。谢谢大家!