001:英伟达为自动驾驶引入了性能怪兽?| 郭继舜带你读汽车科技

郭继舜 2020-05-19 09:21:00

今天我们来讲一讲英伟达。

受疫情的影响,上周四北京时间 2020 年 5 月 14 号晚,英伟达创始人兼 CEO 黄仁勋把 2020 年 GTC 的演讲舞台搬到了自家的厨房里。

此前英伟达的显卡造型被网友们吐槽像煤气灶。可能是想回应这个梗吧,GTC 召开前一天的预热视频里,黄教主一本正经地从烤箱里搬出了新的产品:1 个装有 8 个 GPU 的服务器主板。

黄仁勋此次线上演讲主题的核心是英伟达的下一代图形处理器的架构 Ampere(安培)。

基于安培架构的第一款 GPU A100 的技术参数让人眼花缭乱:7 纳米的工艺,540 亿个晶体管,3D 堆叠技术,加上高达 826 平方毫米的芯片面积,同时支持 TF32 和 BF16 格式,拥有 438 个第三代 Tensor Core,支持虚拟成为 77 个 GPU 来执行不同的任务。

这个听起来真的是一个非常厉害的跨时代的新的架构平台。

虽然 GPU A100 有 2000TOPS 的算力,但其功耗也达到了 800 瓦。如果满负载使用在新能源汽车上,将对新能源汽车的续航造成比较大的影响。

举个例子,NEDC 工况续航在 600 公里的新能源汽车,如果满负载使用 GPU A100 这样的运算架构,其续航里程将下降到大约 200 公里出头。

所以,大算力大功耗的运算单元在未来很可能不是使用在单车上,而是使用在车路协同,V2X 的路端单元成为核心的运算器。

那么车载运算单元呢?当然 SoC 是一个很好的选择。

去年 12 月,英伟达推出了面向 ADAS 和自动驾驶领域的新一代 SoC Orin。当时发布的时候是这么说的:Orin SoC 具有 170 亿个晶体管,搭载英伟达的下一代 GPU。

现在我们知道了它是名字叫作安培架构的 GPU。

安培 GPU 和 ARM 架构的 CPU 核心,一起可以提供最多 200 的 TOPS 的运算能力,是上一代 Xavier SoC 的 7 倍,功耗只有 45 瓦,20222 年交付,面向的是 L2+及以上的自动驾驶场景。

可以看到,Xavier 是 Orin 的上一代自动驾驶芯片。

值得一提的是,虽然发布了很多年了,但是 Xavier 作为核心智能驾驶芯片,首次出现在量产车型上,还是最近发布的小鹏的 P7,它使用的是 Xpilot 3.0 的系统。

在性能和功耗方面,Xavier 有 30 个 TOPS 的算力和 30 瓦的功耗。它的设计就是面向 L2+的 ADAS 系统的,这个很类似于 Super Cruise 和特斯拉的 Autopilot。

小鹏 P7 在智能驾驶方面的可扩展性,强大的算力,出色的智能驾驶功能让我记忆犹新。

其实我们在两年前也很认真地评估过 Xavier 这款芯片,做了大量的测试,30 个 TOPS 的等效算力是当时智能驾驶领域域控制器的大杀器。无奈芯片的成本确实是太高了,最终还是忍痛放弃了。

但作为智能驾驶的从业者,我为小鹏汽车在智能化上的决心和投入感到钦佩和羡慕。

好,我们回到 Orin。

前段时间我和英伟达的专家就新一代的智能驾驶芯片 Orin 进行了非常详细的讨论,我发现英伟达转换了战略思路,Orin 在保证强大的算力和性能的基础上,所预计的单片价格让我两眼放光。

看得出来,英伟达准备借助 Orin 和英伟达 DRIVE AGX 平台通吃高中低端的市场。

英伟达的中国区总裁张建中告诉我:

除了 L2 级别的智能驾驶,我们的客户还要求英伟达提供 Robotaxi 或者更高级别的智能驾驶的解决方案。对于客户来说,专门为不同级别的自动驾驶开发独立的架构成本实在太高了,但我们可以怎么做?我们可以利用 Orin 这个平台,从 ADAS 直接打通到 Robotaxi。

这是一个多么好的具有一致性的平台,所以我现在非常期待 2022 年 Orin 大规模量产的时候,给智能驾驶领域带来了新的生命力。

说到车载的芯片,英伟达的主要对手就是英特尔旗下的 Mobileye,这家以色列公司公司几乎占据了全世界车载的智能芯片 70% 的市场份额。

现阶段我们用的非常多的就是它的 EyeQ4 这款芯片,性能和算力都是非常不错的,在未来还有 EyeQ5、EyeQ6 等等一系列的产品。

除了 Mobileye,我们还应该关注特斯拉的 Autopilot 所使用的硬件平台。

另外,还有就是华为 MDC 300 系列的域控制器。这个我们都会在后续的节目中,我找个时间进行详细的解析。

但我必须提一句,华为的 MDC 300 系列域控制器在最近我们的评测中发现:它的性能非常强大,而且其工具链和运算效率都有着非常好的让我满意的结果。

我相信华为的平台将很快在量产车型中出现,并且为高级别智能驾驶提供足够好的算力和足够好的未来的想象空间。

说到 Robotaxi,其实现阶段很多的科技公司在开发平台的时候,依然还是使用工控机,像电脑一样使用英伟达的 GPU 加上英特尔的 CPU。

使用工控机开发的好处,当然就是开发非常简单,在开发的时候我们不用太多地顾忌算力的消耗,但坏处是它的不稳定性。在进行大规模量产的时候,我们必须把系统从工控机转换成嵌入式的系统,这个代码的转换量都是非常大的。

所以我认为:评判一个 L4 甚至更高级别智能驾驶系统,在未来是不是具有非常好的量产可能性,其中有一个重要的指标就是看它能不能够在英伟达或者是华为这样的域控制器平台上更好地展现它的功能,而不仅仅是使用在工控机上。

英伟达这一系列芯片的卖点,就是开发人员可以使用通用的架构,从最初的基准开发到仿真再到路测,重要的是虽然说新款芯片在不断地问世,但是它们依然保留着非常好的兼容性,因此更老的平台运行的代码可以直接在新的芯片上使用。

对于未来的产品线,英伟达将推出一系列的 SOC,基于不同的算力和不同的 ADAS 级别,有一些甚至可以和摄像头和雷达一起安装在前挡风玻璃的外壳上。

这种入门级的芯片功耗只有 5 瓦,却能提供大约 10 个 TOPS 的算力,驱动现在的 ADAS 功能是绰绰有余的。

我之前在一些媒体或者论坛上都讲到,人工智能芯片的算力不足和成本高企,一直是制约智能驾驶发展和大规模应用的因素。

随着英伟达、Mobileye、华为、地平线等等公司纷纷推出了非常具有竞争力的产品,我相信在近几年智能驾驶硬件和算力的发展会极大地加速更多高级别智能驾驶功能量产落地来到我们的身边。

好了,这是今天的《郭继舜带你读汽车科技》,我们明天见。

关于主讲人郭继舜博士:高级工程师,广汽研究院智能驾驶技术部部长,广汽 L3/L4 无人驾驶技术总监。

中国电子科技大学本科,台湾清华大学、苏黎世联邦理工学院硕士,斯坦福大学博士。加入广汽研究院前,先后在 Google X-Lab,EMC2 中国研究院,百度深度学习研究院从事人工智能技术研发,2017 年广州市高层次引进人才。

ACM/ICIP 亚洲区金牌,日本文部科学省学者奖,Erasmus Mundus 全额奖学金,海峡两岸杰出学者奖等。先后主持和参与 973 国家重点基础研究项目、国家重大基础研究专项、教育部新世纪优秀人才项目等,在 CVPR,ICCV,IJCAI 等国内外顶级期刊和会议上先后发表论文二十余篇,获得中美发明专利共 32 项。

本期制作

主讲:郭继舜 监制:王德芙

编辑:李笠 后期:Tom

设计:陈溪阳 运营:林芝芝

音频平台

喜马拉雅 | 蜻蜓 FM | 听伴

Podcasts | 小鹅通

在以上平台搜索关注汽车之心

即可收听全部节目

本文为汽车之心原创文章,作者:郭继舜,如需转载,请联系授权。违规转载法律必究。

(0)
(0)
参与评论:

    标签云

    汽车之心

    • 累计发布 1237 篇文章
    • 关注我们:扫描二维码,关注微信公众号
    登录或注册
    注册、登录代表你已阅读并同意《用户协议》
    My title page contents