英伟达Ada Lovelace架构GPU图形处理器(资料来源:英伟达官网)

钛媒体app 9月21日称,美国芯片巨头英伟达(NVIDIA)最近一年举办了一次GTC 2022大会。

昨晚(20日)GeForce Beyond主题演讲上,英伟达CEO黄仁勋 (Jensen Huang) 宣布,公司正式推出基于5nm(TSMC N4)制程的全新Ada Lovelace架构多款旗舰产品,其中包括具有760亿个晶体管、搭载新一代DLSS 3图像缩放技术的RTX 4090 GPU(图形处理器)消费级旗舰显卡,次旗舰RTX 4080以及L40 OVX元宇宙数据计算系统。

同时,英伟达还推出Grace CPU 超级芯片、算力2000TFLOPS的Drive Thor(雷神索尔)自动驾驶芯片、用于下一代机器人的Jetson Orin芯片等多款 AI 芯片,以及元宇宙产品线 Omniverse 的最新进展和生态合作信息。在会上,黄仁勋还披露,H100已经全面投产。

不过,钛媒体App注意到,大会演讲中,英伟达于2022年10月发货的H100 Tensor Core GPU首批8个合作伙伴,除了联想外没有其他中国企业。同时,Ada Lovelace架构企业级产品和Grace CPU超级芯片首批合作客户中没有阿里、腾讯、百度等中国公司身影。此前的9月1日,英伟达发布更新监管文件,称其高性能GPU的出口已得到美国政府部分许可。

那么这是否意味着,中国公司无法采购英伟达最新的H100 GPU芯片以及Ada Lovelace架构的多款芯片产品?

对此,英伟达公司负责人对钛媒体App独家回应称:根据美国政府最近宣布的规定,未经许可,我们不能出口、转让或移动NVIDIA H100 GPU 或包含它们的主板/系统以在中国市场上使用。但此限制不适用于Grace CPU超级芯片,或基于Ada Lovelace的RTX 4090、4080或L40等主题演讲中提到的其他产品。此外,英伟达Jetson Orin芯片也可以在包括中国大陆在内的全球范围内使用。

但英伟达没有对钛媒体App回应,一旦美国政府出台新的限制规定下,Ada Lovelace架构产品是否会影响中国大陆企业。

据悉,20日演讲中,黄仁勋展示了英伟达RTX、AI 芯片和元宇宙产品线Omniverse 的最新进展,还包括它们对AI 药物领域新突破的帮助,以及大量应用落地。

第三代RTX显卡方面,英伟达最新推出的GeForce RTX 40系列显卡,是全球首款采用全新NVIDIA Ada Lovelace架构的GPU产品。

旗舰版本RTX 4090 GPU显卡最高配备24GB美光科技的板载内存,转投台积电后,内置芯片为TSMC定制的N4制程,塞进了760亿个晶体管,比上一代Ampere多了70%,Ada效能是前代产品(RTX 3090)的四倍。“Ada正在为完全基于仿真的未来游戏铺路。”黄仁勋说。

黄仁勋也重点提到全新一代DLSS 3超采样超分辨率技术——利用卷积自动编码器AI模型,在不影响图像质量的情况下可以提升性能,自动补出高分辨率。英伟达在Ada架构中引入了DLSS 3,开启DLSS时,4080可达到3080Ti的两倍性能,相较于单纯的渲染可以将性能提升多至4倍。

价格上,作为世界上最快的游戏GPU,RTX 4090公版售价1599美元(人民币12999元)起,10月12日开始售卖;RTX 4080价格比前代涨了500美元,16GB售价1199美元(9499元),12GB版售价899美元(7199元),将于11月推出。

公布的供货方,华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰等顶级显卡供应商将在中国推出GeForce RTX 4090和4080 GPU标频版和超频版。RTX 40系列GPU还会通过宏碁、外星人、华硕、戴尔、惠普、联想、微星等OEM厂商出售。

元宇宙产品方面,英伟达发布专为元宇宙应用打造的第二代OVX计算机,搭载了新Ada Lovelace L40数据中心GPU,以提供实时图形、AI和数字孪生模拟功能。L40 GPU已全面进入量产,第二代OVX系统将于明年年初向市场提供,技嘉、新华三、浪潮、联想、QCT会使用OVX系统,宝马集团和捷豹路虎是首批OVX客户。

除硬件外,英伟达还推出其首款IaaS产品Omniverse Cloud服务,可连接在云、本地或设备上运行的Omniverse应用。个人或团队可以借助该服务一键体验设计和协作3D工作流程的能力,无需任何本地计算能力。

全新 AI 芯片方面,黄仁勋首先修正了公司的汽车SoC路线图,将1000 TOPS专用处理器Atlan升级,计划推出具备2000 TFLOPS性能的自动驾驶芯片Thor(雷神索尔),算力是目前Orin芯片的8倍,吞吐量是Atlan的两倍,交付性能也是Atlan的两倍以上,预计2024年推出,2025年上车使用。

黄仁勋表示,短短一年实现性能提升离不开三个架构因素:Grace、Hopper 和 Ada Lovelace,其中 Grace提供了新的Transformer引擎、ViT的快速变革,而Lovelace有助于车载计算资源的集中化,将成本降低数百美元。

对于Orin产品线,英伟达推出了一款微型机器人计算机Jetson Orin Nano,速度比上一代Jetson Nano快了80倍。黄仁勋提到,自动驾驶汽车的基本处理流水线可应用于各种机器人系统。而第二代机器人处理器DRIVE Orin已经被40多家汽车、卡车、无人驾驶出租车和穿梭巴士的制造公司采用。

黄仁勋指出,NVIDIA平台现已拥有350万名开发者,12000家企业正基于英伟达的产品开展新业务,英伟达通过550个SDK和AI模型为约3000个应用提供加速,合作方包括腾讯云、浪潮、IBM等。“总体来说,我们所服务的各行业总价值约为100万亿美元。”黄仁勋表示。

此外,基于Hopper架构,英伟达今天还推出了Nemo LLM云服务,以及BioNeMo LLM服务,用于低门槛训练大型语言模型以及生物分子语言模型,从而高效执行特定任务。

面向数据中心,英伟达在今年4月发布的包含800亿个晶体管,采用了全新Hopper架构的英伟达H100 Tensor Core GPU已经进入大规模量产,预计下个月起对OEM厂商发货,到今年年底预计将有超过50款服务器型号面市;旗舰DGX H100则于今天起预定,预计在2023年第一季度(即从现在起的4到7个月)交付。

据介绍,H100使企业能够削减AI的部署成本,相较于上一代A100,在提供相同AI性能的情况下,可将能效提高3.5倍,总成本减少至33%,所使用的服务器节点数也减少至20%。

然而,大部分中国企业将不会采购到H100。

黄仁勋此前在此前内部信中提到,英伟达正在与中国客户协商,将寻找最佳替代品以配合他们的需求,或寻求其他技术许可。

但问题是,目前中国客户正在寻求替代的国产芯片产品,尤其是去年全球芯片短缺下,没有办法得到英伟达GPU芯片的中国企业。世界人工智能大会一场论坛圆桌中,有国内芯片企业负责人表示,这一事件让整个产业链里面就紧张起来了,有很多企业创始人直接找到汽车芯片公司商量“国产替代”事宜。

“我们认为美国对高端GPU芯片的禁令将推动GPU芯片的国产替代,”光大证券在一份研报中写道,“从产品性能来看,目前国产高端AI芯片的通用性与英伟达相比仍有一定差距,但在某一些维度已经接近或者超过英伟达。”

“我意识到这种限制是在一个已经充满挑战的环境下出现的。感谢大家尽最大努力遵守新的许可证要求,为我们的客户服务。我有信心我们能渡过难关。”黄仁勋在信中表示。(本文首发钛媒体App,作者|林志佳)

相关推荐