在刚过去不久的NVIDIA春季线上GTC大会上,NVIDIA发布了多款新产品,好好地秀了一把自家深厚的图形计算科技实力。看过今年GTC大会的观众可能会注意到,NVIDIA创始人兼首席执行官黄仁勋先生的主题演讲是以Omniverse开头的,一开场就花了很大篇幅介绍去年推出的协作软件平台NVIDIA Omniverse,以及如何使用Omniverse来做3D图像系统合作,并且最后还是以Omniverse结束。
可能大家会很好奇,为什么NVIDIA从一家做硬件的公司开始往软件方向发展了?最近,CG小编受邀参加了NVIDIA专业视觉产品事业部的媒体会,多位NVIDIA技术专家为大家深度讲解了在本次GTC大会上发布的多款专业可视化领域产品。带着前面的问题,随小编一起来看下这次媒体会都分享了什么内容吧~
Omniverse:革新工作流程
对于各位CG读者朋友们来说,NVIDIA Omniverse应该再熟悉不过了,之前也有进行过直播分享。在本次GTC大会上,NVIDIA推出了面向了企业的Omniverse Enterprise,诸如宝马汽车、Foster建筑事务所等世界500强公司都已经开始在工作上试用Omniverse Enterprise了。
在过去相当长的一段时间里,Omniverse一直是NVIDIA公司的重头戏,在今年春季GTC大会上,黄仁勋先生的主题演讲,以Omniverse开头,以Omniverse结尾,这预示着NVIDIA会在可预期的一段未来时间内把Omniverse塑造成NVIDIA专业可视化领域,以及全平台云原生专业生产力工具的这样一个定位。
那么这是为什么呢?是基于以下这几点考虑的:
♦当今现有的3D设计变得极端的复杂,而且已经成为了一个全团队合作的分散式,亦或是多平台具有广泛技能的大型团队的分工协作工程。
♦如今的3D工作流需要团队拥有非常具体而且广泛的技能,可能会牵涉到艺术家、科学家、设计师、工程师、可视化专家等同时进行协作,而他们的工作可能是远程的,也可能是分散在不同的办公室甚至在世界各地的。
♦不同专业人员的设备配置或者网络环境因人而异,有的可能需要非常强大的图形显卡进行渲染;有的则可能需要强大的计算能力进行模拟。
♦专业的ISV工具源源不断地增长,且3D设计日益复杂,一个3D建模可能是几十兆、几百兆的数据级,这样就会导致大量的时间被浪费在数字资产的迁移过程中。由此可见,大型的数据集为我们今天生产力工具带来越来越多极大的挑战。
不过,借助NVIDIA Omniverse就能帮大家在这些工作流中间节约成本和时间了,通过提升每一个环节中间来回的效率,可以让整个研发周期缩短。

NVIDIA中国区高级技术市场经理施澄秋介绍到:“Nucleus是整个Omniverse的核心,它可以基于一个映射的方式存取分布在本地硬盘、本地服务器、本地机房数据中心,以及远在云端的许多数字资产,所以它是一个云原生并基于混合方式的数据映射和模拟。在这里可以帮助大家利用5个不同的组件,甚至可以开发和构建客户自己的应用程序,创建和修改自己的扩展应用程序。它可以让Omniverse用户看到全部的实时编辑,这一切是在线的、互动的,且身临其境的协同运算工作环境。”
通过NVIDIA Omniverse的Connector还可以连接各式各样的专业ISV工具,实用光线追踪、物理模拟、仿真、基于人工智能的运算等NVIDIA最新技术。最后通过Omniverse View把作品导出给客户,打破了以前专业ISV生产力工具导出导出的繁琐现象。

总而言之,Omniverse不仅可以作为打通全工作流的全新工作方式,还可以进行物理模拟,以及大型的、真正的所谓的虚拟仿真。在这个世界上所有可以构建出来的零组件都可以把它虚拟化、可视化,能够帮助许多影视娱乐、工业设计、无人驾驶等行业进行物理的模拟和仿真。

RTX A5000/A4000:全面加速性能
继去年推出基于Ampere架构RTX A6000以来,NVIDIA又发布了两款最新图形显卡A5000和A4000。与过去二十年前的视觉运算相比,今天的视觉运算已经发生了翻天覆地的变化,进入了一个全新的纪元。我们如今可以看到AI已无处不在。人工智能已遍布在传统设计制造领域的方方面面。既要实时在线,还要支持VR/AR/XR、各式各样的虚拟现实、增强现实,甚至还要加速。而要完成上述这些复杂的设计流程,NVIDIA RTX就是未来的基石。
可以看到NVIDIA A6000、A5000、A4000有着不同的本地显存配置和不同的算力的性能配置,以适配用户自身不同的运算负载、生产力规模及要求。比如有一些用户说桌面环境受限,只能配置单槽的GPU。

NVIDIA A5000其实继承了Ampere架构A系列6000的几乎全部的特性。当然,在运算规模和算力上还是略有区别的。针对上一代产品,A5000 FP32 throughput提升了2.7倍,光线追踪能力提升了2倍。因Ampere架构在这一代引入了全新的稀疏式运算,Tensor Cores的TF32性能提升了10倍。
相对A6000来说,A5000GDDR6的显存从缩减到24GB,可以提升用户成本控制的考量,且延续了Ampere架构PCIe Gen4性能吞吐体验。总体来说,RTX A5000带来了各式各样的性能提升,还可以通过CloudXR的方式支持许多高精度的数据的模拟。
而RTX A4000同样也是一脉相承,只是做了从双槽到单槽的缩减。为了适应单槽的散热器和整体的功耗及规模的需求、空间部署的需求,我们进一步优化了整个板上的配置,包括显存、核心架构、带宽配置等。当然它几个关键的属性仍然是保留的,比如PCIe Gen4。
施澄秋说:“NVIDIA RTX A系列图形显卡是一个为了真正的专业用户在不同的专业领域、专业的行业用户而设计和生产制造的专业生产力工具。无论是做专业的M&E拍摄、虚拟背景的搭建或者是做渲图、仿真、渲染、电影后期制作等都提供了非常好的表现支持。”
BlueField DPU:保卫数据网络安全
万物互连时代,软件定义网络变得越来越重要。通过软件定义网络,在互连时代的各种各样的应用都可以在在网络上轻松地使用起来,但是这也给网络造成了非常大的压力,导致设备的性能不一定能达到最优。
NVIDIA网络事业部亚太区市场开发高级总监宋庆春表示:“通过DPU网络硬件来对软件定义网络做加速的话,可提供一个硬件级性能,包转发率可达到1800万个包/秒,这种情况下不消耗任何CPU的核,即在CPU零消耗情况下,可达到1800万个包/秒的转发率,同时延迟也大大降低。”
硬件加速不仅带来了性能提升,它还带来了另外一个更重要的价值就是解决了现在业务的长尾延时问题。现在很多的业务之间是有直接关联性的,它们之间的操作是有一个承上启下的效果,即第一个任务完成以后才能做第二个任务,第二个任务完成以后才能做第三个任务,而每一个任务在它完成的过程中都是以“微服务”这样的形式在进行工作。
如果有了硬件加速,便可以在几十个微秒量级下将这个操作完成。从最长延迟来看,硬件加速起了至关重要的作用。这个硬件加速使用了BlueField DPU,并且可以将很多基础设施上面的一些操作,由原来的CPU卸载到BlueField DPU上面。通过DPU的卸载操作实现了一个非常短的尾部延时,这样就使业务性能提升变得非常有价值了。
在GTC大会上,NVIDIA还发布了另一个非常重要的软件框架——MORPHEUS。MORPHEUS是基于AI技术的一个网络安全卫士,通过把DPU和AI技术联合,实现了对于数据中心、对于边缘、或对于所有基于NVIDIA统一架构系统的安全和性能保障。在这个架构里面,使用DPU来作为服务器的眼睛,可以侦测服务器上的异常现象。因此,通过DPU和AI的结合,实现了自动更新安全策略和系统自动安全防御。
最后宋庆春还介绍道:“NVIDIA从核心到边缘都采用了统一的一个计算架构——CPU、GPU、DPU,三“U”一体架构。通过CPU、GPU、DPU之间的协调计算,我们可以在数据中心里面和边缘里面都可以达到非常好的性能,以及提供非常高的安全性。”
数据中心已成为新的计算单元,通过CPU、GPU、DPU之间的协调计算实现了构建高性能的数据中心这样一个理想,同时通过这个统一的架构让核心数据中心和边缘数据中心协调运作,在核心和边缘之间实现非常快的时钟同步,确保在安全保障和在性能保障方面都采用同样的架构,都能达到最高、可靠和稳定的性能。
A10/A16和CloudXR:加速数字化未来
此外,GTC大会上NVIDIA还推出了两款最新的vGPU——A10和A16以及最新版CloudXR。
A10主要的应用场景基本是NVIDIA RTX Virtual Workstation(vWS)和vCS。基于Ampere架构的A10配置一个编码单元、两个解码单元,支持AVE的硬解码。而A16主要的应用场景是vPC、在线视频观看、多显示器、和视频会议。A16拥有4个GPU、四个编码单元、八个硬解码单元,并且支持H.265和264的硬解码, A16预计在今年下半年才能够正式发货。
而CloudXR技术则针对的是行业内的AR/VR/MR应用。如今,VR已经开始应用在产品设计、虚拟制作、虚拟拍摄等许多的行业上。所有的高性能VR头盔后面都会有一根“辫子”,这些VR头盔上的线缆是USB或是HDMI显示装置的线缆。因为头盔的算力不够,需要借助GPU把渲染画面做出来,再用有限的线缆传给头盔。但这样不仅会带来一些挑战,例如线缆的长度、使用者观察的角度都会被这根线缆所限制住,同样也会带来一些安全问题,比如在传统行业里,因现场地大小和多人协作受到限制,戴头盔可能会出现把别人绊倒等问题。
另外,一体式头盔也面临着单一算力不够的挑战。NVIDIA售前方案架构师宋燊解释:“因一体式头盔大多时候是用安卓OS,安卓OS上的GPU、CPU能力没法跟桌面级的CPU、GPU去媲美。另外,一体式头盔存储也受限。因此在便利性上,也牺牲了很多性能上的问题。”

对于上述这些问题和挑战,宋燊给出了一些NVIDIA的解决方案。“想让一体式的头盔也能够享受到跟带线缆的有线头盔一样,能够达到自由、也能够达到很高性能的传输,那就是CloudXR。”
将任意地点里面产生的XR(AR/VR)渲染出来的内容,通过网络实时的传输到任意的设备上,这便是CloudXR的愿景。任意的设备包含一体式头盔、MR眼睛、任意的平板,还包括有线头盔远程可以用一些低端的笔记本也能够满足VR内容传输,扩展生态,同时也支持有线式的VR头盔。可以想像,利用5G的高带宽和低延时,通过云端和5G的方式,CloudXR把任意地点、任意的数据中心(私有或公有云)上产生的VR或者AR的内容串流到终端上。国内第一家支持CloudXR Server公有云的厂商便是腾讯云,NVIDIA与腾讯云已达成了合作。
NVIDIA凭借GPU,NVIDIA在AI和图形视觉领域纵横数十年,重新定义了现代计算机图形、高性能计算和人工智能,并一直不断推动专业可视化领域发展,引领大家走向前沿,期待能在未来为我们带来更多的惊喜,小伙伴们也赶快下载使用吧~
—全文完—
原创文章,作者:CG世界,如若转载,请注明出处:https://www.cgworld.wiki/40042.html
评论列表(1条)
革新工作流程