广告
张量核心是什么?Tensor Cores的两大应用介绍
2021/4/9 11:48:56     浏览次数:1    来源:铭瑄    责任编辑:谢前锦

8年前的2013年3月20日,在英伟达显卡 技术大会上英伟达CEO黄仁勋宣布了一款GPU 架构:Volta架构。但是,令人意外的是,在宣布了Volta架构的研发计划后一直未见其踪影。直到2018年3月28日的GTC大会上,才突然重磅宣布了Volta的首款产品:Tesla V100

image.png

在过去,显卡架构研发周期一般是1-2年为主,那么这款花了超过30亿美元研发费用,耗时4年2个月的显卡,有什么特殊的变化呢?答案就是划时代的全新的“张量核心“:Tensor Cores。

image.png

相比于CPU计算而言,GPU计算能够实现更大的规模和减少任务类型的限制,效率也会变得比较高。而Tensor Cores就是一种专为深度学习而设计的计算核心,与FP32的训练相比,可以提供效率更高的训练性能和推理性能。在这样超强的运算效率基础上,能够让计算机视觉、自然语言处理、语音识别与文字转换、个性化推荐等过去CPU难以实现的功能也得以高速完成计算!

image.png

而其中最重要的两个具体应用,就是DLSS和AI Denoiser降噪功能。

image.png

DLSS利用TensorCore的高速计算能力,能够弥补传统抗锯齿解决方案的缺陷,通过改进的图像锐化和显示缩放相结合,能够让提高显卡生成接近、甚至超过本机渲染的高清晰度帧画面的速度。也就是说,DLSS是在提高清晰度、分辨率的同时,还能大幅度提高游戏帧速率的黑科技。

image.png

而AI Denoiser降噪功能的用处则是在各类生产力工具、OptiX渲染器中。

AI Denoiser降噪功能是NVIDIA的一篇“使用递归降噪自动编码器对蒙特卡罗图像序列进行交互式重构”的论文的具体应用。AI Denoiser降噪能够调用显卡的Tensor Cores来对渲染画面进行降噪处理,在保证足够的画面高保真度的同时,大幅度降低渲染时间,能够让交互式渲染能够获得更流畅的体验。

根据实际测试,Volta架构的Quadro GV100计算卡在调用Tensor Cores带来的AI Denoiser降噪功能后,速度得到了数倍的惊人提升。

image.png

次世代的张量核心Tensor Cores在2017年正式启用后,在2020年更新的Ampere架构显卡中已经更新到第三代Tensor Cores,在A100的Tensor Float32的测试项目中,第三代的Tensor Cores获得了惊人的20倍速度提高。

image.png

那么,如果你想要体验Tensor Cores带来的DLSS、AI Denoiser、AI计算等等功能,那么现在铭瑄RTX 3060 iCraft OC 12G就是一个不错的选择。

image.png

铭瑄RTX 3060 iCraft OC 12G采用NVIDIA最新Ampere架构核心,第三代的Tensor Cores最高可达2倍吞吐量。完整支持DLSS功能以及基于OptiX框架的AI Denoiser功能,让你能用更高的分辨率和特效畅玩游戏和生产力型工作。

image.png

另外,显卡采用Blade三次方流体力学风扇,11叶宽幅设计能够在保证风力与风压的情况下依然保持安静。4根毛细热管散热模组的越级配置,让显卡满载温度更低,长期使用更加耐用和稳定。

image.png

除此之外,铭瑄专属设计的SIP供电系统,能够让显卡获得源源不断的强劲动力。而且,高规格的用料还能获得更高的转换率和更低的发热,供电电流更强大,电压也能更加精准。

image.png

此外,铭瑄显卡全系列支持三年个人送保,售后更贴心,使用更放心~如果你想要一款散热不错的显卡体验张量核心带来的功能,那么铭瑄RTX 3060 iCraft OC 12G就是不错的选择~

24小时热文