GeForce RTX显卡Stable Diffusion测试:TensorRT让RTX 4060系列性能提升一倍

科技 tuoni 2024-02-04 08:27 95 0

AI画图是AICG领域最有影响力的应用之一,今年也让很多人大开眼界,但是普通消费者如果想亲身感受这个神奇的AI功能,就得有一张比较高级的显卡,才能保证出图的速度,NVIDIA作为AI领域的领头羊,就为大家提供了一个解决方案,他们最近为Stable Diffusion推出了一个TensorRT扩展,可以显著提升GeForce RTX 系列显卡的生成图性能,同时也就降低了AI画画对显卡的要求。

手机通道:哔哩哔哩

首先让我们简单了解一下TensorRT是什么,它是NVIDIA专为高性能深度学习推理而设计的SDK,以前TensorRT主要服务于行业和专业用户,现在TensorRT开始针对Windows个人用户,就在不久前NVIDIA发布了TensorRT-LLM for Windows,这是一款提高AI推理性能的免费开源软件,可以在个人PC上增强大语言模型的推理性能,只要有一台配备了GeForce RTX显卡(8GB或以上显存)的,台式机或者笔记本电脑,就可以在本地安装运行,这不仅在建设成本上对个人用户更有利,也更能保护个人隐私数据的安全。

而在热门的AI画图工具Stable Diffusion Webui上,用户也可以借助TensorRT for Windows的支持,利用GeForce RTX系列显卡内部的AI计算单元Tensor Core来加速AI画图的过程,从而提高生产效率。

众人皆知,NVIDIA的GeForce RTX系列显卡都配备了Tensor Core,所以不仅是最新的GeForce RTX 40系列显卡,上一代的RTX 30系和更早的RTX 20系列显卡都可以使用这个TensorRT,而且它还优化了显存使用,最低只需8GB显存,我们测试在进行较大分辨率的AI画图时,总体显存使用也只有5GB左右,所以一张8GB的RTX 4060也是够用的。

为了检验TensorRT的加速效果,我们搞来了NVIDIA目前全线GeForce RTX 40系列显卡,RTX 4090、RTX 4080、RTX 4070 Ti、RTX 4070、RTX 4060 Ti、RTX 4060,以及目前仍然在主流级市场受到欢迎的上一代显卡,RTX 3060 12G来进行Stable Diffusion的AI画图测试。

评论区