在这篇博客文章中,我们在 NVIDIA GeForce RTX 3090 GPU 上对 TensorFlow 进行了深度学习性能基准测试。
测试的深度学习工作站配备了两个RTX 3090 GPU,运行了官方 TensorFlow github 中的标准“tf_cnn_benchmarks.py”基准脚本。使用 1个和2 个GPU 配置进行了测试:ResNet50、ResNet152、Inception v3、Inception v4。此外使用2 个和 4 个 GPU 配置(2x RTX 3090 与 4x 2080Ti 对比部分)进行了相同的测试。
NVIDIA RTX 3090优于所有的GPU(Images/sec)。
2个RTX 3090 > 4个RTX 2080 Ti
对于深度学习,RTX 3090 是市场上性价比最高的 GPU,可大幅降低 AI 工作站的成本。
NVIDIA RTX 3090 拥有 24GB GDDR6X 内存,内置增强型 RT 内核和 Tensor 内核、新的流式多处理器以及超快的 GDDR6X内存,可实现惊人的性能提升。
与 RTX 2080 Ti 的 4352 个 CUDA 核心相比,RTX 3090 的 10496 个 CUDA 核心增加了一倍多。并针对同时运行大量计算(并行处理)进行了优化。更多的 CUDA 核心通常意味着更好的性能和更快的图形密集型处理。
苏州英睿特信息科技有限公司版权所有 备案号: 苏ICP备16008440号-2