博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
V100服务器和T4服务器的性能指标
阅读量:4229 次
发布时间:2019-05-26

本文共 1571 字,大约阅读时间需要 5 分钟。

多维度对比V100服务器和T4服务器的性能指标及各自有缺点

  • V100是定位在绝对的性能要求比较高的场景,比如对训练端、学习端,对计算速度有绝对的要求,或是推理端,对推理有绝对的速度要求,再或者以单精度或双精度为主的绝对计算都有要求,这是V100的定位;
  • T4定位主要面向推理端,刚才我们看到有一个很好的性能提升,在75W功耗下,T4在计算性能上有两倍多的提升并且能耗不变,所以T4可以很好的用在其他场景做一些推理或入门级的训练,单精度要求的一些场景,或是渲染VDI都有不错的表现。

NVIDIA Tesla GPU系列P4、T4、P40以及V100

NVIDIA Tesla系列GPUP4、T4、P40以及V100性能规格参数对比表。

提供基于NVIDIA Tesla GPU的计算型GPU云服务器,GPU实例规格包括GN6/GN6S/GN7/GN8/GN10X

云服务器吧 Tesla T4:世界领先的推理加速器 Tesla V100:通用数据中心 GPU 适用于超高效、外扩型服务器的 Tesla P4 适用于推理吞吐量服务器的 Tesla P40
单精度性能 (FP32) 8.1 TFLOPS 14 TFLOPS (PCIe)
15.7 teraflops (SXM2)
5.5 TFLOPS 12 TFLOPS
半精度性能 (FP16) 65 TFLOPS 112 TFLOPS (PCIe)
125 TFLOPS (SXM2)
整数运算能力 (INT8) 130 TOPS 22 TOPS* 47 TOPS*
整数运算能力 (INT4) 260 TOPS
GPU 显存 16GB 32/16GB HBM2 8GB 24GB
显存带宽 320GB/秒 900GB/秒 192GB/秒 346GB/秒
系统接口/外形规格 PCI Express 半高外形 PCI Express 双插槽全高外形 SXM2/NVLink PCI Express 半高外形 PCI Express 双插槽全高外形
功率 70 W 250 W (PCIe)
300 W (SXM2)
50 W/75 W 250 W
硬件加速视频引擎 1 个解码引擎,2 个编码引擎 1 个解码引擎,2 个编码引擎 1 个解码引擎,2 个编码引擎

NVIDIA TESLA V100

NVIDIA Tesla V100采用NVIDIA Volta架构,非常适合为要求极为苛刻的双精度计算工作流程提供加速,并且还是从P100升级的理想路径。该GPU的渲染性能比Tesla P100提升了高达80%,借此可缩短设计周期和上市时间。

Tesla V100的每个GPU均可提供125 teraflops的推理性能,配有8块Tesla V100的单个服务器可实现1 petaflop的计算性能。

NVIDIA TESLA P40

The Tesla P40能够提供高达2倍的专业图形性能。Tesla P40能够对组织中每个vGPU虚拟化加速图形和计算(NVIDIA CUDA® 和 OpenCL)工作负载。支持多种行业标准的2U服务器。

Tesla P40可提供出色的推理性能、INT8精度和24GB板载内存。

NVIDIA TESLA T4

NVIDIA Tesla T4的帧缓存高达P4的2倍,性能高达M60的2倍,对于利用NVIDIA Quadro vDWS软件开启高端3D设计和工程工作流程的用户而言,不失为一种理想的解决方案。凭借单插槽、半高外形特性以及低至70瓦的功耗,Tesla T4堪称为每个服务器节点实现最大GPU密度的绝佳之选。

NVIDIA TESLA P4

Tesla P4可加快任何外扩型服务器的运行速度,能效高达CPU的60倍。

 

转载地址:http://nhsqi.baihongyu.com/

你可能感兴趣的文章
正则表达式限定输入数字
查看>>
AngularJS Eclipse 插件
查看>>
Summernote实现图片上传功能
查看>>
Spring+MyBatis多数据源配置实现(mysql和sqlserver数据库)
查看>>
Java基于jxl与模板导出excel并弹出下载
查看>>
web/html5调用摄像头实现二维码扫描
查看>>
tomcat开机自启动
查看>>
WINDOWS中NEXUS的安装使用【ATCO整理】 2016-06-20 15:52 367人阅读 评论(0) 收藏 举报 分类: 项目管理(11) 版权声明:本文为博主原创文章,未经博主允许
查看>>
sql月份累加统计查询
查看>>
Google Translate API
查看>>
千万级PV网站架构
查看>>
使用jad批量反编译.class文件
查看>>
如何隐藏tomcat命令窗口
查看>>
bootstrap-datepicker限定可选时间范围 一、应用场景 实际应用中可能会根据日期字段查询某个日期范围内的数据,则需要对日期选择器可选时间进行限制, 如:开始时间不能大于结束时间,
查看>>
Spring高级话题-计划任务-@EnableScheduling
查看>>
使用iText生成PDF文件
查看>>
Java反射机制的缺点
查看>>
java反射机制优缺点
查看>>
java 23种设计模式 深入理解
查看>>
JS匿名函数理解
查看>>