NVidia产品和微架构

发表于 2018-01-13 更新于 2022-01-09 分类于 GPU

本篇博客介绍NVidia显卡的产品类型和微架构。尤其NVidia的Tesla系列产品和Tesla微架构区分清楚。 # NVidia（英伟达）GPU产品

NVidia推出的GPU产品和GPU架构总是搞混，这里列举一下目前产品，早期的就不算进来了。这里参考维基百科。

产品	系列	作用
个人电脑	GeForce系列	分为桌面平台与移动平台，按系列分类，其中GeForce 256与GeForce 3没有推出移动平台产品。桌面平台包括GeForce 2、GeForce 3至GeForce 9；GeForce 100至GeForce 700、GeForce 900、GeForce 10。举个例子，我台式机用的是GeForce GTX Titan Black就是GeForce 700系列产品。移动平台此系列主要应用到笔记本电脑上的显卡，一般后面带个`M`或其他标识，我15年买的Acer笔记本带的显卡是GeForce GTX 960M ，开发代号GM107 。但是GeForce 10系列就没有后缀，比如GeForce GTX 1080。
工作站	Quadro系列	分为桌面平台与移动平台，按系列分类。
服务器	Tesla系列	利用图形处理器进行高性能运算，部分型号无显示输出接头。
手持设备	GoForce与Tegra系列	Tegra(图睿)是系统单片机，替代GoForce系列。应用于智能手机、便携式媒体播放器和平板电脑等。每个 Tegra 内置ARM架构的处理器核心、基于GeForce的图形处理器等。
电子游戏机	无	为电子游戏机设计的图形处理器。

NVidia GPU微架构

GPU的微架构（micro-architecture）和GPU的计算能力（compute capability）挂钩。参考维基百科CUDA

计算能力	微架构	GPU核代	代表
1.0	Tesla	G80	GeForce 8800 Ultra
1.1	Tesla	G92, G94, G96, G98, G84, G86	GeForce GTS 250, Quadro FX 4700 X2
1.2	Tesla	GT218, GT216, GT215	GeForce GT 340, GeForce GT 330,Quadro FX 380 Low Profile
1.3	Tesla	GT200, GT200b	GeForce GTX 295, Quadro FX 5800, Tesla C1060
2.0	Fermi	GF100, GF110	GeForce GTX 590, GeForce GTX 580,Quadro 6000,Tesla C2075
2.1	Fermi	GF104, GF106 GF108, GF114, GF116, GF117, GF119	GeForce GTX 560 Ti, GeForce GTX 550 Ti, Quadro 2000, Quadro 2000D
3.0	Kepler	GK104, GK106, GK107	GeForce GTX 770, GeForce GTX 760,Quadro K5000,Tesla K10
3.2	Kepler	GK20A	Tegra K1, Jetson TK1
3.5	Kepler	GK110, GK208	GeForce GTX Titan Z, GeForce GTX Titan Black, GeForce GTX Titan, GeForce GTX 780 Ti,Quadro K6000, Tesla K40
3.7	Kepler	GK210	Tesla K80
5.0	Maxwell	GM107, GM108	GeForce GTX 750 Ti, Quadro K1200, Quadro K620, Quadro M2000M, Tesla M10
5.2	Maxwell	GM200, GM204, GM206	GeForce GTX Titan X, GeForce GTX 980 Ti, Quadro M3000M, Tesla M4, Tesla M40
5.3	Maxwell	GM20B	Tegra X1, Jetson TX1,
6.0	Pascal	GP100	Quadro GP100, Tesla P100
6.1	Pascal	GP102, GP104, GP106, GP107, GP108	Titan X, GeForce GTX 1080 Ti,Tesla P40, Tesla P6, Tesla P4,Quadro P6000
6.2	Pascal	GP10B	Drive PX2 with Tegra X2
7.0	Volta	GV100	NVIDIA TITAN V, Tesla V100

总体来说，Tesla架构的GPU计算能力为1.*, Fermi架构的GPU计算能力为2.*，Kepler架构的GPU计算能力为3.*，Maxwell架构的GPU的计算能力为5.*，Pascal架构的GPU计算能力为6.*，Volta架构的GPU计算能力为7.*。

大概来说，每个系列的产品都会升级自己的计算能力，而每项计算能力都包括若干不同系列的产品。

更详细的产品，计算能力参见https://developer.nvidia.com/cuda-gpus。

Kepler GK110 支持 Compute Capability 3.5，有15个 SMX 和 6个 64位的内存控制器。

每个 SMX 单元有192个单精度核，每个核有单精度和整数逻辑运算单元。

	FERMI GF100	FERMI GF104	KEPLER GK104	KEPLER GK110
Compute Capability	2.0	2.1	3.0	3.5
Threads / Warp	32	32	32	32
Max Warps / Multiprocessor	48	48	64	64
Max Threads / Multiprocessor	1536	1536	2048	2048
Max Thread Blocks / Multiprocessor	8	8	16	16
32‐bit Registers / Multiprocessor	32768	32768	65536	65536
Max Registers / Thread	63	63	63	255
Max Threads / Thread Block	1024	1024	1024	1024
Shared Memory Size Configurations (bytes)	16K 48K	16K 48K	16K 32K 48K	16K 32K 48K
Max X Grid Dimension	2^16‐1	2^16‐1	2^32‐1	2^32‐1
Hyper‐Q	No	No	No	Yes
Dynamic Parallelism	No	No	No	Yes