GPU 云服务器与 CPU 云服务器对比:
维度
|
GPU
|
CPU
|
核心数量
|
数千个加速核心(双卡 M40 高达 6144 个加速核心)
|
几十个核心
|
产品特点
|
1. 高效众多的运算单元(ALU)支持并行处理
2. 多线程以到达超大并行吞吐量
3. 简单的逻辑控制
|
1. 复杂的逻辑控制单元
2. 强大的算数运算单元(ALU)
3. 简单的逻辑控制
|
适用场景
|
计算密集、易于并行的程序
|
逻辑控制、串行运算的程序
|
GPU 比 CPU 拥有更多的逻辑运算单元(ALU),支持多线程大规模并行计算,适用于如下客户场景:
AI计算:深度学习推理、深度学习训练
图形图像处理:云游戏、云手机、云桌面、CloudXR
高性能计算:流体动力学、分子建模、气象工程、地震分析、基因组学等
高性能计算集群(THCC)和高性能计算平台(THPC)的区别是什么?
高性能计算集群(THCC)是通过RDMA网络互联的高性能云服务器集群,是IAAS层的产品。
高性能计算平台(THPC)是高性能计算资源管理服务,整合了管理调度和集群管理等软件,是PAAS层的产品。
什么是高性能计算集群?
高性能计算集群以高性能云服务器为节点,通过 RDMA(Remote Direct Memory Access)互联,提供了高带宽和极低延迟的网络服务,大幅提升网络性能能满足大规模高性能计算、人工智能、大数据推荐等应用的并行计算需求。
如何根据不同实例类型和场景选择驱动?
NVIDIA GPU 实例的类型包括物理直通卡实例(整卡 GPU)和 vGPU 实例(非单颗 GPU,例如1/4GPU)。
物理直通的 GPU 可以使用 Tesla 驱动,也可以使用 GRID 驱动(少数卡型不支持 GRID 驱动)来实现不同场景的计算加速。
vGPU 只能使用特定版本的 GRID 驱动来实现计算加速。
NVIDIA GPU 相关实例的驱动安装步骤请参见 安装 NVIDIA Tesla 驱动 及 安装 NVIDIA GRID 驱动。您可参考下表,结合实例类型及应用场景来选择驱动类型:
安装 Tesla 驱动
GPU 云服务器 安装 Tesla 驱动-操作指南-文档中心-腾讯云 (tencent.com)
GPU 云服务器 安装 GRID 驱动-操作指南-文档中心-腾讯云 (tencent.com)
CUDA(Compute Unified Device Architecture)是显卡厂商 NVIDIA 推出的运算平台。CUDA™ 是一种由 NVIDIA 推出的通用并行计算架构,该架构使 GPU 能够解决复杂的计算问题。它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。 开发人员目前可使用 C 语言、C++ 及 FORTRAN 来为 CUDA™ 架构编写程序,所编写出的程序可在支持 CUDA™ 的处理器上以超高性能运行。
GPU 云服务器采用 NVIDIA 显卡,则需要安装 CUDA 开发运行环境。本文以目前最常用的 CUDA 10.1 为例,您可参考以下步骤进行安装。
Linux 系统指引
1.前往 CUDA 下载 页面或访问
https://developer.nvidia.com/cuda-toolkit-archive
。原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/notes/296639.html