如何选择 GPU 实例?

GPU 云服务器与 CPU 云服务器对比:

如何选择 GPU 实例?
维度
GPU
CPU
核心数量
数千个加速核心(双卡 M40 高达 6144 个加速核心)
几十个核心
产品特点
1. 高效众多的运算单元(ALU)支持并行处理
2. 多线程以到达超大并行吞吐量
3. 简单的逻辑控制
1. 复杂的逻辑控制单元
2. 强大的算数运算单元(ALU)
3. 简单的逻辑控制
适用场景
计算密集、易于并行的程序
逻辑控制、串行运算的程序

GPU 比 CPU 拥有更多的逻辑运算单元(ALU),支持多线程大规模并行计算,适用于如下客户场景:

AI计算:深度学习推理、深度学习训练
图形图像处理:云游戏、云手机、云桌面、CloudXR
高性能计算:流体动力学、分子建模、气象工程、地震分析、基因组学等

高性能计算集群(THCC)和高性能计算平台(THPC)的区别是什么?

 

高性能计算集群(THCC)是通过RDMA网络互联的高性能云服务器集群,是IAAS层的产品。

高性能计算平台(THPC)是高性能计算资源管理服务,整合了管理调度和集群管理等软件,是PAAS层的产品。

什么是高性能计算集群?

 

高性能计算集群以高性能云服务器为节点,通过 RDMA(Remote Direct Memory Access)互联,提供了高带宽和极低延迟的网络服务,大幅提升网络性能能满足大规模高性能计算、人工智能、大数据推荐等应用的并行计算需求。

如何根据不同实例类型和场景选择驱动?

 

NVIDIA GPU 实例的类型包括物理直通卡实例(整卡 GPU)和 vGPU 实例(非单颗 GPU,例如1/4GPU)。

物理直通的 GPU 可以使用 Tesla 驱动,也可以使用 GRID 驱动(少数卡型不支持 GRID 驱动)来实现不同场景的计算加速。

vGPU 只能使用特定版本的 GRID 驱动来实现计算加速。

NVIDIA GPU 相关实例的驱动安装步骤请参见 安装 NVIDIA Tesla 驱动 及 安装 NVIDIA GRID 驱动。您可参考下表,结合实例类型及应用场景来选择驱动类型:

如何选择 GPU 实例?

安装 Tesla 驱动

GPU 云服务器 安装 Tesla 驱动-操作指南-文档中心-腾讯云 (tencent.com)

GPU 云服务器 安装 GRID 驱动-操作指南-文档中心-腾讯云 (tencent.com)

CUDA(Compute Unified Device Architecture)是显卡厂商 NVIDIA 推出的运算平台。CUDA™ 是一种由 NVIDIA 推出的通用并行计算架构,该架构使 GPU 能够解决复杂的计算问题。它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。 开发人员目前可使用 C 语言、C++ 及 FORTRAN 来为 CUDA™ 架构编写程序,所编写出的程序可在支持 CUDA™ 的处理器上以超高性能运行。
GPU 云服务器采用 NVIDIA 显卡,则需要安装 CUDA 开发运行环境。本文以目前最常用的 CUDA 10.1 为例,您可参考以下步骤进行安装。

Linux 系统指引

1.前往 CUDA 下载 页面或访问 https://developer.nvidia.com/cuda-toolkit-archive

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/296639.html

(0)
上一篇 2023年4月17日
下一篇 2023年4月19日

相关推荐

发表回复

登录后才能评论