Skip to content

bbw7561135/ParallelComputing

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

并行计算

一、概述

二、MPI

三、GPU&CUDA

1.硬件层次

单机多卡内存和GPU、GPU和GPU之间互联可通过PCIE、NVLink、NVSwitch;
多机多卡GPU之间(不同主机)、CPU与GPU之间互联可通过GPUDirect RDMA、IB/万兆以太网 + TCP/IP;

2.软件(库)层次

单机多卡
NCCL;Gloo;
多机多卡
NCCL2.x;MPI;TCP/IP;Gloo;

3.框架层次

  • 模型并行和数据并行
  • PS架构和Ring架构
  • 底层通信方案对比(NCCL,Gloo,MPI……)

-------------------------------------------------

资源

About

并行计算

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published