HBv2 시리즈 가상 머신 개요
적용 대상: ✔️ Linux VM ✔️ Windows VM ✔️ 유연한 확장 집합 ✔️ 균일한 확장 집합.
AMD EPYC에서 HPC(고성능 컴퓨팅) 애플리케이션 성능을 최대화하려면 신중한 접근 방식의 메모리 지역성과 프로세스 배치를 신중하게 설정해야 합니다. 아래에서는 AMD EPYC 아키텍처와 Azure에서 HPC 애플리케이션을 위해 이를 구현하는 방법에 대해 간략히 설명합니다. pNUMA라는 용어는 물리적인 NUMA 도메인을, vNUMA는 가상화된 NUMA 도메인을 의미합니다.
물리적으로, HBv2 시리즈 서버 1개는 총 128개의 물리적 코어에 대해 64코어 EPYC 7V12 CPU 2개로 구성됩니다. HBv2에서는 SMT(동시 다중 스레딩)을 사용하도록 설정할 수 없습니다. 이 128개 코어는 16개 섹션(소켓당 8개)으로 나누어지며, 각 섹션에는 8개의 프로세서 코어가 포함됩니다. Azure HBv2 서버는 다음 AMD BIOS 설정도 실행합니다.
Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled
결과적으로 서버는 4개의 NUMA 도메인(소켓당 2개)으로 부팅됩니다. 각 도메인의 크기는 32코어입니다. 각 NUMA는 3,200MT/s로 작동하는 4개의 실제 DRAM 채널에 직접 액세스할 수 있습니다.
Azure 하이퍼바이저가 VM을 방해하지 않고 작동할 수 있는 공간을 제공하기 위해 서버당 8개의 물리적 코어를 예약합니다.
VM 토폴로지
이러한 8개의 하이퍼바이저 호스트 Core를 두 CPU 소켓에 걸쳐 대칭적으로 예약하여 각 NUMA 도메인의 특정 CCD(Core Complex Die)에서 처음 2개의 Core를 가져오고 나머지 Core는 HBv2 시리즈 VM용으로 사용합니다. CCD 경계는 NUMA 경계와 동등하지 않습니다. HBv2에서 연속된 4개의 CCD 그룹이 호스트 서버 수준 및 게스트 VM 내에서 NUMA 도메인으로 구성됩니다. 따라서 모든 HBv2 VM 크기는 OS 및 애플리케이션에 나타나는 4개의 NUMA 도메인을 노출합니다. 4개의 균일한 NUMA 도메인, 각각은 특정 HBv2 VM 크기에 따라 다른 코어 수를 사용합니다.
프로세스 고정은 기본 실리콘을 있는 그대로 게스트 VM에 노출하므로 HBv2 시리즈 VM에서 작동합니다. 최적의 성능과 일관성을 위해 프로세스를 고정하는 것이 좋습니다.
하드웨어 사양
하드웨어 사양 | HBv2 시리즈 VM |
---|---|
코어 | 120(SMT 사용 안 함) |
CPU | AMD EPYC 7V12 |
CPU 주파수(비 AVX) | ~3.1GHz(단일 + 모든 코어) |
메모리 | 4GB/코어(총 480GB) |
로컬 디스크 | 960GiB NVMe(블록), 480GB SSD(페이지 파일) |
Infiniband | 200GB/s HDR Mellanox ConnectX-6 |
네트워크 | 50GB/s 이더넷(40GB/s 사용 가능) Azure 2세대 SmartNIC |
소프트웨어 사양
소프트웨어 사양 | HBv2 시리즈 VM |
---|---|
최대 MPI 작업 크기 | 36000개 코어(singlePlacementGroup = true로 설정된 단일 가상 머신 확장 집합의 300개 VM) |
MPI 지원 | HPC-X, Intel MPI, OpenMPI, MVAPICH2, MPICH, 플랫폼 MPI |
추가 프레임워크 | UCX, libfabric, PGAS |
Azure Storage 지원 | 표준 및 프리미엄 디스크(최대 8개의 디스크) |
SRIOV RDMA에 대한 OS 지원 | RHEL 7.9+, Ubuntu 18.04+, SLES 12 SP5+, WinServer 2016+ |
Orchestrator 지원 | CycleCloud, 배치, AKS; 클러스터 구성 옵션 |
참고 항목
Windows Server 2012 R2는 HBv2 및 64개 가상 또는 물리적 코어를 초과하는 기타 VM에서 지원되지 않습니다. 자세한 내용은 Windows Server에서 Hyper-V를 지원하는 Windows 게스트 운영 체제를 참조하세요.
다음 단계
- AMD EPYC 아키텍처 및 멀티칩 아키텍처에 대한 자세한 내용은 AMD EPYC 프로세서용 HPC 튜닝 가이드를 참조하세요.
- HPC 워크로드 예 및 성능 결과에 대한 최신 공지 사항은 Azure Compute 기술 커뮤니티 블로그를 참조하세요.
- HPC 워크로드를 실행하는 상위 수준의 아키텍처 보기는 Azure의 HPC(고성능 컴퓨팅)를 참조하세요.