엔비디아, 산업용 AI 및 HPC를 가속화하는 ’HGX A100 시스템’ 공개

엔비디아가 자사의 슈퍼컴퓨팅 플랫폼인 HGX에 AI와 고성능컴퓨팅(HPC)을 융합하는 새로운 기술을 추가한다고 밝혔다. 산업분야에서 슈퍼 컴퓨팅이 더욱 유용하게 활용될 수 있도록 지원을 강화하겠다는 전략이다.

엔비디아는 HGX 플랫폼에 A100 80GB PCIe GPU, NDR 400G 인피니밴드(InfiniBand) 네트워킹, 매그넘(Magnum) IO GPU다이렉트(GPUDirect) 스토리지 소프트웨어 등 3가지 핵심 기술을 추가했다.

엔비디아의 A100 텐서(Tensor) 코어 GPU는 산업용 HPC와 관련된 복잡한 AI, 데이터 애널리틱스, 모델 교육 및 시뮬레이션 과제를 위한 HPC 가속화 성능을 제공한다. 특히, A100 80GB PCIe GPU는 A100 40GB에 비해 25% 늘어난 초당 2TB의 GPU 메모리 대역폭과 80GB의 HBM2e 고대역폭 메모리를 제공한다. 늘어난 메모리 용량과 메모리 대역폭은 더 많은 데이터와 더 방대한 신경망을 메모리에 저장할 수 있게 해주어 노드 간 통신 및 에너지 소비를 최소화할 수 있다.

엔비디아 인피니밴드는 대량의 데이터 처리가 필요한 HPC 시스템을 위해 완전 오프로드가 가능한 인네트워크 컴퓨팅 인터커넥트이다. NDR 인피니밴드는 확장된 성능으로 산업 및 과학 분야 HPC 시스템의 대규모 문제를 해결한다. 엔비디아 퀀텀-2(Quantum-2) 고정 구성 스위치 시스템은 포트당 64개의 NDR 400Gb/s 인피니밴드 포트(또는 128개 NDR200 포트)를 제공하여 HDR 인피니밴드 대비 포트 집적도가 3배 더 높다. 퀀텀-2 모듈식 스위치는 최대 2048개의 NDR 400Gb/s 인피니밴드 포트(또는 4096개의 NDR200 포트)의 확장 가능한 포트 구성을 제공하며, 총 양방향 처리량은 초당 1.64 페타바이트로 이전 세대 대비 5배 높다.

복잡한 워크로드에 대해 향상된 성능을 제공하는 매그넘 IO GPU다이렉트 스토리지는 GPU 메모리와 스토리지 간의 직접 메모리 액세스를 가능하게 한다. 이는 애플리케이션이 I/O 지연 시간을 줄이고 네트워크 어댑터의 전체 대역폭을 사용하는 동시에, CPU 사용 부하를 줄이고 데이터 사용량 증가에 따른 영향을 관리할 수 있게 해준다.

엔비디아는 HGX 플랫폼이 산업분야에서 HPC 혁신을 촉진할 것으로 기대하고 있다. 예를 들어, GE는 대형 가스 터빈 및 제트 엔진의 설계 혁신을 돕는 컴퓨터 유체 역학(CFD) 시뮬레이션에 HGX 플랫폼을 사용하고 있다. GE는 HGX 플랫폼을 통해 GE의 GENESIS 코드에서 획기적인 CFD를 위한 대규모 가속을 달성했다. 이 코드는 수백 개의 개별 블레이드로 구성되고 고유하게 복잡한 형상이 필요한 터빈 내부 난류의 영향을 연구하기 위한 대와류모사(LES)에 활용된다.

젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 “학계에서 시작된 HPC 혁신은 다양한 산업으로 빠르게 확대되고 있다. 이른바 ‘슈퍼’ 무어의 법칙에 따라 HPC가 기하급수적으로 발전되면서 산업분야에서 유용하게 활용되고 있다. 엔비디아의 HGX 플랫폼은 연구자들이 업계에서 직면하고 있는 가장 어려운 문제를 해결할 수 있도록 높은 HPC 성능을 제공한다”고 말했다.


Posted

in

by

Comments

댓글 남기기

워드프레스닷컴으로 이처럼 사이트 디자인
시작하기