AWS 사용자들에게 좋은 소식이 있습니다. 이제 Amazon EC2 P5 인스턴스를 통해 NVIDIA의 최신 가속기인 H100 Tensor Core GPU를 사용할 수 있습니다. 이를 통해 산업 최고 성능의 생성적 AI 및 기타 응용 프로그램을 확장할 수 있습니다.
AI 시대를 맞아 매일같이 개발자와 연구자들이 대형 언어 모델 (LLMs)를 사용하여 AI의 새로운 응용 프로그램을 발견하고 있습니다. 이러한 새로운 사례들을 시장에 선보이기 위해서는 가속 컴퓨팅의 효율성이 필요합니다.
NVIDIA H100 GPU NVLink 기술 이용
NVIDIA H100 GPU는 4세대 Tensor Cores, LLMs를 가속화하는 새로운 Transformer Engine, 그리고 GPU 간 900GB/sec로 통신하는 최신 NVLink 기술을 통해 초컴퓨팅급 성능을 제공합니다.
생성형 AI에 Amazon EC2 P5 이용 가능
이제 브라우저에서 클릭 한 번으로 생성형 AI, 고성능 컴퓨팅 (HPC) 및 기타 응용 프로그램을 확장할 수 있는 Amazon EC2 P5 인스턴스를 이용할 수 있습니다. AWS 사용자들은 산업 벤치마크에서 입증된 성능을 경험할 수 있게 되었습니다.
이 강력한 협업으로 인해 AI의 가능성이 더욱 확장되고, 새로운 AI 응용 분야가 발견되며, 더욱 효율적인 가속 컴퓨팅이 가능해집니다.
Amazon EC2 P5 인스턴스는 LLMs에 활용
Amazon EC2 P5 인스턴스는 AWS 클라우드에서 점점 복잡해지는 대규모 언어 모델 (LLMs) 및 컴퓨터 비전 모델의 교육 및 추론에 이상적입니다. 이러한 신경망은 질문 응답, 코드 생성, 비디오 및 이미지 생성, 음성 인식 등 가장 요구가 높고 계산 집약적인 생성적 AI 응용 프로그램을 구동합니다.
P5 인스턴스 EC2 UltraCluster에 배포 가능
P5 인스턴스는 클라우드 내에서 고성능 컴퓨팅, 네트워킹 및 스토리지로 이루어진 초대규모 클러스터인 EC2 UltraCluster에 배포할 수 있습니다. 각 EC2 UltraCluster는 강력한 슈퍼컴퓨터로서 고객이 여러 시스템에서 가장 복잡한 AI 교육 및 분산 HPC 워크로드를 실행할 수 있도록 지원합니다.
이 클러스터 내에서 컴퓨팅 노드 간의 효율적인 통신을 위해 P5 인스턴스는 AWS EFA (Elastic Fabric Adapter)로 구동되는 페타비트 규모의 논블로킹 네트워크를 갖추고 있습니다. 이 Amazon EC2 인스턴스용 3,200 Gbps 네트워크 인터페이스를 통해 노드 간의 원활하고 고속 데이터 전송이 보장되어, 고성능 인터노드 통신을 필요로 하는 응용 프로그램에 중요한 역할을 합니다.
P5 인스턴스의 확장성
P5 인스턴스의 확장성으로 머신 러닝 응용 프로그램은 NVIDIA Collective Communications Library를 사용하여 최대 20,000개의 H100 GPU를 활용할 수 있습니다. 이를 통해 AI 개발자와 연구자들은 더 크고 복잡한 AI 프로젝트에도 도전할 수 있게 됩니다.
AWS Marketplace에서 제공
P5 인스턴스의 사용을 더욱 향상시키기 위해 NVIDIA AI Enterprise는 AWS Marketplace에서 제공되는 종합적인 소프트웨어 스위트를 제공합니다. 이 스위트에는 100개 이상의 프레임워크, 사전 훈련된 모델, AI 워크플로우 및 AI 인프라를 최적화하는 도구가 포함되어 있습니다. NVIDIA AI Enterprise는 AI 응용 프로그램의 개발 및 배포를 간소화하며 고성능, 안전하고 클라우드 기반 AI 소프트웨어 플랫폼 구축 및 유지 관리의 복잡성을 해결합니다.
NVIDIA AI Enterprise 시용자 다양한 혜택
NVIDIA AI Enterprise를 사용하는 P5 인스턴스의 사용자는 지속적인 보안 모니터링, 취약점 정기 패치, API 안정성 및 NVIDIA AI 전문가에 대한 액세스와 같은 혜택을 받을 수 있습니다. 이 종합적인 소프트웨어 스위트를 통해 고객은 P5 인스턴스의 잠재력을 최대한 활용하여 AWS 클라우드에서 AI 워크로드의 전체 가능성을 발휘할 수 있습니다.
NVIDIA H100 GPU 강력한 파워와 확장성 제공
NVIDIA H100 GPU를 사용한 Amazon EC2 P5 인스턴스는 클라우드 상에서 AI의 성능과 확장성을 재정의하고 있습니다. LLMs 교육 또는 복잡한 컴퓨터 비전 모델 실행에 있어서 P5 인스턴스는 가장 요구가 높은 AI 응용 프로그램에 필요한 파워와 확장성을 제공하여, AI 분야의 개발자와 연구자들에게 매력적인 선택지가 됩니다.
NVIDIA와 AWS의 긴밀한 협력
NVIDIA와 AWS는 이미 12년 이상 협력하여 GPU 가속을 클라우드로 제공해왔습니다. 새로운 P5 인스턴스는 이 협력의 최신 사례로서 개발자가 다음 세대 AI를 발명할 수 있도록 혁신적인 성능을 제공하는 중요한 진전을 의미합니다.
마무리
NVIDIA 기반 AWS P5 인스턴스에 대한 흥미와 기대를 반영하고 있습니다. 이러한 인스턴스의 뛰어난 성능과 확장성으로 인해 다양한 분야에서 새로운 AI 혁신이 가능해지며, 개발자, 연구자 및 기업들 모두에게 새로운 가능성과 기회가 열립니다. AI 분야의 발전과 함께 NVIDIA와 AWS는 항상 최전선에서 혁신을 주도하며, 첨단 기술에 대한 접근성을 높이는 데 기여하고 있습니다.
'cloud' 카테고리의 다른 글
멀티 클라우드에 알맞는 ADC 적용 (0) | 2023.08.23 |
---|---|
구글 드라이브 vs 원드라이브 클라우드 스토리지 플랫폼 비교 (0) | 2023.08.06 |
Kubeflow가 CNCF 패밀리에 합류 (0) | 2023.07.26 |
삼성 파운드리, 테슬라와의 자율주행 칩 공급 강화로 산업 경쟁 선도 (0) | 2023.07.20 |
가상머신(Virtual Machine, VM) 소프트웨어로 구현된 가상의 컴퓨터 시스템 (0) | 2023.07.17 |