Amazon hat die allgemeine Verfügbarkeit der Amazon EC2 P5en-Instanzen bekannt gegeben. Diese Instanzen werden von NVIDIA H200 Tensor Core GPUs und speziell angefertigten Intel Xeon Scalable Prozessoren der 4. Generation angetrieben und bieten eine verbesserte Leistung für Deep Learning, generative KI und HPC-Workloads. Mit einer um 50 % höheren Speicherbandbreite und einer Netzwerkbandbreite von bis zu 3200 Gbit/s mit EFAv3 bieten die P5en-Instanzen einen bis zu viermal höheren Durchsatz zwischen CPU und GPU. Dies führt zu einer verbesserten Latenz und einer effizienteren Skalierung für verteilte Trainings-Workloads. P5en-Instanzen bieten außerdem bis zu 30 TB lokalen NVMe-SSD-Speicher und eine um bis zu 25 % höhere Amazon EBS-Bandbreite. Sie sind in den AWS-Regionen US East (Ohio), US West (Oregon) und Asia Pacific (Tokyo) über EC2 Capacity Blocks for ML, On-Demand und Savings Plan erhältlich.
Neue Amazon EC2 P5en-Instanzen mit NVIDIA H200-GPUs
AWS