NVIDIA Ampere A100 250W TDP графичен процесор на PCIe 4.0, създаден за AI, наука за данни и суперкомпютър, стартиран с обещана 90-процентна производителност на 400W модел

Хардуер / NVIDIA Ampere A100 250W TDP графичен процесор на PCIe 4.0, създаден за AI, наука за данни и суперкомпютър, стартиран с обещана 90-процентна производителност на 400W модел 2 минути четене

Nvidia



NVIDIA официално пусна A100, съвместим с PCIe 4.0 графичен процесор, базиран на архитектурата на следващото поколение Ampere. Въпреки че се отличава с по-нисък TDP профил от 250 W, NVIDIA обещава, че графичният процесор PCIe 4.0 Ampere A100 ще може да предложи до 90 процента от производителността на пълния 400 W A100 HGX GPU. Третият вариант на нарастващото семейство графични процесори Ampere A100, A100 PCIe е предназначен за сървъри, работещи с изкуствен интелект (AI), Data Science и Supercomputing клъстери.

NVIDIA разкри PCI-Express 4.0 вариант на A100 GPU. GPU се базира на 7nm Ampere микроархитектура. Освен това компанията обяви и няколко системи с A100 от водещи производители на сървъри, включително Asus, Dell, Cisco, Lenovo и други. Графичният ускорител 250 W A100 PCIe 4.0 е доста подобен на пълния вариант с TDP от 400 W, а NVIDIA също обещава почти идентична производителност, въпреки значителния спад в TDP профила.



NVIDIA A100 Ampere GPU в PCIe 4.0 форм-фактор със същата 400W A100 HGX GPU конфигурация, но при 250W:

NVIDIA обяви своя PCIe 4.0 A100 PCIe GPU ускорител. Графичният процесор Ampere е достъпен за разнообразен набор от случаи на промишлена употреба със системи, вариращи от един A100 PCIe GPU до сървъри, използващи две карти едновременно през 12-те канала NVLINK, които осигуряват общо 600 GB / s честотна лента за свързване. GPU ускорителят TDP A100 PCIe 250 W не се променя много по отношение на конфигурацията на ядрото в сравнение с 400 W A100 HGX GPU.



Графичният процесор GA100 има спецификациите на варианта 400W A100 HGX с 6912 ядра CUDA, подредени в 108 SM единици, 432 ядра на тензора и 40 GB памет HBM2, която осигурява същата честотна лента на паметта от 1,55 TB / s (закръглена до 1,6 TB / с). Разгръщането на GPU пакета на Стандарт PCIe 4.0 имаше свой собствен недостатък на значително намаляване на TDP. Според съобщенията това означава 10 до 50 процента наказание за изпълнение въз основа на натовареността. Нещо повече, 250W TDP вариантът на A100 GPU е по-подходящ за кратки взривове, отколкото за продължителни натоварвания.

Графичен процесор NVIDIA A100 Ampere в PCIe 4.0 Форм-фактор:

Поради значителното намаляване на TDP профила, може да се предположи, че картата ще разполага с по-ниски тактови честоти, за да компенсира по-малко TDP входа. Показателите за производителност, които NVIDIA пусна, са наистина изненадващи, тъй като се доближават до варианта TDP с мощност 400 W. Ефективността на FP64 все още е оценена на 9,7 / 19,5 TFLOP, производителността на FP32 е оценена на 19,5 / 156/312 TFLOP (Sparsity), производителността на FP16 е оценена на 312/624 TFLOP (Sparsity), а INT8 е на 624/1248 TOPs ( Рядкост).



Простата математика показва и NVIDIA гарантира, че базираният на Ampere PCIe 4.0 250W A100 GPU може да достави 90% от производителността на A100 HGX картата (400W) в топ сървърни приложения. Това е оправдано, тъй като отнема по-малко време на новия вариант, за да изпълни гореспоменатите задачи. Номерата обаче трябва да са валидни само за кратки интервали. В сложни ситуации, които изискват устойчиви GPU възможности, 250W PCIe 4.0 GPU може да доставя от 90 до 50 процента производителност на 400 W A100 HGX GPU.

Микроархитектурата на Ampere със сигурност ще бъде от полза за новия A100. NVIDIA обещава поне 20X подобрение на производителността спрямо предшественика, базиран на Volta. Графичният процесор PCIe 4.0 A100 се отличава с технология на многоинстанционен GPU. Това означава, че един A100 може да бъде разделен на цели седем отделни графични процесора за обработка на различни изчислителни задачи. Въпреки че това увеличава сегментацията, има NVLink от трето поколение, който позволява няколко графични процесора да бъдат обединени в един гигантски графичен процесор.

Етикети nvidia