AMD представила ускоритель Instinct MI100 на архитектуре Compute DNA

uzurpator84 · Сообщение 16.11.2020 16:48

Предлагаю обсудить AMD представила ускоритель Instinct MI100 на архитектуре Compute DNA

Отправлено спустя 2 минуты 26 секунд:
АМД разошлась не на шутку))

Shultze · Сообщение 16.11.2020 16:50

Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.

freezers · Сообщение 16.11.2020 16:54

Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.

Красные же в своём ROCm адаптируют все фреймворки под свои карты.
Но конечно да, сложнее, чем с нвидией)

Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.

benderOS · Сообщение 16.11.2020 16:54

Shultze
Для рукожопов есть оверпрайснутые хуанговские штучки.
А нормальные люди выбирут что получше

Tail3r · Сообщение 16.11.2020 17:30

benderOS:Shultze
Для рукожопов есть оверпрайснутые хуанговские штучки.
А нормальные люди выбирут что получше

Нормальные люди выберут то, что будет стабильно работать, и выдавать лучший результат. Юные и не очень юные экономисты же выберут то, что подешевле (читать цена-качество) со всеми вытекающими последствиями, которые были, есть, и наверняка будут.

Rezvan · Сообщение 16.11.2020 17:38

Интересно как эти штуки майнят

animal_black · Сообщение 16.11.2020 17:43

>>Красные же в своём ROCm адаптируют все фреймворки под свои карты.

Пока сильно далеко от возможностей зеленых. Может сырая мощность есть, но софта в достаточном кол-ве не завезли.

PS нельзя сказать, что с тензором нет плясок и бубнов, но с красными в этом вопросе вообще не айс

VRoman · Сообщение 16.11.2020 18:13

Rezvan:Интересно как эти штуки майнят

С учётом цены покупки - бесприбыльно.

vltk · Сообщение 16.11.2020 19:56

animal_black

Интересно, на Инстинкте 100, Tenzorflow for ROCm 4.0 будет идти? И если уже да, то на новых игровых RDNA2 картах тоже пойдет? И также интересно на каком последнем кернеле линукса сделан/отлажен амдшниками ROCm 4.0. Само по себе на будущее (с очень легкой компиляцией любого приложения под куду на рокм) было бы здорово, как полное равенство закрытой куды с открытой рокм - когда ее пользователей станет много и быстрота ее отладки и развития резко возрастет.

edegerev · Сообщение 16.11.2020 20:31

Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.

Уж гуглу оно зачем? Основная фишка гугла TensorFlow под собственные TPU. Тех. инфо под спойлером. А GPU от AMD/Nvidia в основном для облачных клиентов.

спойлер: TPU четвертого поколения также показали хорошие результаты при обучении модели BERT в большом корпусе Википедии. Обучение длилось 1,82 минуты с 256 TPU четвертого поколения, что лишь немного медленнее, чем 0,39 минуты с 4096 TPU третьего поколения. Между тем, для достижения 0,81-минутного времени обучения с оборудованием Nvidia потребовалось 2048 карт A100 и 512 ядер процессора AMD Epyc 7742.
https://venturebeat.com/2020/07/29/goog ... eneration/

В категории обнаружения «тяжелых» объектов MLPerf TPU четвертого поколения вырвались вперед немного дальше. Эталонная модель (Mask R-CNN), обученная с корпусом COCO за 9,95 минут на 256 TPU четвертого поколения, находясь на расстоянии досягаемости 512 TPU третьего поколения (8,13 минуты). При выполнении рабочей нагрузки по обработке естественного языка, связанной с обучением модели Transformer на англо-немецком наборе данных WMT, 256 TPU четвертого поколения завершили работу за 0,78 минуты. Потребовалось 4096 TPU третьего поколения за 0,35 минуты и 480 карт Nvidia A100 (плюс 256 ядер процессора AMD Epyc 7742) за 0,62 минуты.

Salatik · Сообщение 16.11.2020 20:43

Rezvan:Интересно как эти штуки майнят

Если за критерий брать мегахэш/доллар (стоимости карты), то майнят они отвратительно. А если мегахэш/шт - офигительно )))

vltk · Сообщение 16.11.2020 20:50

edegerev

Гугл полностью отказывается от нвидиа ускорителей для Алексы (изображение/звук) в связи с полным переходом на свои ускорители для задач линейной алгебры.
https://www.itpro.co.uk/cloud/amazon-we ... ia-silicon

sergmkr · Сообщение 16.11.2020 21:43

vltk:edegerev

Гугл полностью отказывается от нвидиа ускорителей для Алексы (изображение/звук) в связи с полным переходом на свои ускорители для задач линейной алгебры.
https://www.itpro.co.uk/cloud/amazon-we ... ia-silicon

давно Amazon = Google ?

Spec_2 · Сообщение 16.11.2020 21:48

vltk:animal_black

Интересно, на Инстинкте 100, Tenzorflow for ROCm 4.0 будет идти? И если уже да, то на новых игровых RDNA2 картах тоже пойдет? И также интересно на каком последнем кернеле линукса сделан/отлажен амдшниками ROCm 4.0. Само по себе на будущее (с очень легкой компиляцией любого приложения под куду на рокм) было бы здорово, как полное равенство закрытой куды с открытой рокм - когда ее пользователей станет много и быстрота ее отладки и развития резко возрастет.

Да и да.
ROCm 4.0 для всех навей в середине-конце следующего квартала.

osmose · Сообщение 16.11.2020 23:14

Просто оставлю это здесь

спойлер: https://overclockers.ru/blog/TEXHAPb/am ... teste-aots

sutrau · Сообщение 17.11.2020 00:36

osmose:Просто оставлю это здесь
спойлер
https://overclockers.ru/blog/TEXHAPb/am ... teste-aots

Продолжаем играть в тесты

Asmodeus55555 · Сообщение 17.11.2020 12:17

AMD представила ускоритель вычислений Instinct MI100 — больше 10 Тфлопс в операциях двойной точности

Instinct MI100 обеспечивает пиковую производительность до 11,5 Тфлопс в операциях FP64 и до 46,1 Тфлопс в операциях одинарной точности FP32.

Valenook · Сообщение 17.11.2020 15:56

freezers:
Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
Красные же в своём ROCm адаптируют все фреймворки под свои карты.
Но конечно да, сложнее, чем с нвидией)

Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.

Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.
https://github.com/RadeonOpenCompute/RO ... re-Support

Shultze · Сообщение 17.11.2020 20:53

Valenook:
freezers: Красные же в своём ROCm адаптируют все фреймворки под свои карты.
Но конечно да, сложнее, чем с нвидией)

Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.
Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.
https://github.com/RadeonOpenCompute/RO ... re-Support

Унылая унылая
Изучал этот вопрос

Valenook · Сообщение 18.11.2020 00:56

Shultze:
Valenook:
Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.
https://github.com/RadeonOpenCompute/RO ... re-Support
Унылая унылая
Изучал этот вопрос

Мне вот каждый раз хочется написать, когда читаю сферу применения, что алло, какие нейронки, какие глубокие сети, вы хоть, что-то пробовали из популярных фреймворков собрать под ROCm, а перед этим собрать сам ROCm под видеокарту с RDNA архитектурой?