AMD представила ускоритель Instinct MI100 на архитектуре Compute DNA

Обсуждение статей и новостей сайта
Ответить
Автор
Сообщение
uzurpator84
Junior
Откуда: Северодонецк

Сообщение

Предлагаю обсудить AMD представила ускоритель Instinct MI100 на архитектуре Compute DNA

Отправлено спустя 2 минуты 26 секунд:
АМД разошлась не на шутку))
Shultze
Member

Сообщение

Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
freezers
Junior

Сообщение

Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
Красные же в своём ROCm адаптируют все фреймворки под свои карты.
Но конечно да, сложнее, чем с нвидией)

Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.
Последний раз редактировалось freezers 16.11.2020 16:55, всего редактировалось 1 раз.
benderOS
Member
Откуда: ЗП

Сообщение

Shultze
Для рукожопов есть оверпрайснутые хуанговские штучки.
А нормальные люди выбирут что получше
Tail3r
Member
Аватара пользователя

Сообщение

benderOS:Shultze
Для рукожопов есть оверпрайснутые хуанговские штучки.
А нормальные люди выбирут что получше
Нормальные люди выберут то, что будет стабильно работать, и выдавать лучший результат. Юные и не очень юные экономисты же выберут то, что подешевле (читать цена-качество) со всеми вытекающими последствиями, которые были, есть, и наверняка будут.
Rezvan
Member
Аватара пользователя
Откуда: Полтава

Сообщение

Интересно как эти штуки майнят :D
animal_black
Member
Аватара пользователя
Откуда: Украина

Сообщение

>>Красные же в своём ROCm адаптируют все фреймворки под свои карты.

Пока сильно далеко от возможностей зеленых. Может сырая мощность есть, но софта в достаточном кол-ве не завезли.

PS нельзя сказать, что с тензором нет плясок и бубнов, но с красными в этом вопросе вообще не айс
VRoman
Member
Откуда: Albuquerque, NM, USA

Сообщение

Rezvan:Интересно как эти штуки майнят :D
С учётом цены покупки - бесприбыльно. :D
vltk
Member
Откуда: Kyiv

Сообщение

animal_black

Интересно, на Инстинкте 100, Tenzorflow for ROCm 4.0 будет идти? И если уже да, то на новых игровых RDNA2 картах тоже пойдет? И также интересно на каком последнем кернеле линукса сделан/отлажен амдшниками ROCm 4.0. Само по себе на будущее (с очень легкой компиляцией любого приложения под куду на рокм) было бы здорово, как полное равенство закрытой куды с открытой рокм - когда ее пользователей станет много и быстрота ее отладки и развития резко возрастет.
edegerev
Member
Аватара пользователя

Сообщение

Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
Уж гуглу оно зачем? Основная фишка гугла TensorFlow под собственные TPU. Тех. инфо под спойлером. А GPU от AMD/Nvidia в основном для облачных клиентов.
спойлер
TPU четвертого поколения также показали хорошие результаты при обучении модели BERT в большом корпусе Википедии. Обучение длилось 1,82 минуты с 256 TPU четвертого поколения, что лишь немного медленнее, чем 0,39 минуты с 4096 TPU третьего поколения. Между тем, для достижения 0,81-минутного времени обучения с оборудованием Nvidia потребовалось 2048 карт A100 и 512 ядер процессора AMD Epyc 7742.
https://venturebeat.com/2020/07/29/goog ... eneration/

В категории обнаружения «тяжелых» объектов MLPerf TPU четвертого поколения вырвались вперед немного дальше. Эталонная модель (Mask R-CNN), обученная с корпусом COCO за 9,95 минут на 256 TPU четвертого поколения, находясь на расстоянии досягаемости 512 TPU третьего поколения (8,13 минуты). При выполнении рабочей нагрузки по обработке естественного языка, связанной с обучением модели Transformer на англо-немецком наборе данных WMT, 256 TPU четвертого поколения завершили работу за 0,78 минуты. Потребовалось 4096 TPU третьего поколения за 0,35 минуты и 480 карт Nvidia A100 (плюс 256 ядер процессора AMD Epyc 7742) за 0,62 минуты.
Последний раз редактировалось edegerev 16.11.2020 20:45, всего редактировалось 1 раз.
Salatik
Member

Сообщение

Rezvan:Интересно как эти штуки майнят :D
Если за критерий брать мегахэш/доллар (стоимости карты), то майнят они отвратительно. А если мегахэш/шт - офигительно )))
vltk
Member
Откуда: Kyiv

Сообщение

edegerev

Гугл полностью отказывается от нвидиа ускорителей для Алексы (изображение/звук) в связи с полным переходом на свои ускорители для задач линейной алгебры.
https://www.itpro.co.uk/cloud/amazon-we ... ia-silicon
sergmkr
Member
Аватара пользователя

Сообщение

vltk:edegerev

Гугл полностью отказывается от нвидиа ускорителей для Алексы (изображение/звук) в связи с полным переходом на свои ускорители для задач линейной алгебры.
https://www.itpro.co.uk/cloud/amazon-we ... ia-silicon
давно Amazon = Google ?
Spec_2
Member

Сообщение

vltk:animal_black

Интересно, на Инстинкте 100, Tenzorflow for ROCm 4.0 будет идти? И если уже да, то на новых игровых RDNA2 картах тоже пойдет? И также интересно на каком последнем кернеле линукса сделан/отлажен амдшниками ROCm 4.0. Само по себе на будущее (с очень легкой компиляцией любого приложения под куду на рокм) было бы здорово, как полное равенство закрытой куды с открытой рокм - когда ее пользователей станет много и быстрота ее отладки и развития резко возрастет.
Да и да.
ROCm 4.0 для всех навей в середине-конце следующего квартала.
osmose
Member
Аватара пользователя

Сообщение

Просто оставлю это здесь
спойлер
https://overclockers.ru/blog/TEXHAPb/am ... teste-aots
sutrau
Member
Аватара пользователя
Откуда: Умань

Сообщение

osmose:Просто оставлю это здесь
спойлер
https://overclockers.ru/blog/TEXHAPb/am ... teste-aots
Продолжаем играть в тесты :D
Asmodeus55555
Member
Аватара пользователя
Откуда: Another world

Сообщение

AMD представила ускоритель вычислений Instinct MI100 — больше 10 Тфлопс в операциях двойной точности
Instinct MI100 обеспечивает пиковую производительность до 11,5 Тфлопс в операциях FP64 и до 46,1 Тфлопс в операциях одинарной точности FP32.
Valenook
Member
Откуда: Киев

Сообщение

freezers:
Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
Красные же в своём ROCm адаптируют все фреймворки под свои карты.
Но конечно да, сложнее, чем с нвидией)

Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.
Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.
https://github.com/RadeonOpenCompute/RO ... re-Support
Shultze
Member

Сообщение

Valenook:
freezers: Красные же в своём ROCm адаптируют все фреймворки под свои карты.
Но конечно да, сложнее, чем с нвидией)

Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.
Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.
https://github.com/RadeonOpenCompute/RO ... re-Support
Унылая унылая
Изучал этот вопрос
Valenook
Member
Откуда: Киев

Сообщение

Shultze:
Valenook:
Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.
https://github.com/RadeonOpenCompute/RO ... re-Support
Унылая унылая
Изучал этот вопрос
Мне вот каждый раз хочется написать, когда читаю сферу применения, что алло, какие нейронки, какие глубокие сети, вы хоть, что-то пробовали из популярных фреймворков собрать под ROCm, а перед этим собрать сам ROCm под видеокарту с RDNA архитектурой?
Ответить