Последние статьи и обзоры
Новости
AMD представила ускоритель Instinct MI100 на архитектуре Compute DNA
-
uzurpator84
Junior
- Откуда: Северодонецк
Предлагаю обсудить AMD представила ускоритель Instinct MI100 на архитектуре Compute DNA
Отправлено спустя 2 минуты 26 секунд:
АМД разошлась не на шутку))
Отправлено спустя 2 минуты 26 секунд:
АМД разошлась не на шутку))
-
Shultze
Member
Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
-
freezers
Junior
Красные же в своём ROCm адаптируют все фреймворки под свои карты.Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
Но конечно да, сложнее, чем с нвидией)
Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.
Последний раз редактировалось freezers 16.11.2020 16:55, всего редактировалось 1 раз.
-
benderOS
Member
- Откуда: ЗП
Shultze
Для рукожопов есть оверпрайснутые хуанговские штучки.
А нормальные люди выбирут что получше
Для рукожопов есть оверпрайснутые хуанговские штучки.
А нормальные люди выбирут что получше
-
Tail3r
Member
Нормальные люди выберут то, что будет стабильно работать, и выдавать лучший результат. Юные и не очень юные экономисты же выберут то, что подешевле (читать цена-качество) со всеми вытекающими последствиями, которые были, есть, и наверняка будут.benderOS:Shultze
Для рукожопов есть оверпрайснутые хуанговские штучки.
А нормальные люди выбирут что получше
-
Rezvan
Member
- Откуда: Полтава
Интересно как эти штуки майнят
-
animal_black
Member
- Откуда: Украина
>>Красные же в своём ROCm адаптируют все фреймворки под свои карты.
Пока сильно далеко от возможностей зеленых. Может сырая мощность есть, но софта в достаточном кол-ве не завезли.
PS нельзя сказать, что с тензором нет плясок и бубнов, но с красными в этом вопросе вообще не айс
Пока сильно далеко от возможностей зеленых. Может сырая мощность есть, но софта в достаточном кол-ве не завезли.
PS нельзя сказать, что с тензором нет плясок и бубнов, но с красными в этом вопросе вообще не айс
-
VRoman
Member
- Откуда: Albuquerque, NM, USA
С учётом цены покупки - бесприбыльно.Rezvan:Интересно как эти штуки майнят
-
vltk
Member
- Откуда: Kyiv
animal_black
Интересно, на Инстинкте 100, Tenzorflow for ROCm 4.0 будет идти? И если уже да, то на новых игровых RDNA2 картах тоже пойдет? И также интересно на каком последнем кернеле линукса сделан/отлажен амдшниками ROCm 4.0. Само по себе на будущее (с очень легкой компиляцией любого приложения под куду на рокм) было бы здорово, как полное равенство закрытой куды с открытой рокм - когда ее пользователей станет много и быстрота ее отладки и развития резко возрастет.
Интересно, на Инстинкте 100, Tenzorflow for ROCm 4.0 будет идти? И если уже да, то на новых игровых RDNA2 картах тоже пойдет? И также интересно на каком последнем кернеле линукса сделан/отлажен амдшниками ROCm 4.0. Само по себе на будущее (с очень легкой компиляцией любого приложения под куду на рокм) было бы здорово, как полное равенство закрытой куды с открытой рокм - когда ее пользователей станет много и быстрота ее отладки и развития резко возрастет.
-
edegerev
Member
Уж гуглу оно зачем? Основная фишка гугла TensorFlow под собственные TPU. Тех. инфо под спойлером. А GPU от AMD/Nvidia в основном для облачных клиентов.Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
- спойлер
- TPU четвертого поколения также показали хорошие результаты при обучении модели BERT в большом корпусе Википедии. Обучение длилось 1,82 минуты с 256 TPU четвертого поколения, что лишь немного медленнее, чем 0,39 минуты с 4096 TPU третьего поколения. Между тем, для достижения 0,81-минутного времени обучения с оборудованием Nvidia потребовалось 2048 карт A100 и 512 ядер процессора AMD Epyc 7742.
https://venturebeat.com/2020/07/29/goog ... eneration/
В категории обнаружения «тяжелых» объектов MLPerf TPU четвертого поколения вырвались вперед немного дальше. Эталонная модель (Mask R-CNN), обученная с корпусом COCO за 9,95 минут на 256 TPU четвертого поколения, находясь на расстоянии досягаемости 512 TPU третьего поколения (8,13 минуты). При выполнении рабочей нагрузки по обработке естественного языка, связанной с обучением модели Transformer на англо-немецком наборе данных WMT, 256 TPU четвертого поколения завершили работу за 0,78 минуты. Потребовалось 4096 TPU третьего поколения за 0,35 минуты и 480 карт Nvidia A100 (плюс 256 ядер процессора AMD Epyc 7742) за 0,62 минуты.
Последний раз редактировалось edegerev 16.11.2020 20:45, всего редактировалось 1 раз.
-
Salatik
Member
Если за критерий брать мегахэш/доллар (стоимости карты), то майнят они отвратительно. А если мегахэш/шт - офигительно )))Rezvan:Интересно как эти штуки майнят
-
vltk
Member
- Откуда: Kyiv
edegerev
Гугл полностью отказывается от нвидиа ускорителей для Алексы (изображение/звук) в связи с полным переходом на свои ускорители для задач линейной алгебры.
https://www.itpro.co.uk/cloud/amazon-we ... ia-silicon
Гугл полностью отказывается от нвидиа ускорителей для Алексы (изображение/звук) в связи с полным переходом на свои ускорители для задач линейной алгебры.
https://www.itpro.co.uk/cloud/amazon-we ... ia-silicon
-
sergmkr
Member
давно Amazon = Google ?vltk:edegerev
Гугл полностью отказывается от нвидиа ускорителей для Алексы (изображение/звук) в связи с полным переходом на свои ускорители для задач линейной алгебры.
https://www.itpro.co.uk/cloud/amazon-we ... ia-silicon
-
Spec_2
Member
Да и да.vltk:animal_black
Интересно, на Инстинкте 100, Tenzorflow for ROCm 4.0 будет идти? И если уже да, то на новых игровых RDNA2 картах тоже пойдет? И также интересно на каком последнем кернеле линукса сделан/отлажен амдшниками ROCm 4.0. Само по себе на будущее (с очень легкой компиляцией любого приложения под куду на рокм) было бы здорово, как полное равенство закрытой куды с открытой рокм - когда ее пользователей станет много и быстрота ее отладки и развития резко возрастет.
ROCm 4.0 для всех навей в середине-конце следующего квартала.
-
osmose
Member
Просто оставлю это здесь
-
sutrau
Member
- Откуда: Умань
Продолжаем играть в тестыosmose:Просто оставлю это здесь
-
Asmodeus55555
Member
- Откуда: Another world
AMD представила ускоритель вычислений Instinct MI100 — больше 10 Тфлопс в операциях двойной точности
Instinct MI100 обеспечивает пиковую производительность до 11,5 Тфлопс в операциях FP64 и до 46,1 Тфлопс в операциях одинарной точности FP32.
-
Valenook
Member
- Откуда: Киев
Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.freezers:Красные же в своём ROCm адаптируют все фреймворки под свои карты.Shultze:Только не очень понятно, что на всем этом запускать. Nvidia хорошие фреймворки поддерживает, инференс, Гугл оптимизирует Tensorflow под nvidia. А под красных - пляски с бубном, а не нейросети.
Но конечно да, сложнее, чем с нвидией)
Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.
https://github.com/RadeonOpenCompute/RO ... re-Support
-
Shultze
Member
Унылая унылаяValenook:Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.freezers: Красные же в своём ROCm адаптируют все фреймворки под свои карты.
Но конечно да, сложнее, чем с нвидией)
Но с другой стороны, если ребята заморачиваются с такими картами, тем более скорее что не с одной, а несколькими, то потратить единожды время на настройку - не проблема.
https://github.com/RadeonOpenCompute/RO ... re-Support
Изучал этот вопрос
-
Valenook
Member
- Откуда: Киев
Мне вот каждый раз хочется написать, когда читаю сферу применения, что алло, какие нейронки, какие глубокие сети, вы хоть, что-то пробовали из популярных фреймворков собрать под ROCm, а перед этим собрать сам ROCm под видеокарту с RDNA архитектурой?Shultze:Унылая унылаяValenook:
Не знаю, кто там, что оптимизирует в "своём ROCm", но сейчас поддержка весьма унылая, а уже год прошел с релиза RDNA первой версии, а воз и нынче там.
https://github.com/RadeonOpenCompute/RO ... re-Support
Изучал этот вопрос