Пропоную обговорити Китайська компанія Denglin випускатиме GPU для обчислень ШІ
15 Вт
А що так можна було?
Після того як почитав новину зайшов на yt, а там в топі ось це.
Останні статті і огляди
Новини
Китайська компанія Denglin випускатиме GPU для обчислень ШІ
-
daesz
Member
-
Ghody
Member
- Звідки: Израиль
У айфона 17топс, так что ничего в этих числах удивительного, у интела были усб брелки на 1топсdaesz: ↑ 16.07.2023 12:18 Пропоную обговорити Китайська компанія Denglin випускатиме GPU для обчислень ШІ
15 Вт
А що так можна було?
Після того як почитав новину зайшов на yt, а там в топі ось це.
-
VovaII
Member
В Китаї 13 компаній розробників відях??
-
ssslinks
Junior
так а що дивного, їх можна навіть в нас хоч 100 створити, тільки сенс з того, якщо ніяких видатних результатів немаVovaII: ↑ 16.07.2023 14:00 В Китаї 13 компаній розробників відях??
-
minesweeper
Member
Уявіть симбіоз супер злого ШІ та квантового вичіслювача Це породить самого техночерта...
-
agarus
Member
Вже давно породили. Маленькі пишуть коменти за 15р, великі - роблять ці відоси з безглуздими теоріями змови.minesweeper: ↑ 16.07.2023 14:38 Уявіть симбіоз супер злого ШІ та квантового вичіслювача. Це породить самого техночерта...
-
minesweeper
Member
Так відео не про симбіоз, а про квантові кубіти та проблему сучасного шифрування, як воно в майбутьньому застаріє. А Про симбіоз я подумав коли прочитав про WormGPT
Вже давно породили. Маленькі пишуть коменти за 15р, великі - роблять ці відоси з безглуздими теоріями змови.
-
firestarter256
Member
- Звідки: Дэнвер
VovaII
в конце 90-х их тоже было вагон, остались 3
в конце 90-х их тоже было вагон, остались 3
-
zaqik
Member
- Звідки: Душниличі
Одному мне из контекста не совсем понятно, что речь про ограничения на поставку именно в Китай? А то пошёл гуглить как это США сама себя ограничивает.США вводить обмеження на постачання потужних прискорювачів Nvidia
-
daesz
Member
Там різниця між н100 і н800 настільки смішна, що можете читати як :zaqik: ↑ 16.07.2023 19:26Одному мне из контекста не совсем понятно, что речь про ограничения на поставку именно в Китай? А то пошёл гуглить как это США сама себя ограничивает.США вводить обмеження на постачання потужних прискорювачів Nvidia
США нічого не вводили
-
ronemun
Advanced Member
Жах, передруковувати з російської жовтої преси, яка на Китай надрочує по команді зверху, дочого докотився ресурс
Також в статті грубі помилки, хоч би вичитували перед публікацією.
сказано про "16 Тфлопс подвійної точності", а в таблиці ці 16 Тфлопс приведені навпроти FP16, тобто плаваючої коми 16 біт
Тоді як подвійна точність це 64 біт, тому що одинарна це 32. 16 біт це половинна.
І тут Fp16 приведена лише для шт.інтелекту, де робляться матричні обчислення, модуль яких перемножує матрицю за такт, але який по суті видає лише ОДИН результат. ТОбто йому не потрібно це все кешувати, ставити в чергу, і т.п. Він тупо ті ж дані відразу переписує новими, попередні дані зникають, і так в циклі. Це тупо колосальне клацання ключів, а результат в кінці одне число FP16. ТАкий модуль робить багато операцій FP, але ЗНААЧно простіше ніж звичайні FMA які зробили б туж кількість операцій за такт, але при цьому б видали в рази більше результатів. Фактично цей модуль лише трішки складніше за звичайний FMA, і користь від нього для графіки ніякого. В звичайних прискорювачах AI таких в 100 раз більше ніж в китайців. Порівняння з Geforce 1080, яка вийшла в травні 16 року, взагалі недоречне - там 2560 шейдерів чистих 32 біт. Фактично, трохи добавити транзисторів і це був би не 9 Тфлопс 32 біт FMA, а в 10 раз більше FP16 тензорних, і це лише шейдери, не рахуючи суперпродуктивні текстурники, геометричні блоки і т.п.
Також в статті грубі помилки, хоч би вичитували перед публікацією.
сказано про "16 Тфлопс подвійної точності", а в таблиці ці 16 Тфлопс приведені навпроти FP16, тобто плаваючої коми 16 біт
Тоді як подвійна точність це 64 біт, тому що одинарна це 32. 16 біт це половинна.
І тут Fp16 приведена лише для шт.інтелекту, де робляться матричні обчислення, модуль яких перемножує матрицю за такт, але який по суті видає лише ОДИН результат. ТОбто йому не потрібно це все кешувати, ставити в чергу, і т.п. Він тупо ті ж дані відразу переписує новими, попередні дані зникають, і так в циклі. Це тупо колосальне клацання ключів, а результат в кінці одне число FP16. ТАкий модуль робить багато операцій FP, але ЗНААЧно простіше ніж звичайні FMA які зробили б туж кількість операцій за такт, але при цьому б видали в рази більше результатів. Фактично цей модуль лише трішки складніше за звичайний FMA, і користь від нього для графіки ніякого. В звичайних прискорювачах AI таких в 100 раз більше ніж в китайців. Порівняння з Geforce 1080, яка вийшла в травні 16 року, взагалі недоречне - там 2560 шейдерів чистих 32 біт. Фактично, трохи добавити транзисторів і це був би не 9 Тфлопс 32 біт FMA, а в 10 раз більше FP16 тензорних, і це лише шейдери, не рахуючи суперпродуктивні текстурники, геометричні блоки і т.п.
-
dreikk91
Member
- Звідки: UA; Lviv
Може в них звичайна точність 8 біт
-
ronemun
Advanced Member
dreikk91
8 біт є різні, тензорні в нвідії h100 int8 це 4000 Тфлопс, а fp8 так само, fp16 2000 Тфлопс, а не всього 16, як в китайців, а FP32, ті що в графіці, всього 67, що в 7.5 раз більше ніж в Geforce 1080. Зате дійсно подвійна точність FP64 в h100 ті ж 67Tфлопс, тоді як в Geforce 1080 всього 0.25, тобто в 270 раз меньше. Але ці всі операції H100 роблять окремі конвеєри паралельно!!! ТОму Нвідія і коштує 1+ трильйон доларів
До того ж Нвідія все це добро легко обєднує шинами по 1 ТБайт/с на кожен чіп в супер компютер у 256 штук, зі спільною відеопамяттю в 256х96 Гбайт
Щодо декодування відео - щоб ви розуміли, що довший час самі круті декодери/кодери відео, в т.ч. для відеобробеи спецефектів, були в інтелівських інтегрованих картах починаючи з 14 року, і, згідно специфікації інтел, кожен блок шейдерів, а їх було 20 в HD4200, міг обробляти 1 потік 1080p@30fps в реальному часі. Тоді як відеокарта воно було лише для контри чи древніх іграшок. Мобільні броадвели 15 року мали вже 72 конвеєри навіть в 2х ядерних процах, і підтримували vp9/hevc
8 біт є різні, тензорні в нвідії h100 int8 це 4000 Тфлопс, а fp8 так само, fp16 2000 Тфлопс, а не всього 16, як в китайців, а FP32, ті що в графіці, всього 67, що в 7.5 раз більше ніж в Geforce 1080. Зате дійсно подвійна точність FP64 в h100 ті ж 67Tфлопс, тоді як в Geforce 1080 всього 0.25, тобто в 270 раз меньше. Але ці всі операції H100 роблять окремі конвеєри паралельно!!! ТОму Нвідія і коштує 1+ трильйон доларів
До того ж Нвідія все це добро легко обєднує шинами по 1 ТБайт/с на кожен чіп в супер компютер у 256 штук, зі спільною відеопамяттю в 256х96 Гбайт
Щодо декодування відео - щоб ви розуміли, що довший час самі круті декодери/кодери відео, в т.ч. для відеобробеи спецефектів, були в інтелівських інтегрованих картах починаючи з 14 року, і, згідно специфікації інтел, кожен блок шейдерів, а їх було 20 в HD4200, міг обробляти 1 потік 1080p@30fps в реальному часі. Тоді як відеокарта воно було лише для контри чи древніх іграшок. Мобільні броадвели 15 року мали вже 72 конвеєри навіть в 2х ядерних процах, і підтримували vp9/hevc
-
coffeeman
Member
- Звідки: Lviv
"Goldwasser" - назва достойна королів жовтого снігу.