Китайська компанія Denglin випускатиме GPU для обчислень ШІ

daesz · Повідомлення 16.07.2023 12:18

Пропоную обговорити Китайська компанія Denglin випускатиме GPU для обчислень ШІ
15 Вт

А що так можна було?
Після того як почитав новину зайшов на yt, а там в топі ось це.

Ghody · Повідомлення 16.07.2023 13:56

daesz: ↑ 16.07.2023 12:18 Пропоную обговорити Китайська компанія Denglin випускатиме GPU для обчислень ШІ
15 Вт
А що так можна було?
Після того як почитав новину зайшов на yt, а там в топі ось це.

У айфона 17топс, так что ничего в этих числах удивительного, у интела были усб брелки на 1топс

VovaII · Повідомлення 16.07.2023 14:00

В Китаї 13 компаній розробників відях??

ssslinks · Повідомлення 16.07.2023 14:30

VovaII: ↑ 16.07.2023 14:00 В Китаї 13 компаній розробників відях??

так а що дивного, їх можна навіть в нас хоч 100 створити, тільки сенс з того, якщо ніяких видатних результатів нема

minesweeper · Повідомлення 16.07.2023 14:38

Уявіть симбіоз супер злого ШІ та квантового вичіслювача Це породить самого техночерта...

agarus · Повідомлення 16.07.2023 15:04

minesweeper: ↑ 16.07.2023 14:38 Уявіть симбіоз супер злого ШІ та квантового вичіслювача. Це породить самого техночерта...

Вже давно породили. Маленькі пишуть коменти за 15р, великі - роблять ці відоси з безглуздими теоріями змови.

minesweeper · Повідомлення 16.07.2023 15:15

Вже давно породили. Маленькі пишуть коменти за 15р, великі - роблять ці відоси з безглуздими теоріями змови.

Так відео не про симбіоз, а про квантові кубіти та проблему сучасного шифрування, як воно в майбутьньому застаріє. А Про симбіоз я подумав коли прочитав про WormGPT

firestarter256 · Повідомлення 16.07.2023 17:34

VovaII
в конце 90-х их тоже было вагон, остались 3

zaqik · Повідомлення 16.07.2023 19:26

США вводить обмеження на постачання потужних прискорювачів Nvidia

Одному мне из контекста не совсем понятно, что речь про ограничения на поставку именно в Китай? А то пошёл гуглить как это США сама себя ограничивает.

daesz · Повідомлення 16.07.2023 20:51

zaqik: ↑ 16.07.2023 19:26
США вводить обмеження на постачання потужних прискорювачів Nvidia
Одному мне из контекста не совсем понятно, что речь про ограничения на поставку именно в Китай? А то пошёл гуглить как это США сама себя ограничивает.

Там різниця між н100 і н800 настільки смішна, що можете читати як :

США нічого не вводили

ronemun · Повідомлення 16.07.2023 21:04

Жах, передруковувати з російської жовтої преси, яка на Китай надрочує по команді зверху, дочого докотився ресурс

Також в статті грубі помилки, хоч би вичитували перед публікацією.

сказано про "16 Тфлопс подвійної точності", а в таблиці ці 16 Тфлопс приведені навпроти FP16, тобто плаваючої коми 16 біт
Тоді як подвійна точність це 64 біт, тому що одинарна це 32. 16 біт це половинна.
І тут Fp16 приведена лише для шт.інтелекту, де робляться матричні обчислення, модуль яких перемножує матрицю за такт, але який по суті видає лише ОДИН результат. ТОбто йому не потрібно це все кешувати, ставити в чергу, і т.п. Він тупо ті ж дані відразу переписує новими, попередні дані зникають, і так в циклі. Це тупо колосальне клацання ключів, а результат в кінці одне число FP16. ТАкий модуль робить багато операцій FP, але ЗНААЧно простіше ніж звичайні FMA які зробили б туж кількість операцій за такт, але при цьому б видали в рази більше результатів. Фактично цей модуль лише трішки складніше за звичайний FMA, і користь від нього для графіки ніякого. В звичайних прискорювачах AI таких в 100 раз більше ніж в китайців. Порівняння з Geforce 1080, яка вийшла в травні 16 року, взагалі недоречне - там 2560 шейдерів чистих 32 біт. Фактично, трохи добавити транзисторів і це був би не 9 Тфлопс 32 біт FMA, а в 10 раз більше FP16 тензорних, і це лише шейдери, не рахуючи суперпродуктивні текстурники, геометричні блоки і т.п.

dreikk91 · Повідомлення 16.07.2023 21:16

Може в них звичайна точність 8 біт

ronemun · Повідомлення 16.07.2023 21:36

dreikk91
8 біт є різні, тензорні в нвідії h100 int8 це 4000 Тфлопс, а fp8 так само, fp16 2000 Тфлопс, а не всього 16, як в китайців, а FP32, ті що в графіці, всього 67, що в 7.5 раз більше ніж в Geforce 1080. Зате дійсно подвійна точність FP64 в h100 ті ж 67Tфлопс, тоді як в Geforce 1080 всього 0.25, тобто в 270 раз меньше. Але ці всі операції H100 роблять окремі конвеєри паралельно!!! ТОму Нвідія і коштує 1+ трильйон доларів
До того ж Нвідія все це добро легко обєднує шинами по 1 ТБайт/с на кожен чіп в супер компютер у 256 штук, зі спільною відеопамяттю в 256х96 Гбайт
Щодо декодування відео - щоб ви розуміли, що довший час самі круті декодери/кодери відео, в т.ч. для відеобробеи спецефектів, були в інтелівських інтегрованих картах починаючи з 14 року, і, згідно специфікації інтел, кожен блок шейдерів, а їх було 20 в HD4200, міг обробляти 1 потік 1080p@30fps в реальному часі. Тоді як відеокарта воно було лише для контри чи древніх іграшок. Мобільні броадвели 15 року мали вже 72 конвеєри навіть в 2х ядерних процах, і підтримували vp9/hevc

coffeeman · Повідомлення 17.07.2023 11:21

"Goldwasser" - назва достойна королів жовтого снігу.