Чутки: партнер Intel працює над відеокартою з двома процесорами BMG-G21 та 48 ГБ пам’яті GDDR6

Kashtan · Повідомлення 13.05.2025 13:06

Пропоную обговорити Чутки: партнер Intel працює над відеокартою з двома процесорами BMG-G21 та 48 ГБ пам’яті GDDR6
Титан зет та 295х2 повертається.

waryag · Повідомлення 13.05.2025 13:11

Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.

Scoffer · Повідомлення 13.05.2025 13:13

waryag
Підозрюю що це тупо дві окремі відяхи на одній платі. Ніякого логічного чи апаратного об'єднання за межами "в одному корпусі" не відбулось.

Відправлено через 3 хвилини 24 секунди:
Власне, воно і по фоткі видно що це дві окремі відяхи.

Mcloud · Повідомлення 13.05.2025 13:25

Дві відяхи на одному 8-пін роз*ємі

ronemun · Повідомлення 13.05.2025 13:33

waryag: ↑ 13.05.2025 13:11 Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.

для AI це непотрібно - там зовсім інша математика.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.

firestarter256 · Повідомлення 13.05.2025 13:34

На картинки кривой фотожоп

waryag · Повідомлення 13.05.2025 13:45

Scoffer: ↑ 13.05.2025 13:16 Власне, воно і по фоткі видно що це дві окремі відяхи.

По "фотці" видно в основному кривий фотожоп.

firestarter256

Відправлено через 13 хвилин 5 секунд:

ronemun: ↑ 13.05.2025 13:33для AI це непотрібно - там зовсім інша математика.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.

З діпсік все складно. Незрозуміло, це вони кажуть правду, а де прикривають нелегальні поставки підсанкційних карт.

dead_rat · Повідомлення 13.05.2025 14:25

ronemun: ↑ 13.05.2025 13:33
waryag: ↑ 13.05.2025 13:11 Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.
для AI це непотрібно - там зовсім інша математика.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.

Не вірю з чисто організаційної точки зору.

Компанія китайська, тож ніяких там ігор на західних біржах. Якби вони реально знайшли як отримати х10, вони б мовчали під страхом смерті.

AssayMAS · Повідомлення 13.05.2025 14:31

ronemun: ↑ 13.05.2025 13:33- швидкість зросла в 10+ раз

так на АМД и под 1 модель карт осилили забить на драйвера и переписать драйвер с нуля и под нужный никс.
И как бы только на "H800 GPU" это повторили - но это пока адвокаты Нвидии код не видели - в статье прямо указывают что нвидиевскую куду убрали - а свою самобытную присунули. А своя самобытная "куда" может иметь код нвидиевской, но работать не в 10 раз быстрее, а до 10 раз быстрее. То есть, есть тесты где нету 10 раз... а есть проценты... как и нашли тест где есть 10+ раз.
В статье "might encounter memory access errors every 5000 cycles" то есть убрали проверку на ошибки вот и нашли быстродействие. Но нейронкам пофиг... на такой буст.

Rederst · Повідомлення 13.05.2025 14:45

AssayMAS: ↑ 13.05.2025 14:31
ronemun: ↑ 13.05.2025 13:33- швидкість зросла в 10+ раз
так на АМД и под 1 модель карт осилили забить на драйвера и переписать драйвер с нуля и под нужный никс.
И как бы только на "H800 GPU" это повторили - но это пока адвокаты Нвидии код не видели - в статье прямо указывают что нвидиевскую куду убрали - а свою самобытную присунули. А своя самобытная "куда" может иметь код нвидиевской, но работать не в 10 раз быстрее, а до 10 раз быстрее. То есть, есть тесты где нету 10 раз... а есть проценты... как и нашли тест где есть 10+ раз.
В статье "might encounter memory access errors every 5000 cycles" то есть убрали проверку на ошибки вот и нашли быстродействие. Но нейронкам пофиг... на такой буст.

По факту вони зробили самописний драйвер як я зрозумів.

AssayMAS · Повідомлення 13.05.2025 15:20

Rederst: ↑ 13.05.2025 14:45зробили самописний драйвер

не видел - утверждать не могу. И вопрос какая ОС... .
Там в статье, как я понял, написано что код проходил несколько прокладок до карты и разные прокладки делали разные группы людей и оно было медленно... А ИИделы просто всё скомпилировали в одном проекте. То есть надёргали из чужого кода нужное себе оптимизировали и скомпилировали - забыв о лузлах с памятью.
Такое только можно если исходный код есть, а код есть так как в статье пишут что у них 2000+штук H800 GPU - сами карты стоят как минимум 46млн долларей. Плюс сервера, плюс обслуживание, плюс... - вот на таком объёме и нвидия может поделится исходным кодом - это ж не нищеброды геймеры с шифрованными биосами.
Там просто могли написать свой код на SASS - ассемблере для гпу, а не СИ и проходить прокладки.

dead_rat · Повідомлення 13.05.2025 15:41

AssayMAS: ↑ 13.05.2025 15:20
Такое только можно если исходный код есть, а код есть так как в статье пишут что у них 2000+штук H800 GPU - сами карты стоят как минимум 46млн долларей. Плюс сервера, плюс обслуживание, плюс... - вот на таком объёме и нвидия может поделится исходным кодом -

Ви ж пожартували, вірно?

Компанія з обертом 39 мільярдів поділиться однією з головних бізнес таємниць з потенційним конкурентом що заплатив 46 млн? Тобто за 0,12% від обороту поставити себе у такі ризики?!

bayta · Повідомлення 13.05.2025 15:45

Навіть пайка дроселів однакова, і лінії що повинні йти на псі-експресс йдуть в нікуди. Фотошоп - 100%.

Scoffer · Повідомлення 13.05.2025 16:08

dead_rat: ↑ 13.05.2025 14:25Компанія китайська, тож ніяких там ігор на західних біржах. Якби вони реально знайшли як отримати х10, вони б мовчали під страхом смерті.

Асемблер нвідії це на 100% документована штука
https://docs.nvidia.com/cuda/parallel-thread-execution/
Тут ситуація як з прогами під проц, теж можна писати на асмі суперефективно, всі знають що можна писати на асмі суперефективно, але по факту пишуть на електроні тому що стильно, модно і молодіжно. Якщо китайцям з якоїсь дивної причини стало не влом, батоги там допомогли, чи я не знаю, то можна і на асмі, а чого ні.

Sanьka · Повідомлення 13.05.2025 17:17

Фото звісно фейк.
Але мені цікаво у Інтела є технологія об'єднання 2 ГПУ? Наче ж Слай і кросфайр то запатентовані технології.

AssayMAS · Повідомлення 13.05.2025 17:30

dead_rat: ↑ 13.05.2025 15:41Тобто за 0,12% від обороту поставити себе у такі ризики?!

ДА - где гарантии что в ПО нет бэкдоров? А так исходники есть - хоть какая то гарантия что нет УМЫШЛЕННЫХ дыр.
Там железа на сотни миллионов, а труда в ПО - недо ИИ что на нем крутится под миллиард денег. Это корпорация ИИделов должна от Нвидии код "ИИ" прятать.

Аціо · Повідомлення 13.05.2025 17:46

Краще хтось підказав Інтел не вздовж ПП кристал позиціювати а впоперек, за для ефективного охолодження.

ronemun · Повідомлення 13.05.2025 17:58

waryag
dead_rat
AssayMAS
Scoffer
в 10 раз швидше було на великих моделях проти того ж обладнання без оптимізації форматів даних і звязку між картами.
в deepseek геніальність була в системі звязку, яка значно випередила навіть розробки самої Нвідії (хоча вона може й не хотіла цього адже це втрата замовлень).
Цього досягнули якраз на низькому рівні за рахунок виділення 20% потужності чіпа і памяті для інтелектуального кешування і економного розподілу обєму памяті.
І в результаті замість втрати отримали фактично безшовне маштабування на тисячі пристроїв, при тому що санкціями обмежена саме швидкість звязку. Маштабування дозволило обєднати память, що в свою чергу в 10+ раз прискорило обчислення на великій кількості параметрів.
Вплив обєму памяті підтверджує сама Нвідія - в 1,8 рази більший буфер у H200 (144 vs 80 у H100) дає прискорення в 1.9 раз на тому ж залізі для Liama 70b. Для 1 трильйона параметрів оптимізація пересилання даних піднімає криву в небо.
В Нвідії цього добиваються суперкластерами і великим обємом памяті в прискорювачі, а китайці це зробили ефективно з того що мали.

vmsolver · Повідомлення 13.05.2025 18:52

В статье сказано про 10 раз эффективнее чем некие топовые АИ системы, это не означает быстрее.

Сама идея, что там где-то есть нереализованный потенциал с 10 кратным бюджетом уже бы привлёк внимание разработчиков в Nvidia, да и в любой другой конторе, да даже в 1.5 раза это уже интересно, а 10х это как джекпот. Статья просто очередной пиар "прорыва" китайцев, даже если никто из специалистов не знает в чём прорыв, журналисты точно знают правду ))

Відправлено через 5 хвилин 1 секунду:
Вот это гораздо более приземлённая оценка. Ну да, кто-то что-то ускорил на 20%, ок, но обсуждать это на конференции необходимости нет, просто какая-то новость про китайскую LLM, ни дня без пиара китайского искусственного интеллекта

Developers hoping to extract an additional 10-20% performance or power efficiency from their compute loads

max1996 · Повідомлення 13.05.2025 20:05

Sanьka: ↑ 13.05.2025 17:17 Фото звісно фейк.
Але мені цікаво у Інтела є технологія об'єднання 2 ГПУ? Наче ж Слай і кросфайр то запатентовані технології.

А навіщо щось видумувати. Dx12 і vulkan обіцяли справитись з цим