Чутки: партнер Intel працює над відеокартою з двома процесорами BMG-G21 та 48 ГБ пам’яті GDDR6

Обсуждение статей и новостей сайта
Відповісти
Автор
Повідомлення
Kashtan
Member
Аватар користувача
Звідки: Яготин

Повідомлення

waryag
Member
Аватар користувача
Звідки: Суми

Повідомлення

Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.
Scoffer
Member
Аватар користувача

Повідомлення

waryag
Підозрюю що це тупо дві окремі відяхи на одній платі. Ніякого логічного чи апаратного об'єднання за межами "в одному корпусі" не відбулось.

Відправлено через 3 хвилини 24 секунди:
Власне, воно і по фоткі видно що це дві окремі відяхи.
Mcloud
Member
Аватар користувача

Повідомлення

Дві відяхи на одному 8-пін роз*ємі :laugh: :laugh:
ronemun
Advanced Member

Повідомлення

waryag: 13.05.2025 13:11 Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.
для AI це непотрібно - там зовсім інша математика.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.
Востаннє редагувалось 13.05.2025 13:36 користувачем ronemun, всього редагувалось 2 разів.
firestarter256
Member
Аватар користувача
Звідки: Дэнвер

Повідомлення

На картинки кривой фотожоп
waryag
Member
Аватар користувача
Звідки: Суми

Повідомлення

Scoffer: 13.05.2025 13:16 Власне, воно і по фоткі видно що це дві окремі відяхи.
По "фотці" видно в основному кривий фотожоп.

firestarter256

:beer:

Відправлено через 13 хвилин 5 секунд:
ronemun: 13.05.2025 13:33для AI це непотрібно - там зовсім інша математика.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.
З діпсік все складно. Незрозуміло, це вони кажуть правду, а де прикривають нелегальні поставки підсанкційних карт.
dead_rat
Member
Аватар користувача
Звідки: Берлін

Повідомлення

ronemun: 13.05.2025 13:33
waryag: 13.05.2025 13:11 Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.
для AI це непотрібно - там зовсім інша математика.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.
Не вірю з чисто організаційної точки зору.

Компанія китайська, тож ніяких там ігор на західних біржах. Якби вони реально знайшли як отримати х10, вони б мовчали під страхом смерті.
AssayMAS
Member
Звідки: ][аркiв

Повідомлення

ronemun: 13.05.2025 13:33- швидкість зросла в 10+ раз
так на АМД и под 1 модель карт осилили забить на драйвера и переписать драйвер с нуля и под нужный никс.
И как бы только на "H800 GPU" это повторили - но это пока адвокаты Нвидии код не видели - в статье прямо указывают что нвидиевскую куду убрали - а свою самобытную присунули. А своя самобытная "куда" может иметь код нвидиевской, но работать не в 10 раз быстрее, а до 10 раз быстрее. То есть, есть тесты где нету 10 раз... а есть проценты... как и нашли тест где есть 10+ раз.
В статье "might encounter memory access errors every 5000 cycles" то есть убрали проверку на ошибки вот и нашли быстродействие. Но нейронкам пофиг... на такой буст.
Rederst
Member
Звідки: Земля

Повідомлення

AssayMAS: 13.05.2025 14:31
ronemun: 13.05.2025 13:33- швидкість зросла в 10+ раз
так на АМД и под 1 модель карт осилили забить на драйвера и переписать драйвер с нуля и под нужный никс.
И как бы только на "H800 GPU" это повторили - но это пока адвокаты Нвидии код не видели - в статье прямо указывают что нвидиевскую куду убрали - а свою самобытную присунули. А своя самобытная "куда" может иметь код нвидиевской, но работать не в 10 раз быстрее, а до 10 раз быстрее. То есть, есть тесты где нету 10 раз... а есть проценты... как и нашли тест где есть 10+ раз.
В статье "might encounter memory access errors every 5000 cycles" то есть убрали проверку на ошибки вот и нашли быстродействие. Но нейронкам пофиг... на такой буст.
По факту вони зробили самописний драйвер як я зрозумів.
AssayMAS
Member
Звідки: ][аркiв

Повідомлення

Rederst: 13.05.2025 14:45зробили самописний драйвер
не видел - утверждать не могу. И вопрос какая ОС... .
Там в статье, как я понял, написано что код проходил несколько прокладок до карты и разные прокладки делали разные группы людей и оно было медленно... А ИИделы просто всё скомпилировали в одном проекте. То есть надёргали из чужого кода нужное себе оптимизировали и скомпилировали - забыв о лузлах с памятью.
Такое только можно если исходный код есть, а код есть так как в статье пишут что у них 2000+штук H800 GPU - сами карты стоят как минимум 46млн долларей. Плюс сервера, плюс обслуживание, плюс... - вот на таком объёме и нвидия может поделится исходным кодом - это ж не нищеброды геймеры с шифрованными биосами.
Там просто могли написать свой код на SASS - ассемблере для гпу, а не СИ и проходить прокладки.
dead_rat
Member
Аватар користувача
Звідки: Берлін

Повідомлення

AssayMAS: 13.05.2025 15:20
Такое только можно если исходный код есть, а код есть так как в статье пишут что у них 2000+штук H800 GPU - сами карты стоят как минимум 46млн долларей. Плюс сервера, плюс обслуживание, плюс... - вот на таком объёме и нвидия может поделится исходным кодом -
Ви ж пожартували, вірно?

Компанія з обертом 39 мільярдів поділиться однією з головних бізнес таємниць з потенційним конкурентом що заплатив 46 млн? Тобто за 0,12% від обороту поставити себе у такі ризики?!
bayta
Member
Аватар користувача
Звідки: Дніпро

Повідомлення

Навіть пайка дроселів однакова, і лінії що повинні йти на псі-експресс йдуть в нікуди. Фотошоп - 100%.
Scoffer
Member
Аватар користувача

Повідомлення

dead_rat: 13.05.2025 14:25Компанія китайська, тож ніяких там ігор на західних біржах. Якби вони реально знайшли як отримати х10, вони б мовчали під страхом смерті.
Асемблер нвідії це на 100% документована штука
https://docs.nvidia.com/cuda/parallel-thread-execution/
Тут ситуація як з прогами під проц, теж можна писати на асмі суперефективно, всі знають що можна писати на асмі суперефективно, але по факту пишуть на електроні тому що стильно, модно і молодіжно. Якщо китайцям з якоїсь дивної причини стало не влом, батоги там допомогли, чи я не знаю, то можна і на асмі, а чого ні.
Sanьka
Member
Аватар користувача

Повідомлення

Фото звісно фейк.
Але мені цікаво у Інтела є технологія об'єднання 2 ГПУ? Наче ж Слай і кросфайр то запатентовані технології.
AssayMAS
Member
Звідки: ][аркiв

Повідомлення

dead_rat: 13.05.2025 15:41Тобто за 0,12% від обороту поставити себе у такі ризики?!
ДА - где гарантии что в ПО нет бэкдоров? А так исходники есть - хоть какая то гарантия что нет УМЫШЛЕННЫХ дыр.
Там железа на сотни миллионов, а труда в ПО - недо ИИ что на нем крутится под миллиард денег. Это корпорация ИИделов должна от Нвидии код "ИИ" прятать.
Аціо
Member
Аватар користувача
Звідки: Poltava s.

Повідомлення

Краще хтось підказав Інтел не вздовж ПП кристал позиціювати а впоперек, за для ефективного охолодження.
ronemun
Advanced Member

Повідомлення

waryag
dead_rat
AssayMAS
Scoffer
в 10 раз швидше було на великих моделях проти того ж обладнання без оптимізації форматів даних і звязку між картами.
в deepseek геніальність була в системі звязку, яка значно випередила навіть розробки самої Нвідії (хоча вона може й не хотіла цього адже це втрата замовлень).
Цього досягнули якраз на низькому рівні за рахунок виділення 20% потужності чіпа і памяті для інтелектуального кешування і економного розподілу обєму памяті.
І в результаті замість втрати отримали фактично безшовне маштабування на тисячі пристроїв, при тому що санкціями обмежена саме швидкість звязку. Маштабування дозволило обєднати память, що в свою чергу в 10+ раз прискорило обчислення на великій кількості параметрів.
Вплив обєму памяті підтверджує сама Нвідія - в 1,8 рази більший буфер у H200 (144 vs 80 у H100) дає прискорення в 1.9 раз на тому ж залізі для Liama 70b. Для 1 трильйона параметрів оптимізація пересилання даних піднімає криву в небо.
В Нвідії цього добиваються суперкластерами і великим обємом памяті в прискорювачі, а китайці це зробили ефективно з того що мали.
vmsolver
Member
Аватар користувача

Повідомлення

В статье сказано про 10 раз эффективнее чем некие топовые АИ системы, это не означает быстрее.

Сама идея, что там где-то есть нереализованный потенциал с 10 кратным бюджетом уже бы привлёк внимание разработчиков в Nvidia, да и в любой другой конторе, да даже в 1.5 раза это уже интересно, а 10х это как джекпот. Статья просто очередной пиар "прорыва" китайцев, даже если никто из специалистов не знает в чём прорыв, журналисты точно знают правду ))

Відправлено через 5 хвилин 1 секунду:
Вот это гораздо более приземлённая оценка. Ну да, кто-то что-то ускорил на 20%, ок, но обсуждать это на конференции необходимости нет, просто какая-то новость про китайскую LLM, ни дня без пиара китайского искусственного интеллекта :lol:
Developers hoping to extract an additional 10-20% performance or power efficiency from their compute loads
max1996
Member

Повідомлення

Sanьka: 13.05.2025 17:17 Фото звісно фейк.
Але мені цікаво у Інтела є технологія об'єднання 2 ГПУ? Наче ж Слай і кросфайр то запатентовані технології.
А навіщо щось видумувати. Dx12 і vulkan обіцяли справитись з цим
Відповісти