Останні статті і огляди
Новини
Чутки: партнер Intel працює над відеокартою з двома процесорами BMG-G21 та 48 ГБ пам’яті GDDR6
-
Kashtan
Member
- Звідки: Яготин
Пропоную обговорити Чутки: партнер Intel працює над відеокартою з двома процесорами BMG-G21 та 48 ГБ пам’яті GDDR6
Титан зет та 295х2 повертається.
Титан зет та 295х2 повертається.
-
waryag
Member
- Звідки: Суми
Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.
-
Scoffer
Member
waryag
Підозрюю що це тупо дві окремі відяхи на одній платі. Ніякого логічного чи апаратного об'єднання за межами "в одному корпусі" не відбулось.
Відправлено через 3 хвилини 24 секунди:
Власне, воно і по фоткі видно що це дві окремі відяхи.
Підозрюю що це тупо дві окремі відяхи на одній платі. Ніякого логічного чи апаратного об'єднання за межами "в одному корпусі" не відбулось.
Відправлено через 3 хвилини 24 секунди:
Власне, воно і по фоткі видно що це дві окремі відяхи.
-
Mcloud
Member
Дві відяхи на одному 8-пін роз*ємі



-
ronemun
Advanced Member
для AI це непотрібно - там зовсім інша математика.waryag: ↑ 13.05.2025 13:11 Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.
Востаннє редагувалось 13.05.2025 13:36 користувачем ronemun, всього редагувалось 2 разів.
-
firestarter256
Member
- Звідки: Дэнвер
На картинки кривой фотожоп
-
waryag
Member
- Звідки: Суми
По "фотці" видно в основному кривий фотожоп.Scoffer: ↑ 13.05.2025 13:16 Власне, воно і по фоткі видно що це дві окремі відяхи.
firestarter256

Відправлено через 13 хвилин 5 секунд:
З діпсік все складно. Незрозуміло, це вони кажуть правду, а де прикривають нелегальні поставки підсанкційних карт.ronemun: ↑ 13.05.2025 13:33для AI це непотрібно - там зовсім інша математика.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.
-
dead_rat
Member
- Звідки: Берлін
Не вірю з чисто організаційної точки зору.ronemun: ↑ 13.05.2025 13:33для AI це непотрібно - там зовсім інша математика.waryag: ↑ 13.05.2025 13:11 Якась маячня.
Партнер не може просто так взяти і об'єднати два чипа в одній карті, спочатку підтримку повинен реалізувати чипмейкер на рівні заліза-драйверів.
в deepseek пішли ще далі - взагалі викинули cuda, взяли низькорівневу основу для cuda і зробили таке що навіть не снилось нікому - швидкість зросла в 10+ раз.
Компанія китайська, тож ніяких там ігор на західних біржах. Якби вони реально знайшли як отримати х10, вони б мовчали під страхом смерті.
-
AssayMAS
Member
- Звідки: ][аркiв
так на АМД и под 1 модель карт осилили забить на драйвера и переписать драйвер с нуля и под нужный никс.ronemun: ↑ 13.05.2025 13:33- швидкість зросла в 10+ раз
И как бы только на "H800 GPU" это повторили - но это пока адвокаты Нвидии код не видели - в статье прямо указывают что нвидиевскую куду убрали - а свою самобытную присунули. А своя самобытная "куда" может иметь код нвидиевской, но работать не в 10 раз быстрее, а до 10 раз быстрее. То есть, есть тесты где нету 10 раз... а есть проценты... как и нашли тест где есть 10+ раз.
В статье "might encounter memory access errors every 5000 cycles" то есть убрали проверку на ошибки вот и нашли быстродействие. Но нейронкам пофиг... на такой буст.
-
Rederst
Member
- Звідки: Земля
По факту вони зробили самописний драйвер як я зрозумів.AssayMAS: ↑ 13.05.2025 14:31так на АМД и под 1 модель карт осилили забить на драйвера и переписать драйвер с нуля и под нужный никс.ronemun: ↑ 13.05.2025 13:33- швидкість зросла в 10+ раз
И как бы только на "H800 GPU" это повторили - но это пока адвокаты Нвидии код не видели - в статье прямо указывают что нвидиевскую куду убрали - а свою самобытную присунули. А своя самобытная "куда" может иметь код нвидиевской, но работать не в 10 раз быстрее, а до 10 раз быстрее. То есть, есть тесты где нету 10 раз... а есть проценты... как и нашли тест где есть 10+ раз.
В статье "might encounter memory access errors every 5000 cycles" то есть убрали проверку на ошибки вот и нашли быстродействие. Но нейронкам пофиг... на такой буст.
-
AssayMAS
Member
- Звідки: ][аркiв
не видел - утверждать не могу. И вопрос какая ОС... .Rederst: ↑ 13.05.2025 14:45зробили самописний драйвер
Там в статье, как я понял, написано что код проходил несколько прокладок до карты и разные прокладки делали разные группы людей и оно было медленно... А ИИделы просто всё скомпилировали в одном проекте. То есть надёргали из чужого кода нужное себе оптимизировали и скомпилировали - забыв о лузлах с памятью.
Такое только можно если исходный код есть, а код есть так как в статье пишут что у них 2000+штук H800 GPU - сами карты стоят как минимум 46млн долларей. Плюс сервера, плюс обслуживание, плюс... - вот на таком объёме и нвидия может поделится исходным кодом - это ж не нищеброды геймеры с шифрованными биосами.
Там просто могли написать свой код на SASS - ассемблере для гпу, а не СИ и проходить прокладки.
-
dead_rat
Member
- Звідки: Берлін
Ви ж пожартували, вірно?AssayMAS: ↑ 13.05.2025 15:20
Такое только можно если исходный код есть, а код есть так как в статье пишут что у них 2000+штук H800 GPU - сами карты стоят как минимум 46млн долларей. Плюс сервера, плюс обслуживание, плюс... - вот на таком объёме и нвидия может поделится исходным кодом -
Компанія з обертом 39 мільярдів поділиться однією з головних бізнес таємниць з потенційним конкурентом що заплатив 46 млн? Тобто за 0,12% від обороту поставити себе у такі ризики?!
-
bayta
Member
- Звідки: Дніпро
Навіть пайка дроселів однакова, і лінії що повинні йти на псі-експресс йдуть в нікуди. Фотошоп - 100%.
-
Scoffer
Member
Асемблер нвідії це на 100% документована штукаdead_rat: ↑ 13.05.2025 14:25Компанія китайська, тож ніяких там ігор на західних біржах. Якби вони реально знайшли як отримати х10, вони б мовчали під страхом смерті.
https://docs.nvidia.com/cuda/parallel-thread-execution/
Тут ситуація як з прогами під проц, теж можна писати на асмі суперефективно, всі знають що можна писати на асмі суперефективно, але по факту пишуть на електроні тому що стильно, модно і молодіжно. Якщо китайцям з якоїсь дивної причини стало не влом, батоги там допомогли, чи я не знаю, то можна і на асмі, а чого ні.
-
Sanьka
Member
Фото звісно фейк.
Але мені цікаво у Інтела є технологія об'єднання 2 ГПУ? Наче ж Слай і кросфайр то запатентовані технології.
Але мені цікаво у Інтела є технологія об'єднання 2 ГПУ? Наче ж Слай і кросфайр то запатентовані технології.
-
AssayMAS
Member
- Звідки: ][аркiв
ДА - где гарантии что в ПО нет бэкдоров? А так исходники есть - хоть какая то гарантия что нет УМЫШЛЕННЫХ дыр.dead_rat: ↑ 13.05.2025 15:41Тобто за 0,12% від обороту поставити себе у такі ризики?!
Там железа на сотни миллионов, а труда в ПО - недо ИИ что на нем крутится под миллиард денег. Это корпорация ИИделов должна от Нвидии код "ИИ" прятать.
-
Аціо
Member
- Звідки: Poltava s.
Краще хтось підказав Інтел не вздовж ПП кристал позиціювати а впоперек, за для ефективного охолодження.
-
ronemun
Advanced Member
waryag
dead_rat
AssayMAS
Scoffer
в 10 раз швидше було на великих моделях проти того ж обладнання без оптимізації форматів даних і звязку між картами.
в deepseek геніальність була в системі звязку, яка значно випередила навіть розробки самої Нвідії (хоча вона може й не хотіла цього адже це втрата замовлень).
Цього досягнули якраз на низькому рівні за рахунок виділення 20% потужності чіпа і памяті для інтелектуального кешування і економного розподілу обєму памяті.
І в результаті замість втрати отримали фактично безшовне маштабування на тисячі пристроїв, при тому що санкціями обмежена саме швидкість звязку. Маштабування дозволило обєднати память, що в свою чергу в 10+ раз прискорило обчислення на великій кількості параметрів.
Вплив обєму памяті підтверджує сама Нвідія - в 1,8 рази більший буфер у H200 (144 vs 80 у H100) дає прискорення в 1.9 раз на тому ж залізі для Liama 70b. Для 1 трильйона параметрів оптимізація пересилання даних піднімає криву в небо.
В Нвідії цього добиваються суперкластерами і великим обємом памяті в прискорювачі, а китайці це зробили ефективно з того що мали.
dead_rat
AssayMAS
Scoffer
в 10 раз швидше було на великих моделях проти того ж обладнання без оптимізації форматів даних і звязку між картами.
в deepseek геніальність була в системі звязку, яка значно випередила навіть розробки самої Нвідії (хоча вона може й не хотіла цього адже це втрата замовлень).
Цього досягнули якраз на низькому рівні за рахунок виділення 20% потужності чіпа і памяті для інтелектуального кешування і економного розподілу обєму памяті.
І в результаті замість втрати отримали фактично безшовне маштабування на тисячі пристроїв, при тому що санкціями обмежена саме швидкість звязку. Маштабування дозволило обєднати память, що в свою чергу в 10+ раз прискорило обчислення на великій кількості параметрів.
Вплив обєму памяті підтверджує сама Нвідія - в 1,8 рази більший буфер у H200 (144 vs 80 у H100) дає прискорення в 1.9 раз на тому ж залізі для Liama 70b. Для 1 трильйона параметрів оптимізація пересилання даних піднімає криву в небо.
В Нвідії цього добиваються суперкластерами і великим обємом памяті в прискорювачі, а китайці це зробили ефективно з того що мали.
-
vmsolver
Member
В статье сказано про 10 раз эффективнее чем некие топовые АИ системы, это не означает быстрее.
Сама идея, что там где-то есть нереализованный потенциал с 10 кратным бюджетом уже бы привлёк внимание разработчиков в Nvidia, да и в любой другой конторе, да даже в 1.5 раза это уже интересно, а 10х это как джекпот. Статья просто очередной пиар "прорыва" китайцев, даже если никто из специалистов не знает в чём прорыв, журналисты точно знают правду ))
Відправлено через 5 хвилин 1 секунду:
Вот это гораздо более приземлённая оценка. Ну да, кто-то что-то ускорил на 20%, ок, но обсуждать это на конференции необходимости нет, просто какая-то новость про китайскую LLM, ни дня без пиара китайского искусственного интеллекта
Сама идея, что там где-то есть нереализованный потенциал с 10 кратным бюджетом уже бы привлёк внимание разработчиков в Nvidia, да и в любой другой конторе, да даже в 1.5 раза это уже интересно, а 10х это как джекпот. Статья просто очередной пиар "прорыва" китайцев, даже если никто из специалистов не знает в чём прорыв, журналисты точно знают правду ))
Відправлено через 5 хвилин 1 секунду:
Вот это гораздо более приземлённая оценка. Ну да, кто-то что-то ускорил на 20%, ок, но обсуждать это на конференции необходимости нет, просто какая-то новость про китайскую LLM, ни дня без пиара китайского искусственного интеллекта

Developers hoping to extract an additional 10-20% performance or power efficiency from their compute loads
-
max1996
Member
А навіщо щось видумувати. Dx12 і vulkan обіцяли справитись з цимSanьka: ↑ 13.05.2025 17:17 Фото звісно фейк.
Але мені цікаво у Інтела є технологія об'єднання 2 ГПУ? Наче ж Слай і кросфайр то запатентовані технології.