AMD створила процесор EPYC Zen 4 з пам'яттю HBM3 спеціально для Microsoft Azure

Обсуждение статей и новостей сайта
Автор
Повідомлення
Alligator
Member
Аватар користувача
Звідки: Миколаїв

Повідомлення

Scoffer: 20.11.2024 13:05
користувачам буде доступно до 352 ядер Zen 4 без технології SMT
А от і AMD слідом вимикає. То шо ви тепер розкажете? :rotate:
Що це технологія яка робить величезний приріст малими втратами, а вимикають бо новітні процесори з неї по швидкодії улітають в космос, тому повернуть як тільки не зможуть нарощувати швидкодію іншими способами та різниця не буде стіль велика!
спойлер
Зображення
Scoffer
Member
Аватар користувача

Повідомлення

yurius_r
Фігня це, а не тест. Щоб показати красиві картинки вони запустили мінімум по копії тесту в паралель і прибили їх цвяхами до плитки. А скільки довелось запустити наприклад копій компіляцій ядра лінуксу і не признались :D Це все і без тестів зрозуміло було. HBM це багато тормозних каналів пам'яті, а точніше по 16 на чіп, і того 64 в сумі, з усіма відповідними наслідками. Однопоточна продуктивність буде, м'яко кажучи, не фонтан. Для деяких завдань годиться, але загалом по лікарні - ні.
Ray2000gt
Advanced Member
Звідки: Киев

Повідомлення

Льолххввввваакакершд
М🧟‍♂️🧟‍♂️🧟🚋🧟‍♂️🧟‍♂️🧟‍♂️🧟‍♂️🧟‍♂️🧟‍♂️🧟‍♂️🏊‍♀️🧟‍♂️🧟‍♂️🧟‍♂️🧟‍♂️🧟‍♂️🧟‍♂️🧟‍♂️⌨️ по ззззз :beer:
ronemun
Advanced Member

Повідомлення

FastBullet: 20.11.2024 12:57 Нічого собі швидкість 7 ТБ/с, коли на ДДР5 десь в середньому від 0,06 до 0,1 ТБ/с, а вони навіть не роблять для десктопа 4 канала, щоб досягти хоча б в теорії 0,2 ТБ/с :( :( :(

Хоча насправді яблуко вже зробило у своєму М4 Мах 0,5 ТБ/с, що дуже добре, але я ж кажу про х86…
1. 7 Тбайт/с - це в теорії і лише на завданнях з малою кількістю запитів, потокових. У звичайних задачах через високий час очікування середня швидкість впаде в 3-4 рази, або
просто не буде достатньо пакетів в одну мить щоб завантажити всю шину.
2. 7 Тбайт/с це на 352 ядра@4ГГц. Це 4 окремих 96 ядерних проца Epyc або Xeon, а в них зараз по 12 каналів ddr5, 768 біт на проц, сумарно в теорії 2.45 Тбайт/с при частоті 6400, і 3.4 Тбайт/с при MRDRAM 8.8ГГц в Xeon. Хоча такі системи поки 2х процесорні, але мережі по 400/800 Гбіт/с вже давно норма, і пишуть/читають напряму в оперативу чи кеш. Зате в них любий обєм оперативи, явно більше тих 480 Гбайт, і в рази меньша затримка, що робить їх універсальніше. В 25 році вже буде 16 каналів ddr на проц
3. ціна hbm памяті в 3+ рази більше звичайної dram тому що її на пластині виходить в 3 рази меньший обєм - 1,3 Тбайт проти 3,7 Тбайт. А всілякі hbm3+ ще й дорожчі через велику частоту, 12-16 кристалів на чіп і т.п. Правда, і планки ddr5 великого обєму неймовірно дорогі за 1цю обєму, але для 48 каналів на 4 проца підійдуть найдешевші.
denizen
Member
Звідки: Київ

Повідомлення

Scoffer: 20.11.2024 18:18 denizen
На паркані теж написано. А 370нс для HBM3 не хош?
спойлер
Зображення
І пакети в 2 кілобайти нативно / 1 віртуально, замість 64 байт в DDR.

Відправлено через 3 хвилини 27 секунд:
Alexsandr: 20.11.2024 15:57что явно не годится
Не годиться, але продається цодами як "ядра" прямо тут і зараз :D
З того ж паркану, що ви кинули тут скрін:
"Out in VRAM, H100 sees slightly lower latency than A100, and is comparable to some older client GPUs. For example, the GTX 980 Ti has about 354 ns of VRAM latency."
тобто виходить, що GTX 980 Ti, у якого GDDR5, затримки приблизно такі самі, що і у HBM? Схоже, що це пов'язано з архітектурою самого чіпа, або методом тестування.
Scoffer
Member
Аватар користувача

Повідомлення

denizen
HBM по суті це низькочастотна багато-багатоканальна версія GDDR. ПСП накручується шиною, низькочастотність необхідна для меншого ніж GDDR жору, заради чого ця HBM взагалі і вигадувалась. З чого б їй мати низькі затримки? Вона за визначенням гірше по цьому параметру за GDDR одного з нею покоління.
denizen
Member
Звідки: Київ

Повідомлення

Scoffer: 21.11.2024 16:33 denizen
HBM по суті це низькочастотна багато-багатоканальна версія GDDR. ПСП накручується шиною, низькочастотність необхідна для меншого ніж GDDR жору, заради чого ця HBM взагалі і вигадувалась. З чого б їй мати низькі затримки?
Тут справа не в затримках.
Я для себе хотів зрозуміти, чи може бути така архітектура бути цікавою для домашноьго (ігрового) компьютера.
Ви стверджуете, що це погана ідея, що це якесь нішеве рішення, великі затримки та т.і.
Але я поки не побачив ніяких фактів, які б робили таке рішення поганим. По суті, це та сама архітектура, що і на PS5, тільки на PS5 звичайна GDDR.
Мені здається, що HBM буде краще, бо буде вища пропускна спроможність.
Scoffer
Member
Аватар користувача

Повідомлення

denizen
Однопоточна продуктивність процесора дуже сильно постраждає. Вбудована відяха, якщо така матиметься на борту, очевидно виграє. Чи зробить така заміна щастя в домашній системі? Як на мене - сумнівно. А консолі на те і консолі шоб софт до неї пристосовувався, а не навпаки.

Відправлено через 3 хвилини 59 секунд:
Підхід епла, де вони розвели на інтерпозері 8 каналів LPDDR, в цілому виглядає краще. Збалансованіше.
А ще краще звісно було б просто розвести побільше каналів звичайної DDR. І можна без усяких новомодних підкладок. На ATX материнку легко лізе 8 слотів оперативи. То вже й без дискретної відяхи можна було б обійтись.

Відправлено через 30 хвилин 46 секунд:
Це не жарт щодо без дискретки, 8 каналів останнього 8800-стандарту це 563.2ГБ/с, що більше ніж в 4070ti і перевершує 90+% того на чому грають в стімі. :horror:
Відповісти