Процесори AMD Ryzen 7000X3D для платформи AM5 вийдуть у лютому

Обсуждение статей и новостей сайта
Автор
Повідомлення
Intel74320ASuperFin+
Member
Аватар користувача
Звідки: Intel "7" 10nm++

Повідомлення

Ray2000gt: 05.01.2023 20:30
Nikolay Yeryomenko: 05.01.2023 14:36 Intel надо будет вместо 16 E ядер делать свой большой кэш, то как они столько времени были лучшими игровыми процессорами, а кэш большой для игр так и не сделали.
В 5-м поколении у них был L4 кеш 128 МБ. И в 4-м в мобильных.
Штеуд давно мог в инновации и опережал время. А сейчас что? Распродаем модемы, оптаны кому попало и клепаем рефреши с новыми сокетами каждый код :lol: .
Alex_Lord: 05.01.2023 21:28 Посижу еще год на 10900K и спокойно перейду на DDR5 и 78003D, будет правильный апдейд )
Аналогично :up: . Ждал 5950х3д с 200 мегабайтным кешем для игор и работы, а Лизка взяла и выпустила убогий 8 ядерник. 7950х3д не впечатлил объемом кэша. Если он не будет обгонять своего 16 ядерного собрата в рабочих приложениях, то наверное буду ждать Зен 5 или 6. Интуль пока не сделает нормальный сокет и охладит свой керогаз, даже не буду рассматривать.
sergiiua
HWBOT OC Team
Аватар користувача
Звідки: Kyiv

Повідомлення

0063kk: 05.01.2023 18:54
sergiiua: 05.01.2023 15:58 Оо, супер. Буду готовить к замене свой 5800Х3D на 7800Х3D
3060ти оценит ;)
Я "гоняюсь" за количеством ФПС. Поэтому проц решает, а видяха не очень. Сильно прирос фпс при переходе с 5600X на 5800X3D. Видяха на обоих процах практически курит)
Fulkrum
Member
Аватар користувача
Звідки: Днепр

Повідомлення

ДядяСаша: 05.01.2023 12:23Але питання, чому не використати у процах з одним чіплетом площу, яка залишилась від невпаяного другого чіплету для, наприклад, гарного GPU тіпа 7600XT
Чиплет у Рязани около 70 мм2, площадь чипа 7600ХТ около 200мм2. Влезет максимум карта уровня 7400ХТ и та упрется в 128 бит ДДР памяти которую прийдется делить с процом.
В итоге те кому нужно играть - купят игровой проц и игровую видуху. Зачем АМД самим себе портить рынок ПК где они и процы и видухи продают? АПУ для консолей они и так миллионами отгружают.
Mixx
Member
Аватар користувача
Звідки: Чернигов

Повідомлення

А с чего некоторые умникумы решили что кеш будет доступен только одному ядру?) У всех райзенов л3 общий, прирост получат все ядра, ибо даже если учитывать задержки между кристаллами, они в сравнении с задержками ОЗУ сильно меньше, а значит приросту быть :beer:

Сам за таким пока не вижу смысла гнаться, жду как проявят себя 65вт ам5, если потеря производительности от -200мгц как с даунвольтом будет в пределах погрешности - есть смысл взять 2 секции недоводы и перепрыгнуть с ам4, а вот если начудят, тогда наверно апгрейд на что то 5000 серии.
Востаннє редагувалось 06.01.2023 01:41 користувачем Mixx, всього редагувалось 1 раз.
Scoffer
Member
Аватар користувача

Повідомлення

Mixx: 06.01.2023 01:38У всех райзенов л3 общий
:popcorn:
Mixx
Member
Аватар користувача
Звідки: Чернигов

Повідомлення

Scoffer
Либо аргумент с опровержением, либо зачем лезть? ;)

Или вы хотите сказать л3 с одного чиплета не доступен ядрам с другого и наоборот?
Scoffer
Member
Аватар користувача

Повідомлення

Mixx
CPU-Z для кого латиницею по білому пише що кеш на райзенах роздвоєний?
спойлер
Зображення
На пересічно десктопних завданнях механізм підтримки когерентності кешу в парі з планувальником ОС максимально оперативно синхронізують дані в обох кешах. Тобто будуть дві копії одних і тих самих даних, а не в одному кеші одне, а в іншому інше. Якщо одного з кешів буде більше, то відбуватиметься постійне витіснення даних з меншого кешу в оперативу. Тобто в цілому содомія якась відбуватиметься. Я недаремно написав що вінда буде алгоритми під це діло років 10 писати. АМД знову вирішила перехетрити всіх і вистрілила собі в ногу. Добре хоч не в голову.
ronemun
Advanced Member

Повідомлення

Scoffer
Давно в процах з внутрішнім розділенням ніхто не пише копії даних, якщо шина досить швидка. Ще в Інтел Хасвел в кожному кільці були свої планувальники куди які дані йдуть і лічильники кроків до них, і планувальник так розподіляв навантаження на ядра щоб не було вузьких місць в шині. А тоді доступ між кільцями по пару десятків наносекунд мінімум був по коротшому шляху, деколи і 35 (7*5), я мовчу про середній доступ. І це тоді ще L2 був мікро, а зараз в АМД L2 свої по1 МБ, і душе швидкі шини чіплетів. В Zen2 теж ядра прямо звертались в кеші сусідніх блоків. А в Хеонах і так очевидно що кеш порізаний на куски і ніхто не вмер.
Mixx
Member
Аватар користувача
Звідки: Чернигов

Повідомлення

Scoffer
Так работает кеш на камнях интел начиная с л1 и до л3 все данные дублируются (и то не факт, не интересовался глубоко этим вопросом, но там производитель всегда указует общий обьем кеша равным л3, что косвенно подтверждает мои слова), у амд кеш эксклюзивный, включая л1-л2 и л3 не дублируется, именно поэтому амд прямо на коробке и во всех материалах указует суммированый кеш всех уровней например для 5950х это 72мб, при чем такая история еще с феномов 2, когда л3 кеш появился у амд.

Касательно рязаней, видимо забыли, откуда амд брала прирост в производительности последние 5 лет... Сначала на зен и зен+ было 4 чиплета по 4 ядра с 8мб л3 на каждом, это была совсем боль, все потому, что ядра постоянно подтягивали данные с кеша других чиплетов, были адские задержки, потом в зен 2 сделали 2 кристала по 2 чиплета на каждом и удвоили кеш, итого вышло 2х2х16 (для 12-16ядер), что дало существенный прирост, на зен3 же убрали колхоз внутри кристаллов сделав 2 чиплета по 8 ядер и 32 кеша в каждом, если суммировать эти 64мб с 10 мб л1 и л2 как раз и получим те 72мб.

Это если на пальцах и простым языком. Инфы в инете валом.
Scoffer
Member
Аватар користувача

Повідомлення

ronemun
Mixx
Перед тим як нести нісенітниці краще б подивились тест затримок кешу на райзенах.
спойлер
Зображення
Чітко видно ріст затримок в районі розміру завдання в 32 мб що за випадковим збігом обставин дорівнює кешу одного CCX, а ніяк не в районі 64 мб як би мало відбуватись згідно з вашими свідченнями.
Востаннє редагувалось 06.01.2023 02:13 користувачем Scoffer, всього редагувалось 1 раз.
Mixx
Member
Аватар користувача
Звідки: Чернигов

Повідомлення

Верующего не переубедить, итого закрываю безсмысленную дискуссию :beer:
Scoffer
Member
Аватар користувача

Повідомлення

Mixx
А ось тобі кеш 3900, у котрого теж 64 сумарно, зато розчетверені, і о диво, затримки ростуть як не в себе на 16.
спойлер
Зображення
Магія :horror:
Щось натурний експеримент показує що кеші якось не дуже бажають плюсуватись і вести себе як один монолітний.
Якби бажали, то ріпери з їхніми тонами кешів вкладали всіх на лопатки, а вони рівно навпаки, в десктопних завданнях всім зливають.
Востаннє редагувалось 06.01.2023 02:26 користувачем Scoffer, всього редагувалось 4 разів.
ronemun
Advanced Member

Повідомлення

Fulkrum: 05.01.2023 23:55
ДядяСаша: 05.01.2023 12:23Але питання, чому не використати у процах з одним чіплетом площу, яка залишилась від невпаяного другого чіплету для, наприклад, гарного GPU тіпа 7600XT
Чиплет у Рязани около 70 мм2, площадь чипа 7600ХТ около 200мм2. Влезет максимум карта уровня 7400ХТ и та упрется в 128 бит ДДР памяти которую прийдется делить с процом.
В итоге те кому нужно играть - купят игровой проц и игровую видуху. Зачем АМД самим себе портить рынок ПК где они и процы и видухи продают? АПУ для консолей они и так миллионами отгружают.
По перше, як видно по новій презентації, мобільні APU так і вийдуть - з чіплетами Zen4, аж 2 штуки, + RDNA2 чіп. Може це буде новий IO чіп з солідною відяхою, а не те нещастя що зараз, а може взагалі окремий чіп, третій
По друге, основні блоки, які займають дуже багато місця, вже присутні в IO чіпі: контролер памяті, відеокодеки, відеовиходи. Те що вони здоровенні можете переконатись по фото чіпа Алдер/Рапідлейка. А от самі шейдерні блоки + текстури займають ну просто дууже мало місця, і прекрасно маштабуються з новим техпроцесом. Також в APU 6ї версії, 8 ядер Zen3+16МБ кешу займають стільки ж місця як 768 ядер+48текстурників+кеші RDNA2, на 6нм, і це, очевидно, меньше 70 мм.кв., які займають чіплет Zen4. Думаю на 70 мм.кв і на 5нм вміститься всі 1500 ядер, без контролера памяті і т.п.

Scoffer
я ж не кажу що кеш туж затримку має, очевидно що вона фізично не може бути така ж. Я кажу що ніхто так жорстко не копіює дані в кешах як ти наголошуєш що вони поністю ідентичні. Якщо б так копіювали то і затримки на твоїх графіках були значно меньші. Ясно що затримка інтерконекту велика, і ясно що є часткове дублювання, але воно зараз проходить дуже високоінтелектуально, а не просто дані синхронізуються. Так в 8 чіплетних епіках взагалі б місця в кешах нехватило, а всі шини були б забиті на 100% синхронізацією. Я вже мовчу про нові 12 чіплетні. Саме тому що кеш зараз розумний тому і можна стільки ядер/потоків в один проц запхати

В наступних версіях проців і АПУ АМД, очевидно, повністю перейде на нове зєднання за прикладом Радеон 7000 з його кешами, і Instict 300, де кеш винесений до контролера памяті, на дальній рівень тобто, а ядра зі своїми кешами і gpu/gpgpu чіплети зі спільною адресацією будуть вищим рівнем
Востаннє редагувалось 06.01.2023 02:33 користувачем ronemun, всього редагувалось 1 раз.
Scoffer
Member
Аватар користувача

Повідомлення

ronemun
Механізм роботи наступний:
1. ОС перекидує завдання по ядрам тому що так влаштований механізм багатопоточності
2. Як тільки поток потрапляє на інший CCX, ядро звертається до даних в старому кеші бо вони там ще є
3. Механізм підтримки когерентності копіює і буде слідкувати за синхронізацією даних цього потоку аж поки вони не будуть витіснені в оперативу
Відповідно за лічені секунди, а часом і мілісекунди, кеші синхронізуються, що прямо спостерігається на тестах вище. Затримки поза об'ємом локального кешу не просто ростуть, а ростуть майже до рівня вибірки з оперативи.
Це б працювало не так якби ОС не ганяла потоки по ССХ, але АМД в своєму репертуарі вирішила з боку процесора не казати ОС яке ядро до якого кешу прив'язане.

Просто змирись з фактом що в випадку кешів 32+32 = 32. І все стане на свої місця :rotate:
ronemun
Advanced Member

Повідомлення

Scoffer

так весь контекст переноситься, але і дані на попередньому місці довго не залишаються, хіба якщо місце в кеші вільне ще є, що навряд, тим більше що перенос відбувається не так вже й часто - в ОС є певний час протягом якого ядро не можна трогати іншими процесами, а також дані швидко стають неактуальні. Та й зараз, як бачимо по біг-літл ядрах, ОС переносить на довго, також частий перенос шкодить економічності - ядра тре будити і т.п. Тому в ОС є % зайнятості ядер, і він часто не 100%, а взагалі 25-50, тобто 75-50% ядер сплять, якщо можна, і їх ніхто не трогає, а якщо ОС почне перекидати як захоче то проц сам вирішить як тре, а їй докладе що все ОК
Scoffer
Member
Аватар користувача

Повідомлення

ronemun
Також можеш подивитись на 5800х vs 5900x/5950х в ігрульках. Незважаючи на фізично подвоєний кеш в 5900x/5950х і близько нічого подібного до 5800х3д не спостерігається. Бо в х3д кеш з програмної точки зору монолітний, і в для рядової програми виглядає на всі свої 96 метрів, а для 5900x/5950х ні, ті ж самі 32.
В 7000X3D буде абсолютно аналогічно. З поправкою на те що для 7900/50X3D з різними кешами в різних ССХ у планувальника вінди скоріш за все дах поїде.
Mixx
Member
Аватар користувача
Звідки: Чернигов

Повідомлення

Scoffer
Ну, ваши скрины что показуют, до 32мб для зен3 и 16мб для зен2, пока поток живёт в своем физическом кеше - задержки низкие, как только начинаются обращения к соседу - идёт рост задержек в 2-3-4 раза, для зен 1 этот порог будет на 8мб, тут уже физика берет свое, но, изначально о чем я писал, некоторые люди утверждали, что, раз кеш только на 1 чипе, то это ближе к интеловской калогенной архитектуре гомноядер, чем к зен, что в корне неверно, да 1й Кристал тут получает преимущество, но ведь объем л3 все ещё доступно и для 2го, и вот как раз за счёт того, что винда гоняет нагрузку по потокам как ей вздумается - этот объем даст прирост прирост для любого из потоков, но да, для 1го ццх где лежит этот кеш прирост будет выше. И касательно отличий, Интел же пошли другим путем, кристалл монолит, вся инфа от л1 до л3 кеша продублирована, скорости и задержки низкие, но объем на ядро в разы ниже чем у АМД, ну и в добавок нет возможности наращивать ядра сохранив высокие частоты/адекватный тдп/объем кеша, отсюда танцы с огромным количеством отдельно живущих дохлых гомноядер.

И да, я не отрицаю, что для увеличения скорости и уменьшения задержек часть инфы в кеше дублируется, и что при выходе за пределы ццх задержки ростут, я больше о том, что любой поток у АМД может использовать любой участок л3, поэтому в данном случае 32+32=64 а не 32. Но вот эффективное использование - другой вопрос, это одновременно и сильная и слабая сторона архитектуры, ибо даёт возможность как угодно наращивать ядра не упираясь ни во что кроме питания.
Scoffer
Member
Аватар користувача

Повідомлення

Mixx
Ну не працює ж на практиці як ти хочеш. Я як власник 5950х запевняю, що в пересічних ігрульках ніякого профіту від фізичних 32+32 метрів кешу не спостерігається.
Так, якщо я запущу пару віртуалок і руцями розведу їх по різним ССХ буде профіт, але це трішки не пересічно десктопне завдання.

Відправлено через 2 хвилини 32 секунди:
Або запущу дві гри в паралель :lol:
Mixx
Member
Аватар користувача
Звідки: Чернигов

Повідомлення

Scoffer
Ну то, что высокие задержки не дают реализовать объем это тоже не новость, тут вопрос как бы в самом факте наличия общего кеша.

Сомневаюсь, что что-то будут менять для новых 3д, максимум - дадут приоритет выше для 1го ццх, что даст ожидаемый прирост в игрушках, а для рабочих задач скорее всего так и останется аналогом обычного камня на схожей частоте.
Відповісти