Smart Access Memory: Ryzen 3000 и более старые процессоры AMD останутся без поддержки

Scoffer · Сообщение 04.12.2020 17:55

catdoom
Така потрібна технологія, що її спочатку забули перенести з AGP при переході на PCIe в 2003 році, а потім коли в решті решт перенесли, забули заюзати в хасвелах 2013го року

А АМД взагалі забула аж до кінця 2020 року реалізувати

Ну-ну, розказуй далі про революційну складову. І як же без неї тепер далі жити?

nv_ua · Сообщение 04.12.2020 18:01

Интел порезали производительность заплатками, но теперь вернут упущенное, видимо.

многоходовОчка получилась.

Skiff93 · Сообщение 04.12.2020 18:05

Scoffer:Брешуть же. Може в зен1 і не було реалізовано, але в зен2 і зен3 чіп ІО ідентичний.
Просто когось прокинули.

Потрібно zen3 продавати, бо дорого занадто і фанати АМД вже не такі фанати...
"Червоні" потрохи гру перевертали і на 180 градусів вийшло... З "Синіми" тепер місцями помінялись...

warp 37 · Сообщение 04.12.2020 18:10

Это маркетинг. Надо же толкать новые доски. И не важно, что на старых это всё бы спокойно работало.

Salatik · Сообщение 04.12.2020 18:42

Scoffer:catdoom
Все з точністю навпаки. Технологія потрібна щоб швидше перекидувати текстурки з відео в не відео пам'яті і назад.
Ще в часи AGP інтел вигадала AGPшний аналог щоб зменшити вимоги до відеопам'яті, котрої в ті часи було дуже мало і дорого.
На топчиках з 16-20 гігами на борту в цій технології взагалі немає сенсу.

Відправлено через 1 хвилину 36 секунди:
Це одна з причин чому на технологію забили ще в часи AGP: топчикам профіту мізер, головняка купа, а нетопчики для такого ж ефекту можна трішки менше порізати по чіпу.

В смысле быстрее быстрее перебрасывать текстурки? За счёт чего? Скорость переброски текстур зависит от скорости шины. Технология, как я понял, нацелена на другое - на то что бы процессор мог обрабатывать данные находящиеся в видеопамяти, тогда как без этой технологии требуется промежуточный этап в виде пересылки данных в оперативку.

Отправлено спустя 5 минут 35 секунд:
У технологии будет прирост, когда игроделы начнут использовать эту фичу при проектировании игровых движков. Мизерный прирост сейчас, обусловлен тем что игры писались с расчётом на текущие возможности железа. Но никто не будет писать софт/движок вокруг такого способа взаимодействия с видеопамятью, пока поддержка железом потенциальных пользователей не станет подавляющей.

warp 37 · Сообщение 04.12.2020 18:48

gilmore:Предлагаю обсудить Smart Access Memory: Ryzen 3000 и более старые процессоры AMD останутся без поддержки

Ой...

"Для работы механизма Resizable BAR необходима поддержка функции физического уровня PCIe под названием full-rate _pdep_u32/64. В случае платформ Intel ей обладают процессоры Core 4-го поколения (Haswell) и новее, тогда как у AMD она появилась только в недавно выпущенных Ryzen 5000 (Vermeer)."

Соответственно, если это реализует NVIDIA и оно заработает на старых материнских платах Intel (а им плевать на рынок процессоров и материнских плат) со старыми видеокартами NVIDIA (это же "фишка" PCI-E 3.0, а не видеокарт, чипсетов и процессоров, по их словам), вроде Maxwell, Pascal и Turing, кто-то сядет в лужу. Потому что, как я понимаю, в Ampere никто над подобным специально не работал. Значит, теоретически можно реализовать даже на допотопном Kepler c поддержкой PCI-E 3.0. Плюс, все мы ведь знаем, что всё, что работает на Core i9-10900K, может работать и на Core i7-6700K. Ну а тут речь вообще о допотопном Haswell.

В своё время, кэширование шейдеров здорово разгрузило процессоры. А работало даже на древней Fermi, когда рынком правил Maxwell.

Kotya · Сообщение 04.12.2020 18:54

Salatik:
Scoffer:catdoom
Все з точністю навпаки. Технологія потрібна щоб швидше перекидувати текстурки з відео в не відео пам'яті і назад.
Ще в часи AGP інтел вигадала AGPшний аналог щоб зменшити вимоги до відеопам'яті, котрої в ті часи було дуже мало і дорого.
На топчиках з 16-20 гігами на борту в цій технології взагалі немає сенсу.

Це одна з причин чому на технологію забили ще в часи AGP: топчикам профіту мізер, головняка купа, а нетопчики для такого ж ефекту можна трішки менше порізати по чіпу.
В смысле быстрее быстрее перебрасывать текстурки? За счёт чего? Скорость переброски текстур зависит от скорости шины. Технология, как я понял, нацелена на другое - на то что бы процессор мог обрабатывать данные находящиеся в видеопамяти, тогда как без этой технологии требуется промежуточный этап в виде пересылки данных в оперативку.

У технологии будет прирост, когда игроделы начнут использовать эту фичу при проектировании игровых движков. Мизерный прирост сейчас, обусловлен тем что игры писались с расчётом на текущие возможности железа. Но никто не будет писать софт/движок вокруг такого способа взаимодействия с видеопамятью, пока поддержка железом потенциальных пользователей не станет подавляющей.

Фиге се мизерный.

Оно минимальный ФПС бустит и микропросадки.
Собственно - комфорт геймплея нефигово улучшает.
Именно там где надо. А не *средний МАКСИМАЛЬНЫЙ ФПС* Где уже 100+ кадров и так...

catdoom · Сообщение 04.12.2020 20:23

Тесты проводились в разрешении 4K для Shadows of the Tomb Raider и Assassin's Creed: Valhalla, работающих на процессоре Intel Core i7-10700K и двух картах памяти DDR4-2666 по 8 ГБ. Результаты, Улучшение производительности на 3,32% в Shadows of the Tomb Raider и впечатляющее улучшение на 11,54% для Assassin's Creed: Valhalla. https://www.techpowerup.com/275578/asro ... otherboard

VovaVMS · Сообщение 04.12.2020 20:26

Вообще то миры в играх сейчас большие и хочешь не хочешь сначала идет таки загрузка в память (RAM)
А там сперва нужно перекинуть в видео-память даже усли ее видео-памяти десятки GB - там то поначалу пусто...

Вот тут более подробно но вместе с тем лаконично описано:
https://www.techarp.com/computer/smart- ... ory-guide/

Но вот что непонятно - известно что процесоры Ryzen 4000 series отличаются от 3000х (ну и от 5000х тоже) - но нигде не находится информации есть ли для них поддержка такой функции или нет...

VRoman · Сообщение 04.12.2020 20:59

Salatik:Столько шумихи подняли вокруг этого SAM, а реальный прирост заметен разве что бенчерам. Я ещё не видел ни одного теста, где активация технологии превращала бы неиграбельный фпс в играбельный, или условно играбельный в комфортный.

Вы слишком много ждёте от бесплатной програмной примочки. А вообще подъём минимального FPS на 10% в играх будет ощутим сразу.

Salatik · Сообщение 04.12.2020 21:49

Kotya: Фиге се мизерный.

Оно минимальный ФПС бустит и микропросадки.
Собственно - комфорт геймплея нефигово улучшает.
Именно там где надо. А не *средний МАКСИМАЛЬНЫЙ ФПС* Где уже 100+ кадров и так...

Где, в одной игре? В RDR2. Небось какой-то один микросекундный лаг убирает в одном месте, зато на графике 100% прирост по минимальному FPS - победа!
Вы удивитесь, но драйверами, а тем более ОПТИМИЗАЦИЕЙ кода, можно добиться гораздо большего прироста кадров, без надобности собирать "эпический сэт" ))).

Отправлено спустя 5 минут 36 секунд:

VRoman:
Salatik:Столько шумихи подняли вокруг этого SAM, а реальный прирост заметен разве что бенчерам. Я ещё не видел ни одного теста, где активация технологии превращала бы неиграбельный фпс в играбельный, или условно играбельный в комфортный.
Вы слишком много ждёте от бесплатной програмной примочки. А вообще подъём минимального FPS на 10% в играх будет ощутим сразу.

Я от примочки вообще ничего не жду. Я просто говорю, что удивлён что вокруг неё столько шумихи. Апдейт драйверов иной раз даёт больше прироста, однако никто не обсуждает это месяцами. Зря АМД вообще открыли ящик пандоры, с этой технологией. Они то должны были знать что у конкурентов совместимость железа с ней чуть ли не лучше чем у самих. Входной билет в SAM у Intel теперь выходит существенно дешевле, да ещё и вскрылось что древние Haswell в чём-то технологичнее чем Zen 2. Маркетинговый отдел АМД сел в лужу по полной с подачей этой фичи.

ronemun · Сообщение 04.12.2020 22:04

Salatik
ти не правий. В іграх не тільки текстури і шейдери наперед закачані у відеопамять, а й випадкові події, типу вибухів чи пасхалок, які незакачуються в відяху томущо невідомо чи ти їх взагалі натрапиш. А коли натрапиш, то код ігри на проці закачує потрібні дані у відяху і тоді починається лаг, оскільки кадр не готовий поки неприйдуть дані з проца. А вони ідуть через оперативу. А так могли б напряму. До того ж цих пасхалок може бути багато, і код ігри нелінійний, що вимагає частого звертання у відяху - але є ліміт частоти звертань і затримка через особливості PCIe. Через PCIe можна закидувати лише порціями і з певною частотою
На майбутнє це дозволить тупо обєднати проц з відяхою і творити неймовірні ефекти, фактично складні, атомарні і не прямі шейдери у відясі, а також в простому коді програм на проці використовувати можливості модулів відях - текстурники, які обчислюють трансцендентні функції за 1 такт, тисячі FMA ядер, а не 8 на ядро, як в проці
Тепер зрозуміло чому Інтел поховала цю можливість - вона дозволяла використовувати співпроцесори разом з центральним процесом, тупо розширяючи йогог систему команд, що в багатьох випадках в 10-1000 раз прискорило алгоритми. Але тоді б тре було меньше самих центральних процесорів чи їх ядер.

ProGaMeEXT · Сообщение 04.12.2020 22:09

Опять лапшу вешают . Возможность реализации зависит только от желания производителя . Как и Pci-e 4,0 на В450/Х470 . Можно но не хотят . Так и с этой технологией . Чипы I/O в Zen2/Zen3 одинаковые . Значит никаких аппаратных препятствий нет . Только прошивку сделать .

Scoffer · Сообщение 04.12.2020 22:28

Salatik:В смысле быстрее быстрее перебрасывать текстурки? За счёт чего?

За рахунок того, що запихує текстурки напряму, мимо DX/OpenGL/Vulkan API. Менший оверхед. Більша прив'язка до заліза/більший головняк.
В використання в консолях і на маках повірю. На ПК в черговий раз заб'ють і забудуть через цілком об'єктивну причину зоопарку заліза.

Salatik:что бы процессор мог обрабатывать данные находящиеся в видеопамяти

Нащо це йому? Що ти там зібрався обробляти?

Нє, може в GPGPU для майнерів якось і допоможе, але графіка працює не так.
І все одно це в тисячі раз повільніше ніж обробка в пам'яті проца. Ще й мимо процесорного кешу. Він зі сторони PCIe якось не стирчить.
Існує неілюзорний варіант, що швидше копіпастити великими пакетами, ніж побайтно процом щось змінювати в відеопам'яті.

Відправлено через 6 хвилини 21 секунди:

ronemun:чому Інтел поховала цю можливість - вона дозволяла використовувати співпроцесори разом з центральним процесом

Ніхто нічого не ховав. Юзай собі на здоров'я починаючи з хасвелів. Зі сторони проца ніяких обмежень.

ronemun:На майбутнє це дозволить тупо обєднати проц з відяхою

AMD HSA з рівно таким лозунгом вже давненько трупчик. Виявилась нікому непотрібною включно з самою AMD. А такі гарні обіцянки були: почекайте буквально пару місяців, і APU всіх порве. З 2011 року чекаємо

Не вірь всьому, що пишуть. Далеко не кожна технологія, навіть якщо вона здається непоганою на перший погляд, не загибається об реальні подтреби і обмеження.

Salatik · Сообщение 04.12.2020 22:47

ronemun:Salatik
ти не правий. В іграх не тільки текстури і шейдери наперед закачані у відеопамять, а й випадкові події, типу вибухів чи пасхалок, які незакачуються в відяху томущо невідомо чи ти їх взагалі натрапиш. А коли натрапиш, то код ігри на проці закачує потрібні дані у відяху і тоді починається лаг, оскільки кадр не готовий поки неприйдуть дані з проца. А вони ідуть через оперативу. А так могли б напряму. До того ж цих пасхалок може бути багато, і код ігри нелінійний, що вимагає частого звертання у відяху - але є ліміт частоти звертань і затримка через особливості PCIe. Через PCIe можна закидувати лише порціями і з певною частотою
На майбутнє це дозволить тупо обєднати проц з відяхою і творити неймовірні ефекти, фактично складні, атомарні і не прямі шейдери у відясі, а також в простому коді програм на проці використовувати можливості модулів відях - текстурники, які обчислюють трансцендентні функції за 1 такт, тисячі FMA ядер, а не 8 на ядро, як в проці
Тепер зрозуміло чому Інтел поховала цю можливість - вона дозволяла використовувати співпроцесори разом з центральним процесом, тупо розширяючи йогог систему команд, що в багатьох випадках в 10-1000 раз прискорило алгоритми. Але тоді б тре було меньше самих центральних процесорів чи їх ядер.

Это всё костыли, берущие своё начало из многчиповой компоновки PC, и необходимостью связывать всё это безобразие медленными шинами. Будущее за тем что, отчасти, уже произошло в видухах с выходом DX10 - переход от специализированных блоков пиксельных и вертексных шейдеров к унифицированным, так мы мелкими шагами дойдём к тому, что видеокарты научатся делать больше, и CPU станет частично или полностью не нужен будет для обработки графики. Уже в этом поколении карты научат читать с SSD, а в далёком будущем от CPU даже обработка draw call'ов не понадобится. Очень даже может быть.

Kotya · Сообщение 04.12.2020 23:17

ProGaMeEXT:Опять лапшу вешают . Возможность реализации зависит только от желания производителя . Как и Pci-e 4,0 на В450/Х470 . Можно но не хотят . Так и с этой технологией . Чипы I/O в Zen2/Zen3 одинаковые . Значит никаких аппаратных препятствий нет . Только прошивку сделать .

По ядрам CPU чиплета ограничение.
Не по I/O

Salatik
В общем.
Завезли бесплатный буст минимального кадра и просадок.
Не везде, но он реально есть.
И это по вашему...
Плохо.
Гениально!

ronemun · Сообщение 04.12.2020 23:49

Salatik
ти вірно кажеш але, вибач наперед, слабо уявляєш сучасні можливості шин - вже з 21 року PCIe буде мати затримку 5 нс, тобто на рівні з кешем L2 проца, або з кращими L3. І заміть, це затримка відповіді, тобто з шляхом в обидві сторони до ядра сусіднього пристрою, через всі кеші L1, L2. Поверх PCIe v5 працюватиме новий протокол CXL який підтримали всі гранди, він дозволить звязувати проци, прискорювачі/fpga, їх память напряму, з спільним адресним простором, просто окремі контролери памяті для кешів/RAM/FLASH, мережі і т.п.
Це дозволить софту проводити обчислення на проці і прискорювачах напряму, майже без затримок. Наприклад маєш софт гібридний х86+ARM - іже не буде потреби перекомпільовувати тільки на одну платформу чи використовувати емулятори.

Scoffer
Так АМД сама винна - в них навіть зараз доступ до ядер відяхи, які находяться на тому ж кристалі що ядра проца, йде з затримкою в сотні тактів проца, і нема спільного кешу, хоча б L3. Apple в M1 має 16 МБ спільного для всіх модулів супершвидкого Share кешу, тому її софт може напряму звертатись до будь-яких модулів майже напряму, з затримкою в 5-10 нс. Я вже мовчу про 12 МБ спільного для всіх 4 ядер L2 кешу, а не роздільних 0,5 МБ кожному ядру як в АМД, що змушує витісняти дані в L3, забиваючи його і нагружаючи шину даних.
Я взагалі не розумію як можна всередині кристалу мати такі величезні затримки. Адже коли звертаєшся до іншого пристрою за виконанням, а не за даними, то можеш звертатись поза кеш, без його затримки - адже команда за визначенням не може бути в кеші, це ж не дані. І якщо IBM зі своїм 5 літнім 25Гбіт/с на контакт інтерфейсом має оверхед 4 нс, і то до зовнішнього контролера памяті, аналог якого NVlink кабелем по 30см працює, чи на виставці зовнішню оперативу підключають, то як в кристалі можна 25-100 нс затримки отримувати? І ще хвалитись цим. Та навіть за часів DDR2 Атлони 35 нс затримки оперативи мали, а це ще тре команди демультиплексувати, і конденсатори в чіпах памяті зчитати, пройти крізь всі кеші аж до ядра

Отправлено спустя 17 минут 29 секунд:
про реальну швидкість інтерфейсів можна судити по матричній шині в Xeon Skylake EP - доступ по ній йде з затримкою 1 такт по гризонталі і 2 такти по вертикалі. Що при частоті 1 ГГц дає 1-2 нс. Але враховуючи що дані невідомо в якому ядрі (його частині L3) і мала частота проц все одно рахується тормозом для ігрух. Але 1 нс це норма, можна ще меньше піднявши частоту, ще швидшу шину забивши на тепло - просто тре меньші кеші по дорозі - в них вся затримка. Це ідеально для прискорювачів - там нічого не тре кешувати - лише дай задачу і забери дані.

Alex_Lord · Сообщение 05.12.2020 09:46

Круто кинули всех кто купил в прошлом году 3 поколение(3600,3700x и т. д).

Reinmar · Сообщение 05.12.2020 10:19

Фух, так долго решался что брать - r5 3600 или i5 10400f, в итоге 3600 стал дорожать, взял 10400 и не прогадал - дешевле,быстрее с равной памятью еще и с новой картой в будущем будет прирост от этой фичи.

asv · Сообщение 05.12.2020 11:05

1. Никого не смущает, что _pdep_u32/64 это AVX2 инструкция?
2. Прирост будет скорее всего только на топовых видеокартах.