Сказать, что Ryzen в нынешнем их виде = провал, все-равно что не сказать ничего.
После первой презентации и первых сливов моделей/цен меня смущали 5 нюансов:
1. Не просто так игры везде тестили в 4K (т.е. вместо процов теститили видяхи) и не просто так немалая часть игр была совсем не процессорозависимыми (такие, в которых даже на ТОПовой видяхе почти не видна разница между I3 и i7).
2. Чем обоснована такая разница в цене между младшим 16-поточником и старшим, если у них одинаковое кол-во потоков и кэша + свободный множитель?
3. С чего бы AMD одновременно давала дешевые 16 потоков с припоем и свободным разгоном на дешевых мамках (в т.ч. и авторазгон "до предела возможностей вашего охлада")?
4. Неужели ударят по всем фронтам и выпустят одновременно SR3/SR5/SR7?
5. Почему до последнего дня тянут со снятием NDA на независимые тесты?
Мои субъективные выводы на основе всего, что вчера попалось на глаза:
1. Опасения оправдались. AMD не дурак и не просто так до последнего прятал реальную производительность Ryzen-ов в играх.
Если бы 16-поточные Ryzen-ы рвали 4/8-поточных конкурентов в многопотоке и отставали на 10-20% в синглтреде, то я бы не сказал в их адрес ни одного плохого слова.
Но ведь даже в заточенных под многопоток играх они умудряются сливать i7 или даже i5, а в синглтреде вообще порой уступают FX-ам и i3.
Некоторые скажут "тестите в 4K - за ним будущее!", и это правда, но ведь сейчас в 4K все упирается в видяху и даже i5 в нем отлично тянет ТОПы в подавляющем большинстве случаев.
Через 3-4 года в 4K разница между ТОПовыми i7 и младшими i5 будет аналогичной текущей разнице в 1080p, т.к. к тому моменту появятся соответствующие видяхи.
Сегодня же Ryzen в ряде игр не способен обеспечить даже стабильные 60 FPS. Получается, что сегодня в FullHD для игр лучше i5/i7, а через 3-4 года к моменту появления соответствующих видях появятся и новые процы, с совсем другим уровнем производительности и технологиями.
2. Развод далеких/наивных дураков и тех, кто ест дошираки, зато покупает Айфоны/Титаны/ТОПовые X процы. Хотя не факт, что первые и вторые не являются одним и тем же подвидом одного семейства. Если бы камушки 1800X были отборными и обладали выдающимся разгонным потенциалом или если бы у 1700-го был заблокированный множитель, то я бы еще мог понять эту дикую разницу в цене, но после падения завесы 2-х мнений быть не может.
3. Кто-то верил в i7 по цене i3, а на деле в играх получился i3/i5 в сингле и почти i7 в редком мульте по цене i7. Что же на самом деле дают рядовому пользователю/геймеру припой, свободный множитель, XFR, 16 потоков? Ничего.
Разгона нет, т.ч. свободный множитель нужен 1800X как 5-е колесо машине.
Припой не позволяет разогнать проц до 4.5, а всего-лишь сдерживает проц в стабильном состоянии на стоковых частотах. Что было бы, окажись под крышкой сопли?
XFR, о котором так много было сказано - не что иное, как +100МГц к стоку. "Он выжмет весь потенциал вашего охлада" - говорили они...
Что же корпорация бобра так делала упор на свободный множитель, если на практике от разгона есть только название?
Так же и с TDP - на словах 65/95 vs 140, а на деле все совсем иначе.
"5 GHz on AIR" - кидали на вентилятор, "независимые".
4. Этот вопрос сняли не вчера, но вот истинные причины задержки младших моделей оказались несколько иными.
Раньше можно было подумать, что 16-поточники будут настолько хороши, что 4/8/12-поточники станут отбраковкой и будут задержаны до тех пор, пока часть их потенциальных покупателей не сможет устоять под волной восторженного хайпа (в т.ч. и после офиц. тестов) и выберет ТОПчики.
Сейчас же очевидно, что 1700 для игр (и большинства не узкопрофильных задач) куда более выгодный, чем 1700X/1800X. Причем не настолько хорош он, насколько печален 1800X.
Вы верите, что 1600X через месяц-два будет гнаться до 4.5 и догонит в играх i7? Я не особо верю, т.к. нам показали стоковые частоты младших моделей, да и все остальные недостатки старших моделей вряд ли испарятся в бюджетных решениях.
В то же время получается, что 8/12-поточные Райзены будут гнаться до тех же частот и в играх будут не хуже 16-поточников. Но кто же тогда купит Ryzen 7? 2% потенциальных клиентов?
5. Накопительный пункт с вполне очевидными выводами. На словах/бумаге все очень красиво - много, быстро, дешево, холодно, без ограничений, а в итоге средняя производительность в играх (даже по сравнению с дешевыми моделями от Intel), даже в заточенных под многопоток, не особо дешево, не особо холодно, с рядом ограничений по разгону и подводных камней.
Самый интересный вопрос - чего теперь ждать? Пофиксят BIOS-ы? SR5 будет гнаться до 4.5 и стоить как i5? Через пол года/год завезут Рефреш 16-поточников с исправленными косяками и актуальными частотами? Ждать LGA 2066? Взять i7 6400T по цене i3/i5, 6700K после скидки или X3440 на пол годика?
Нет, это реально печально, с лета ждать Ryzen и получить такой пшик...
Юрій:по-друге гіпертренінг у АМД ефективніший ніж у Інтел
В якому це місці? В усіх оглядах при вимкнені SMT різко зростає FPS.
Якщо глянути на Cinerbench то у АМД +- рівень 6900k у однопотоці а при багатьох ядрах АМД вже починає відриватися, що показує більшу ефективність SMT vs HT ?
Хіба ні?
tvojemale
Забагато тексту!
Хоча цікаво, якого це "експерта" Ви так тяжко цитували? Треба вказувати в кінці цитати її автора, бо можуть виникнути юридичні проблеми
Scoffer:_TR1LLIAN_
Лише в тестах. Так і запишемо: процесор для роботи в Cinerbench
Cinerbench це приклад реального завдання а саме рендерингу, але я бачу вам це не відомо
І раджу ознайомитися з іншими тестами де використовується багато ядер і бачимо що SMT дає більше приросту ніж HT.
На youtube також вже багато відеооглядів де беруть реальне завдання а не тест і АМД швидше їх виконує. (Перекодування відео, рендеринг і т.д.)
Любопытно, что в однопоточном режиме относительные скоростные показатели микроархитектуры Zen хуже, чем в многопоточном случае. Это – прямое указание на то, что технология SMT у инженеров AMD получилась очень удачной. Её эффективность явно выше, чем у интеловской Hyper-Threading.
Востаннє редагувалось 03.03.2017 14:37 користувачем _TR1LLIAN_, всього редагувалось 1 раз.
Юрій:по-друге гіпертренінг у АМД ефективніший ніж у Інтел
В якому це місці? В усіх оглядах при вимкнені SMT різко зростає FPS.
Абсолютно не говорит, что SMT хуже чем у Intel. Говорит лишь о том, что восемь реальных ядер от АМД в играх лучше 16-ти потоков от того же АМД. А вот что этому причиной -- архитектура, планировщик Windows, оптимизация игр под консольные 8-м ядер? Может вы правы, что 8 потоков исполнения в сегодняшних играх потолок, больше не нужно -- тогда бОльший FPS вполне объяснимое и ожидаемое поведение. То-бишь, R7 можно пользовать как 8/8 с возможностью разблокировки до 8/16.
_TR1LLIAN_
Cinebench це лише тест з обмеженими по розміру/складності моделями. Як протестують в cinema 4d з мільйонами полігонів для моделі що важить в оперативі пару десятків гіг - тоді і побалакаємо.
adm0r:Абсолютно не говорит, что SMT хуже чем у Intel.
В сучасних HT просадок немає в аналогічних умовах.
Scoffer:
В сучасних HT просадок немає в аналогічних умовах.
И все-равно есть куча сценариев, когда 8 потоков исполнения распределяются по 6900К эффективнее, чем по Р7 благодаря софту/оптимизациям.
Но рабочие тесты показывают однозначно -- SMT лучше маштабирует проц, чем HT. Иначе объяснить, почему меньшая прозводительность в однопотоке приводит к большей в многопотоке я не могу.
adm0r
Неправильні висновки) Спробую пояснити на пальцях: HT/SMT це всього лише засіб, що дозволяє незадіяним потужностям бути хоч якось використаними. Це одначає що основний потік оброблюється якомога оперативніше, а на другому вже як вийде, в ідеалі. HT саме так і працює (але теж не з першого разу ), а SMT розкидує майже 50/50. Від цього провали в продуктивності головного потоку, і видимість начебто більшого приросту. Так на risc`ах для багатопоточних завдань реалізують, там і потоків на ядро по 8 зустрічається, але така робота ну зовсім не в тему на х86.
На данный момент имеем плохой разгон, некоторые неясности с работой SMT и контроллера памяти. Итого платный бета тест новой архитектуры от АМД. Пусть допиливают. Ждем ЗЕН+.
Scoffer:adm0r
Неправильні висновки) Спробую пояснити на пальцях: HT/SMT це всього лише засіб, що дозволяє незадіяним потужностям бути хоч якось використаними. Це одначає що основний потік оброблюється якомога оперативніше, а на другому вже як вийде, в ідеалі. HT саме так і працює (але теж не з першого разу ), а SMT розкидує майже 50/50. Від цього провали в продуктивності головного потоку, і видимість начебто більшого приросту. Так на risc`ах для багатопоточних завдань реалізують, там і потоків на ядро по 8 зустрічається, але така робота ну зовсім не в тему на х86.
Хмм... дякую.
Тобто ви маєте на увазі, що потоки на Intel не равноцінні? Так, наприклад, дуже грубо, ми маємо основний потік(наприклад, 70%) та допоміжний(30%); а на райзенах обидва потоки мають по 50%, так?
Знаєте на який висновок це наштовхує? Що реальна малопоточна продуктивність райзена могла би бути вищою, тому що СМТ неєффективно використовує потужності ядра. Якщо ви праві, то R3 4/4 буде мати швидший однопотік, і не мати проблеми с кешем L3, тому що він буде на тому ж ССХ. Якщо ж враховувати, що до другої половини 2017го його ще можуть трохи підпиляти... оце ви мені підкинули задачку.
adm0r
Не рівноцінні. Тільки не 70/30, а скільки треба головному потоку / скільки залишиться додатковому. Може бути в конкретні моменти часу і 100 / 0
adm0r:на райзенах обидва потоки мають по 50%
В теорії, принаймні це пояснює як ріст FPS при вимкненні SMT, іграм ще дуже далеко до рівномірного навантаження потоків, так і нормальні результати в рендерах, котрі якраз і навантажують потоки рівномірно.
З першим втіленням HT в P4 було так само.
Scoffer:adm0r
Не рівноцінні. Тільки не 70/30, а скільки треба головному потоку / скільки залишиться додатковому. Може бути в конкретні моменти часу і 100 / 0
adm0r:на райзенах обидва потоки мають по 50%
В теорії, принаймні це пояснює як ріст FPS при вимкненні SMT, іграм ще дуже далеко до рівномірного навантаження потоків, так і нормальні результати в рендерах, котрі навантажують якраз і навантажують потоки рівномірно.
З першим втіленням HT в P4 було так само.
Дякую ще раз. І так, я розумію, 70/30 це лише для прикладу. Тобто, якщо це підтверджується, то наразі треба розглядати ці процессори і без СМТ....
Scoffer
не баламуть. Гіпертрейдінг це не просто 2 потоки, а 1 один 100% основний, а другий - додаткове мікроядро, майже копія основного, знаходиться там же:
1. дозволяє швидко зберегти контекст (кеші) першого потоку, щоб дані не вертати з кешів л1 в л2. Це дозволяє плавніше рішати випадки, коли завдань більше ніж ядер.
2. при оптимізації алгоритмів можна отримати до 100 % приріст, але таких алгоритмів мало, в середньому 25%. І, звичайно, решту вихідних даних в кеші л2 мають бути спільні.
В інтела теж гіпертрейдінг криво працює, якщо планувальник ОС чи програми почне плутати фізичні ядра з логічними, чи часто перекидувати задачі з одних ядер на інші, особливо самі дальні (по часу доступу даних)
З другої сторони в Інтела кеші швидші, кільцева шина забезпечує прямий моментальний доступ всіх елементів (ядер, блоків кешу л3, контролера памяті) між собою. Але це в межах одного блоку по 6-8 ядер і 6-8 х 2,5МБайт кеша л3. В 4-8 ядерних інтелах все в одному блоці, тож і доступ між ядрами і кешами мінімальний, тому і невірне розкидадання потоків малозамітне.
Отправлено спустя 9 минут 57 секунд:
гірше коли в багатопоточній задачі, де всі потоки між собою звязані, один з потоків затормозить (через відволікання ядра іншою задачою). Тоді всі інші потоки теж чекають, і задача сильно просідає. В мультиблочних/мультисокетних системах це часто буває через те що ОС не знає на якому фізичному ядрі рахується задача і який фізичний звязок між ядрами. Лише в Броадвелах почали вводити інструкції управління потоками на рівні ОС-проц, коли ОС знає які ядра в парах, а проц знає які задачі-потоки звязані між собою, використовують спільні дані.
Прямо в картинці презентації технології, дослівно: процесор з НТ може виконати два потоки завдань з більшим паралелизмом, задіюючи невикористані ресурси.
І працює саме так як я казав: основний потік виконується в першу чергу, а інший як доведеться, що видно з кульок на цій же картинці. Якщо перший потік використає всі 6-8 (в залежності від проца) черги планувальника завдань, то на другий фізично не залишиться ніяких ресурсів, хоч переоптимізуйся там з кодом
Суть в тому, що основна частка команд таки не задіює всі 6-8 черги планувальника, тому на вільних можна запустити обробку паралельного потоку даних, для чого лише треба скопіювати набір регістрів і контролер переривань, що сумарно складає ~5% ядра, чим інтел в свій час дуже пишалась Кеші тут зовсім ніяким боком не задіяні.