Опубліковано тести кваліфікаційного зразка Intel Core Ultra 9 для настільних ПК

Обсуждение статей и новостей сайта
Автор
Повідомлення
ronemun
Advanced Member

Повідомлення

для сучасних ядер, особливо проців без гіпертрейдінгу, CB23 взагалі не тест - в ньому HT на пустому місці видає в 1,5 рази більше очок.
В CB дуже простий код:
1. йому хватає 32 кбайт кешу L1 навіть для 2-3х потоків одночасно, ну і 50-100 кбайт L2 для підкачки, а про L3 взагалі мовчу.
Це видно по тому що він дууже еефективно працює ще на древніх Core i ще 1го покоління. Сучасні ядра на порядок потужніші. І навіть нові p-ядра, нібито спрощені, без гіпертрейдінгу, але вони знаачно вдосконалені відносно 14го покоління, їх IPC дуже крутий. Фактично вони без ГТ дають продуктивність як ті з ГТ.
2. В алгоритмах рендеру типу CB код вже наперед оптимізований, порядок інструкцій відомий наперед і фактично не використовується сучасні суперпотужні блоки планування, перевпорядкування, і т.п. Недаремно зараз весь рендер перекинули на відеокарти - їх знааачно простіші ядра для цього підходять краще, а ядра проца йдуть для складного і хаотичного коду, як в іграх, або мультизадач з непердбачуваним порядком.

Також CB і тупий в тому плані що сам виставляє потоки відповідно до конфігурації проца і не дає виставити БІЛЬШЕ. Це абсолютно тупо, тому що ядра без гіпертрейдінгу теж можуть спокійно переварювати декілька потоків, вони від цього не зависнуть, і сумарний результат виявиться знаачно більшим ніж 1 потік на ядро. А все тому що сучасні ядра мають гігантський запас по продуктивності внутрішніх блоків, в т.ч. спецкешів і шин, це не тільки L1/2/3, там все знаачно складніше. І якийсь простий код як в CB нагружає лише 5% блоків ядра і впирається лише в конвеєр виконання.
AssayMAS
Member
Звідки: ][аркiв

Повідомлення

den888: 25.07.2024 22:33ох це бентежне життя, нові одиниці виміру
ну просто кочегарят ВРУЧНУЮ под предел, а там очень тонкая грань отделяющая от лага, вылета, BSOD...
А с автобустом - если че то не так - то скинет частоты, но рекордов не поставить. Зато максимальный КПД на ватт.
То есть руками топ проц на топ матери ты можешь и до 250Ватт раскочегарнить, но как на долго кремневая лотерея (может минуты до перегрева, а может и года)... и рекомендованные 200Ватт будут медленее от 250Ватт не на 20% (200\250=0,8), а на 5..15% в зависимости от ПО. А вот если проц в 125Ватт ужать то от 250Ваттного режима потеряет не 50% а 20-30%...
А ватты как единицу измерения пишут так как в разном ПО 100% нагрузка сильно по разному Ватт кушает.
Выжимание всех соков из кремния требует кучу времени и знаний - что как по мне никогда не окупится... так что все вендора ввели рубильники в биоса (120 200 250 Ватт) или сколько укажешь. А БИОС сам галки проставит где надо.
MqM
Member
Аватар користувача
Звідки: Україна

Повідомлення

Тема деградації процесора не розкрита
AssayMAS
Member
Звідки: ][аркiв

Повідомлення

MqM: 26.07.2024 03:58Тема деградації процесора не розкрита
ну по своему опыту скажу что бывает и "деградация мат. плат". Проц и7-2600 за 10+ лет плавно разучился в +10% по FSB (через 3..4 года тянут +6% по шине, через 10+ лет +0%). Я сменил его на и7-3770 - переставив и7-2600 в другую мать, там он +6% по ФСБ + автобуст... а на старой матери в никакую - не мог = лаги = микрофризы в ОС без нагрузки. И спиртом утирал, и термопастовым сомелье работал, и под лупой сокет мамы изучал попиново... .
dext
Member
Звідки: Dnipro

Повідомлення

ronemun: 25.07.2024 23:43 Це абсолютно тупо, тому що ядра без гіпертрейдінгу теж можуть спокійно переварювати декілька потоків, вони від цього не зависнуть, і сумарний результат виявиться знаачно більшим ніж 1 потік на ядро. А все тому що сучасні ядра мають гігантський запас по продуктивності внутрішніх блоків, в т.ч. спецкешів і шин, це не тільки L1/2/3, там все знаачно складніше. І якийсь простий код як в CB нагружає лише 5% блоків ядра і впирається лише в конвеєр виконання.
В реальносні воно так не працювало і ніколи не буде працювати тому, що кожен процес монопольно користується кешами/регістрами, що призводить до їх інвалідації - це проблема навіть при HT де є хоч мінімальне керування ресурсами і окремий interrupt controller для кожного потока, без HT у вас взагалі будуть дикі витрати на переключення контексту, тож фокус з "багато процесів на 1 ядро" не працював і не буде
Yaroslav308
Member
Аватар користувача

Повідомлення

ronemun: 25.07.2024 23:43Також CB і тупий в тому плані що сам виставляє потоки відповідно до конфігурації проца і не дає виставити БІЛЬШЕ.
??
спойлер
liaxjok.png
tOW473F.png
den888
Member

Повідомлення

AssayMAS: 26.07.2024 01:26
den888: 25.07.2024 22:33ох це бентежне життя, нові одиниці виміру
ну просто кочегарят ВРУЧНУЮ под предел, а там очень тонкая грань отделяющая от лага, вылета, BSOD...
А с автобустом - если че то не так - то скинет частоты, но рекордов не поставить. Зато максимальный КПД на ватт.
То есть руками топ проц на топ матери ты можешь и до 250Ватт раскочегарнить, но как на долго кремневая лотерея (может минуты до перегрева, а может и года)... и рекомендованные 200Ватт будут медленее от 250Ватт не на 20% (200\250=0,8), а на 5..15% в зависимости от ПО. А вот если проц в 125Ватт ужать то от 250Ваттного режима потеряет не 50% а 20-30%...
А ватты как единицу измерения пишут так как в разном ПО 100% нагрузка сильно по разному Ватт кушает.
Выжимание всех соков из кремния требует кучу времени и знаний - что как по мне никогда не окупится... так что все вендора ввели рубильники в биоса (120 200 250 Ватт) или сколько укажешь. А БИОС сам галки проставит где надо.
Я колись …який це рік.. під батлу 3 купив 2600k. Ще був старий добрий біос, а не Uefi. І так склалося, що відяшки міняв, а проц… та шо з нього взяти, мені ото пару ігор да ютуб з новинами. І десь лише в 21 році замінив на 17000k. Ото я за голову схопився при налаштуванні проца :)) стільки всякого гівна і так воно розкачегарено з коробки. Запускаю стрес тест Аіда, які там 4,6ггц заявлені, 1,2-2,2 через 30 секунд бо температури 100 і ні в чому собі не відмовляй:))) Раніше три позиції: напруга ядра, множник, відключення економайзерів і погнав стабільно/нестабільно. Нестабільно, +0,1в - 100мгц на множник і забув. Зараз …. Замість 4,6 заявлених ну ви в курсі, танці з бубнами, батарея центрального опалення на обдув. Коротше раніше трава була зеленіша. Більше ніяких K проців і z материнок. В амд такаж шляпа
AssayMAS
Member
Звідки: ][аркiв

Повідомлення

den888: 27.07.2024 20:41 Більше ніяких K проців і z материнок.
я как бы тоже за лоу-енд ПК дома... и тоже как-то на и9 л0ханулся - что 140Ваттный охлад на теплотрубках купил и маленький корпус и пришлось методом долёт\перелёт потребление в биосе выставлять - так как АВТО в биосе или 120 или 180+Ватт...
А что сча всем процам 5ГГц обещают так тактично не уточняют на сколько... минут, сукунд... с супер обвесом часы.
У мну сча и7-3770 так автобуст на 10-20 минут 4ГГц даёт... на боксовом радиаторе но двойной мощи кулере, и на колхозе с винтами и пружинами. Смена на теплотрубки в 120Ватт тупо увеличивает продолжительность буста на 10-20 минут и всё... если надо ПК загрузить на часы тяжелой работы то через час дефолтные 3,6ГГц и всё и ни капли больше...
Melofon
Member
Аватар користувача
Звідки: Николаев

Повідомлення

AssayMAS

Сравнил, это же старый проц и без К и естественно он будет автоматом себе работать, у меня был 2600к так он мог часами на той частоте на которой я захочу, обычно 4,5Ггц у меня стоял и был при этом не сильно горячий с нормальной средней башней с четырьмя восьми миллиметровыми трубками, хотя мог и 4,7 но уже горячо и высокий вольтаж, но и это не предел бо он стабильно мог и 5,0Ггц но это уже было перебором большим по всем показателям и если долго на такой то деградирует.
ronemun
Advanced Member

Повідомлення

dext: 26.07.2024 16:22
ronemun: 25.07.2024 23:43 Це абсолютно тупо, тому що ядра без гіпертрейдінгу теж можуть спокійно переварювати декілька потоків, вони від цього не зависнуть, і сумарний результат виявиться знаачно більшим ніж 1 потік на ядро. А все тому що сучасні ядра мають гігантський запас по продуктивності внутрішніх блоків, в т.ч. спецкешів і шин, це не тільки L1/2/3, там все знаачно складніше. І якийсь простий код як в CB нагружає лише 5% блоків ядра і впирається лише в конвеєр виконання.
В реальносні воно так не працювало і ніколи не буде працювати тому, що кожен процес монопольно користується кешами/регістрами, що призводить до їх інвалідації - це проблема навіть при HT де є хоч мінімальне керування ресурсами і окремий interrupt controller для кожного потока, без HT у вас взагалі будуть дикі витрати на переключення контексту, тож фокус з "багато процесів на 1 ядро" не працював і не буде
так я не кажу - процеси в множині, а потоки одного процесу, нитки.
запустіть 7 zip на своєму проці і нагрузіть у 2 рази більше потоків на ядро ніж це мало б бути - наприклад для 1 ядра з HT - 4 потоки на ядро, а не 2
Я тільки що зробив окремо 2 тести в 7zip v23.01, на 1 ядро з HT. Тест відразу був закріплений в диспетчері задач за 2ма логічними ядрами, які відповідали 1му фізичному ядру з HT. Частота в обох тестах однакова, ядро теж саме, теплопакет чи температура не обмежували і т.п., всі інші проги були відключені. Кожен тест по 5 прогонів, але перед тим провів 20 прогонів просто так щоб очистити кеш.
1 тест. 2 потоки на 1 ядро з HT - результат на зтиснення 6,603 GIPS, 5783 кБ/с, завантаження проца 81%
2 тест. 4 потока на 1 ядро з HT - результат на зтиснення 7,033 GIPS, 6160 кБ/с, завантаження проца 192%
Очевидний виграш в 1,065 раз. Причина - 2 потоки не догружали навіть таки слабе зараз ядро як Core i 8xxx, і це тест дуже добре оптимізований, передбачуваний і т.п., а якщо поведінка потоків випадкова то причин недогрузити ядро значно більше, особливо такі потужні як зараз. Споживання було однакове.
Ще замітив, якщо жорстко не закріплювати потоки за ядрами, то результат трішки вищий - проц сам знає де краще розмістити - може там де ближче до контролера памяті чи ще щось

результати декомпресї були однакові, що ясно, бо це проста задача і впирається в память
dext
Member
Звідки: Dnipro

Повідомлення

ronemun: 03.08.2024 11:25 1 тест. 2 потоки на 1 ядро з HT - результат на зтиснення 6,603 GIPS, 5783 кБ/с, завантаження проца 81%
2 тест. 4 потока на 1 ядро з HT - результат на зтиснення 7,033 GIPS, 6160 кБ/с, завантаження проца 192%
Очевидний виграш в 1,065 раз. Причина - 2 потоки не догружали навіть таки слабе зараз ядро як Core i 8xxx, і це тест дуже добре оптимізований, передбачуваний і т.п., а якщо поведінка потоків випадкова то причин недогрузити ядро значно більше, особливо такі потужні як зараз. Споживання було однакове.
Ще замітив, якщо жорстко не закріплювати потоки за ядрами, то результат трішки вищий - проц сам знає де краще розмістити - може там де ближче до контролера памяті чи ще щось
Коректний тест це "2 потоки на 1 ядро з HT" vs "2 потоки на 1 ядро без HT": де у першому випадку буде ~30% (в залежності від задачі) приріст від HT у порівнянні з 1 потоком, а у другому ні, все інше - особливості планування/контролю частоти в межах похибки
Відповісти