Intel продовжує шукати причини нестабільної роботи процесорів Core i9 13-/14-го покоління

Denvys5 · Повідомлення 17.06.2024 10:04

Scoffer
Тут піймав, а далі?

Scoffer · Повідомлення 17.06.2024 10:14

Denvys5
Шо далі?
https://www.golem.de/news/knights-landi ... 21642.html
Автопереклад бо нікчемської не знаю

спойлер: Technische Basis aller Knights Landing ist ein mit rund 700 qmm enorm großer Chip, der in Intels 14FF-Verfahren produziert wird. Das Die besteht aus 76 Kernen, die eine massiv erweiterte Silvermont-x86-Architektur nutzen. Beispielsweise sind Vektoreinheiten für AVX-512-Befehle vorhanden, hinzu kommen deutlich vergrößerte Caches und vierfaches Hyperthreading pro Kern sowie sechs Speicherkanäle für 384 GByte DDR4-Speicher.

Технічною основою всіх Knights Landing є величезний чіп розміром близько 700 квадратних мм , який виготовляється за технологією Intel 14FF. Кришка складається з 76 ядер , які використовують значно розширену архітектуру Silvermont x86. Наприклад, є векторні блоки для інструкцій AVX-512, а також значно більші кеш-пам’яті та чотириразова гіперпотоковість на ядро, а також шість каналів пам’яті для 384 ГБ пам’яті

Шо таке Silvermont вже сам знайдеш.

Denvys5 · Повідомлення 17.06.2024 10:22

Scoffer
От так вже краще. Про останнє Phi покоління небагато читав. "Сильно модифікований Silvermont". Був неправий.
Проте не пояснює нащо інтел зараз вигадує колесо заново, з Sienna Forest

Scoffer · Повідомлення 17.06.2024 11:05

Denvys5
Змінились приорітети. Замість атомоядер з авх у інтела зараз дискретна відяха/прискорювач 2 в 1. Відповідно відпала необхідність в аж такій числодробильні на ядрах, зато з'явилась необхідність шоб ядра менше жерли, їх можна було більше запхнути в один сокет і продати з хмар. AVX з хмар не продається, і флопси теж, продаються ядра. І в ноутах AVX також нафіг не всрався вже бо там же потужні вбудовані графіки з куди кращою числодробильнею.

Sanc · Повідомлення 17.06.2024 11:19

Scoffer: ↑ 17.06.2024 11:05 Denvys5
Змінились приорітети. Замість атомоядер з авх у інтела зараз дискретна відяха/прискорювач 2 в 1. Відповідно відпала необхідність в аж такій числодробильні на ядрах, зато з'явилась необхідність шоб ядра менше жерли, їх можна було більше запхнути в один сокет і продати з хмар. AVX з хмар не продається, і флопси теж, продаються ядра. І в ноутах AVX також нафіг не всрався вже бо там же потужні вбудовані графіки з куди кращою числодробильнею.

От і я про те, а Вони всі моляться на той АВХ512 і 256.

По факту має бути АВХ64\128 і цього досить, в іграх АВХ64 самий ходовий, деколи АВХ128 юзається в іграх де нема SSE4.2.
В робочих програмах для мультимедіа\офісу\креслень - теж авх 256 і 512 не треба.
А транзисторний бюджет і енергоспоживання краще пустити на нарощення реального ІРС ядер

Для всієї решти задач відеоядро встроєне є (і відеокарти), операції якого і виконує SIMD з широким регістром.

vmsolver · Повідомлення 17.06.2024 12:47

Denvys5: ↑ 17.06.2024 10:22Проте не пояснює нащо інтел зараз вигадує колесо заново, з Sienna Forest

Серверный рынок стал разнообразнее (специализированее) поэтому появляются новые нишевые продукты и Зион 6 займёт одну из таких ниш и будет конкурировать с АМД там.

Scoffer: ↑ 17.06.2024 11:05зато з'явилась необхідність шоб ядра менше жерли

Демагог

Развитие техпроцессов дало возможность сделать "шоб ядра менше жерли", вот их и кучкуют в большом количестве. Плюс коммент выше.

Sanc: ↑ 17.06.2024 11:19По факту має бути АВХ64\128 і цього досить, в іграх АВХ64 самий ходовий, деколи АВХ128 юзається в іграх де нема SSE4.2.

Бред.

Scoffer · Повідомлення 17.06.2024 12:55

Всі проци прийдуть до того до чого вже прийшли епли і квалкоми, а ще раніше cell з плойки, подобається це комусь чи ні. Окремо ядра без суттєвої числодробильні, окремо числодробильня, окремо матричний прискорювач котрий не налазить навіть на числодробильню бо специфічна штука. В таких умовах сімд просто втрачають сенс. Спеціалізована числодробильня робить флопс на ват дешевше раз в 10 мінімум, матриці і того більше.

vmsolver · Повідомлення 17.06.2024 13:06

Scoffer
Сейчас техпроцессы ещё шаг-два сделают и SIMD 512 бит станет обычной ерундой валяющейся куда ни глянь, а если взглянуть шире, то это уже давно так, просто вектора были 256 битными но их было два штуки, объединение в более широкий позволит юзать горизонтальные операции и ускорять некоторые алгоритмы больше. SIMD хорош тем, что это низколатентная числодробилка, GPU не ориентирован на низкую латентность, а на пропускную способность, разное железо - разное применение.
Матричный ускоритель не числодробилка? Демагог.

Кстати, SIMD это специализированная числодробилка.

Denvys5 · Повідомлення 17.06.2024 13:08

vmsolver: ↑ 17.06.2024 13:06SIMD хорош тем, что это низколатентная числодробилка

От про це треба казати

І саме для цього SIMD найбільш корисний. А не для рахування 25 міль'ярдів знаків числа Пі.
Той же arraysort чи regex match не дадуть збрехати

Scoffer · Повідомлення 17.06.2024 13:09

vmsolver: ↑ 17.06.2024 13:06Матричный ускоритель не числодробилка?

Якщо ти не розумієш в чому різниця між матричним прискорювачем і числодробильнею аля гексагон то про що з тобою взагалі говорити? Експерт в процесорах знайшовся

Під розкажи еплу і квалкому шо вони якісь лошари шо два прискорювача завезли замість одного. А перша ще й увесь софт крізь них насильно провела. Це не рахуючи ще шифрувальних і відяхи.

Denvys5: ↑ 17.06.2024 13:08Той же arraysort чи regex match не дадуть збрехати

Це все чудово лягає на прискорювачі, епл не дасть збрехати. Всі аж верещать наскільки круто і швидко працює писаний під прискорювачі софт і наскільки він же повільно працював на інтелах до того

vmsolver · Повідомлення 17.06.2024 13:38

Scoffer: ↑ 17.06.2024 13:09аля гексагон

То же мне эталон числодробилки, его любое х64 ядро в формате SIMDa порвёт в вычислениях как тузик грелку, единственная причина существования гексагона это делать тупую арифметику как можно более экономно, поэтому в нём есть только самое необходимое и в том масштабе в каком требуют задачи на него возложенные, это ж обычный сигнальный процессор.

Кстати, основа ЦОС это умножение и сложение, FMA, которая, сюрприз-сюрприз, тоже является основой матричной арифметики.

Матричный ускоритель у него уже не числодробилка...

Scoffer: ↑ 17.06.2024 13:09Під розкажи еплу і квалкому шо вони якісь лошари шо два прискорювача завезли замість одного.

Заканчивай демогогию, тебя прижимаешь по одной теме и ты её резко меняешь на другую, и так до бесконечности, разговор превращается в броуновское движение с нулевым итоговым результатом, ты таскаешь разную ахинею вокруг да около

Scoffer · Повідомлення 17.06.2024 13:43

vmsolver
У тебе якась шизофренія. Питаєш чому випилюють сімди, гіпертрейдінг і інший непотріб, відповідаю тобі кирилицею по сірому бо жруть і замінюються прискорювачі, недоядра і оте все. З піною у рота сперечаєшся шо це неправда, і тут же заявляєш що гексагон з його в десять раз меншим жором на флопс не потрібен бо у нього якісь не такі флопси, рожеві мабуть якісь чи навіть не знаю.

Я вже раз сто мабуть тільки в цій темі сказав що головна причина жор. Це єдине що зараз всіх парить. А ти вічно носишся то зі своєми транзисторами, то ще з якоюсь маячнею.
Лікуватись не пробував?

Відправлено через 4 хвилини 41 секунду:

vmsolver: ↑ 17.06.2024 13:38Кстати, основа ЦОС это умножение и сложение

Основа пива - солод, хміль і вода. Пробував колись жувати їх? Так от судячи з усього варто було б щоб не нести подібну ахінею.
Матричний процесор множить матриці по 64к за раз, складає їх в локальний буфер, а потім множить ще раз, і так скільки треба. Робить це дуже швидко, дуже економно, натомість більше нічого не вміє. JPEG, котрий теж FMA в усю юзає на ньому не розкодуєш, або якщо і розкодуєш то швидкість не сподобається.

Відправлено через 11 хвилин 22 секунди:
Топові контори всі як один клепають спец прискорювачі на кожне більш-менш розповсюджене завдання, в тому числі в серверах вже, випилюють "універсальні рішення", але місцеві форумні експерти звісно ж знають шо контори не шарять, а вони зробили б краще бо любимка амуде слоупок і відстає від усіх

vmsolver · Повідомлення 17.06.2024 14:24

Scoffer: ↑ 17.06.2024 13:47У тебе якась шизофренія. Питаєш чому випилюють сімди, гіпертрейдінг і інший непотріб, відповідаю тобі кирилицею по сірому бо жруть і замінюються прискорювачі, недоядра і оте все

Это у тебя шизофрения, я у тебя ничего не спрашивал, мало того мне такая мысль в голову прийти не может, ибо ты несёшь какую-то околесицу и тебя постоянно надо направлять на свет истинный, а ты только лбом бьёшся и всё отскакивает

Scoffer: ↑ 17.06.2024 13:47і тут же заявляєш що гексагон з його в десять раз меншим жором на флопс не потрібен бо у нього якісь не такі флопси, рожеві мабуть якісь чи навіть не знаю.

Вот пример очередной ахинеи, не не такие, а сигнальники сделали чтобы батарейку экономить, они пашут на 300-600 МГц, конечно они будут энергоэффективнее 4 ГГц процов, ты за деревьями не видишь леса. Да и с последовательностью у тебя проблемы.

Scoffer: ↑ 17.06.2024 13:47Я вже раз сто мабуть тільки в цій темі сказав що головна причина жор. Це єдине що зараз всіх парить

Не жор, а отношение perf/power. И ты ошибаешься, что его портит SIMD, есть примеры повышения и понижения энергоэффективности, что значит есть зависимость от того, как его использовать. Хватит уже сравнивать с Apple, у них процессоры выполнены по самым тонким техпроцессам и они на два-три шага впереди по ним, конечно у них будет лучше perf/power, ведь это от техпроцесса сильно зависит, смысл сравнивать с уже древними интел 7, когда через пару месяцев будет интел 20А, тогда и сравнивать.

Scoffer: ↑ 17.06.2024 13:47Основа пива - солод, хміль і вода. Пробував колись жувати їх? Так от судячи з усього варто було б щоб не нести подібну ахінею

Так и ДСП дают не все задачи решать, и чё?

Scoffer: ↑ 17.06.2024 13:47JPEG, котрий теж FMA

В JPEG DSP это косинусное преобразование, а сжатие Хаффмана никакого FMA не требует, деревья не требуют умножения, обычный АЛУ сгодится, так что не пробовал ты солод, хмель и воду, раз лепишь в кучу всё подряд

Відправлено через 8 хвилин 21 секунду:

Scoffer: ↑ 17.06.2024 13:59Топові контори всі як один клепають спец прискорювачі на кожне більш-менш розповсюджене завдання, в тому числі в серверах вже, випилюють "універсальні рішення", але місцеві форумні експерти звісно ж знають шо контори не шарять, а вони зробили б краще бо любимка амуде слоупок і відстає від усіх

И тут Остапа понесло

Топовые конторы клепают специализированное в борьбе за perf/power, при этом SIMD из процов никто не выпиливает, его дополняют сигнальниками и тензор-ускорителями, каждому железу своё назначение: SIMD - универсальная числодробилка на основных ядрах, на DSP отправляют конкретную нагрузку в рамках какой-то стандартной для системы задачи, NPU - аналогично, но для AI.

Scoffer: ↑ 17.06.2024 13:59але місцеві форумні експерти звісно ж знають шо контори не шарять, а вони зробили б краще бо любимка амуде слоупок і відстає від усіх

Это ж ты постоянно несёшь ахинею с видом что это мнение вендоров.
АМД любимка? У меня?

Поциент окончательно сломался

waryag · Повідомлення 17.06.2024 15:04

DuckRider: ↑ 17.06.2024 00:18Будет ли кто-то спорить с теми, кто застряли в развитии на сандале на много лет и ничего лучше чем переименовать свой техпроцесс на что-то левое и собрать кое-как рабочую печку на 250вт+ и с гнущейся от чиха крышкой, родить уже не способны? Хм... Спорить с такими небожителями явно не стоит

Инженеры интел сделали маленькое чудо, когда в целом сохранили рыночную долю и паритет в производительности при технологическом отставании.
Наброс про сенди комментировать не буду, слишком жирно.

Scoffer · Повідомлення 17.06.2024 17:50

vmsolver
Так ніхто не випилює шо аж інтел випилив avx-512, а apple принципово не реалізовує sve/sve2, тільки заморожений в розвитку старий 64/128-бітний неон з часів ARMv7 хоча зараз вже 9та специфікація арма в котрій неон прямо записаний в депрікейтед і поки що допустимий лише для зворотньої сумісності.

Іншу маячню навіть коментувати не стану.

Sanc · Повідомлення 18.06.2024 13:35

Scoffer: ↑ 17.06.2024 17:50 vmsolver
Так ніхто не випилює шо аж інтел випилив avx-512, а apple принципово не реалізовує sve/sve2, тільки заморожений в розвитку старий 64/128-бітний неон з часів ARMv7 хоча зараз вже 9та специфікація арма в котрій неон прямо записаний в депрікейтед і поки що допустимий лише для зворотньої сумісності.
Іншу маячню навіть коментувати не стану.

Люди живуть в своєму маня-світі, з рожевими понями і халявою, вони слухати голос розуму не будуть.
Для них тяжко зрозуміти, що для виробників головна ціль зробити продукт:
- швидше і ефективніше (або щоб в це повірили, шляхом маркетингу);
- дешевше у виробництві;
- продати більше і по можливості дорожче.
АВХ 256 і 512 робилися під сервери для заміни числодробилок GPU в серваках і суперкомпютерах, бо Інтелу не було чим конкурувати з іНвідія, а в звичайних ядрах просто проходило обкатку.
В домашніх ПК і в звичайних робочих ПК (а тим більше в ноутах) - воно непотріб (нікому не потрібне), в іграх теж непотріб (типові 64 і лише в пари ігр 128 АВХ) при цьому займає місце і підвищує сильно пасивне енергоспоживання процесора. І цію площу і енергоспоживання вигідніше банально потратити на щось інше.

Це не говорячи, що Правило Мура уже не діє і діяти не буде. Основний скачок лишився один - на перехід від 3 сторонньо-ізольованого затвору до 4 сторонього (від FinFet до GAAFET).
А хто трохи вивчив тему знає, що довжина Р-N і визначає основне споживання і вольт\амперні характеристики транзистора, при цьому довжина P-N переходу на 5нм FinFET-ТСМЦ складає реальних 28нм, на 2нм GAAFET складає 22нм, у Інтел 10А буде складати 16нм, в Інтел 5А і аналогах - буде 14нм, а теоретичний мінімум Кремній-Галій Арсеніду 11нм).

Тобто запасу від розвитку техпроцесів лишилося на прискорення в 2рази і зменшення споживання на 25%, при цьому щільність теплового потоку виросте в 2є, а щільність розміщення транзисторів в 3є. Раніше за рахунок скачкоподібного розвитку техпроцесів можна було експерементувати і впарювати маркетинговий хлам.
Тепер тільки оптимізація, тільки хардкор. І чим далі в часі - тим більше. Будуть все непотрібне - викидати, а що потрібне максимально оптимізовувати.

Сліпо моляться на нові техпроцеси, не вникаючи в їх суть і думати головою не хочуть. Вірять в прихід "щастя нахаляву"
Реальність натомість насправді жорстока і прагматична.

botva · Повідомлення 19.06.2024 09:35

Sanc
ви трохи сплутали причини із наслідками. інтел залюбки б інтегрував нові блоки у процесори користувацького сегменту, але ж виробники софта не поспішають його адаптувати під нові технології. й так, доки ефект від цього впровадження спостерігається лише на специфічних задачах, логічніше навантажити гаманець тих, хто цього насправді потребує. якщо (коли) софт адаптують, ви навіть не помітете, як інтел все це швиденько активує. це ж було вже з mmx, sse2, тощо.

SergiusTheBest · Повідомлення 19.06.2024 11:27

botva: ↑ 19.06.2024 09:35 ви трохи сплутали причини із наслідками. інтел залюбки б інтегрував нові блоки у процесори користувацького сегменту, але ж виробники софта не поспішають його адаптувати під нові технології. й так, доки ефект від цього впровадження спостерігається лише на специфічних задачах, логічніше навантажити гаманець тих, хто цього насправді потребує. якщо (коли) софт адаптують, ви навіть не помітете, як інтел все це швиденько активує. це ж було вже з mmx, sse2, тощо.

Тут Інтел сам собі підклав свиню. Замість того, щоб зробити один AVX-512, як до того був SSE, SSE2, ..., AVX, AVX-2 - він наплодив десяток різних варіацій AVX-512. І розробникам важко визначитися, під що саме оптимізувати. AVX-10 об'єднав різні варіації AVX-512 в одну, щоб виправити цю проблему.

спойлер