Новини
Останні статті і огляди
Intel продовжує шукати причини нестабільної роботи процесорів Core i9 13-/14-го покоління
-
Denvys5
Member
- Звідки: Kyiv
Scoffer
Тут піймав, а далі?
Тут піймав, а далі?
-
Scoffer
Member
Denvys5
Шо далі?
https://www.golem.de/news/knights-landi ... 21642.html
Автопереклад бо нікчемської не знаю
Шо далі?
https://www.golem.de/news/knights-landi ... 21642.html
Автопереклад бо нікчемської не знаю
- спойлер
- Technische Basis aller Knights Landing ist ein mit rund 700 qmm enorm großer Chip, der in Intels 14FF-Verfahren produziert wird. Das Die besteht aus 76 Kernen, die eine massiv erweiterte Silvermont-x86-Architektur nutzen. Beispielsweise sind Vektoreinheiten für AVX-512-Befehle vorhanden, hinzu kommen deutlich vergrößerte Caches und vierfaches Hyperthreading pro Kern sowie sechs Speicherkanäle für 384 GByte DDR4-Speicher.
Технічною основою всіх Knights Landing є величезний чіп розміром близько 700 квадратних мм , який виготовляється за технологією Intel 14FF. Кришка складається з 76 ядер , які використовують значно розширену архітектуру Silvermont x86. Наприклад, є векторні блоки для інструкцій AVX-512, а також значно більші кеш-пам’яті та чотириразова гіперпотоковість на ядро, а також шість каналів пам’яті для 384 ГБ пам’яті
-
Denvys5
Member
- Звідки: Kyiv
Scoffer
От так вже краще. Про останнє Phi покоління небагато читав. "Сильно модифікований Silvermont". Був неправий.
Проте не пояснює нащо інтел зараз вигадує колесо заново, з Sienna Forest
От так вже краще. Про останнє Phi покоління небагато читав. "Сильно модифікований Silvermont". Був неправий.
Проте не пояснює нащо інтел зараз вигадує колесо заново, з Sienna Forest
-
Scoffer
Member
Denvys5
Змінились приорітети. Замість атомоядер з авх у інтела зараз дискретна відяха/прискорювач 2 в 1. Відповідно відпала необхідність в аж такій числодробильні на ядрах, зато з'явилась необхідність шоб ядра менше жерли, їх можна було більше запхнути в один сокет і продати з хмар. AVX з хмар не продається, і флопси теж, продаються ядра. І в ноутах AVX також нафіг не всрався вже бо там же потужні вбудовані графіки з куди кращою числодробильнею.
Змінились приорітети. Замість атомоядер з авх у інтела зараз дискретна відяха/прискорювач 2 в 1. Відповідно відпала необхідність в аж такій числодробильні на ядрах, зато з'явилась необхідність шоб ядра менше жерли, їх можна було більше запхнути в один сокет і продати з хмар. AVX з хмар не продається, і флопси теж, продаються ядра. І в ноутах AVX також нафіг не всрався вже бо там же потужні вбудовані графіки з куди кращою числодробильнею.
-
Sanc
Member
От і я про те, а Вони всі моляться на той АВХ512 і 256.Scoffer: ↑ 17.06.2024 11:05 Denvys5
Змінились приорітети. Замість атомоядер з авх у інтела зараз дискретна відяха/прискорювач 2 в 1. Відповідно відпала необхідність в аж такій числодробильні на ядрах, зато з'явилась необхідність шоб ядра менше жерли, їх можна було більше запхнути в один сокет і продати з хмар. AVX з хмар не продається, і флопси теж, продаються ядра. І в ноутах AVX також нафіг не всрався вже бо там же потужні вбудовані графіки з куди кращою числодробильнею.
По факту має бути АВХ64\128 і цього досить, в іграх АВХ64 самий ходовий, деколи АВХ128 юзається в іграх де нема SSE4.2.
В робочих програмах для мультимедіа\офісу\креслень - теж авх 256 і 512 не треба.
А транзисторний бюджет і енергоспоживання краще пустити на нарощення реального ІРС ядер
Для всієї решти задач відеоядро встроєне є (і відеокарти), операції якого і виконує SIMD з широким регістром.
-
vmsolver
Member
Серверный рынок стал разнообразнее (специализированее) поэтому появляются новые нишевые продукты и Зион 6 займёт одну из таких ниш и будет конкурировать с АМД там.Denvys5: ↑ 17.06.2024 10:22Проте не пояснює нащо інтел зараз вигадує колесо заново, з Sienna Forest
ДемагогScoffer: ↑ 17.06.2024 11:05зато з'явилась необхідність шоб ядра менше жерли
Развитие техпроцессов дало возможность сделать "шоб ядра менше жерли", вот их и кучкуют в большом количестве. Плюс коммент выше.
Бред.Sanc: ↑ 17.06.2024 11:19По факту має бути АВХ64\128 і цього досить, в іграх АВХ64 самий ходовий, деколи АВХ128 юзається в іграх де нема SSE4.2.
-
Scoffer
Member
Всі проци прийдуть до того до чого вже прийшли епли і квалкоми, а ще раніше cell з плойки, подобається це комусь чи ні. Окремо ядра без суттєвої числодробильні, окремо числодробильня, окремо матричний прискорювач котрий не налазить навіть на числодробильню бо специфічна штука. В таких умовах сімд просто втрачають сенс. Спеціалізована числодробильня робить флопс на ват дешевше раз в 10 мінімум, матриці і того більше.
-
vmsolver
Member
Scoffer
Сейчас техпроцессы ещё шаг-два сделают и SIMD 512 бит станет обычной ерундой валяющейся куда ни глянь, а если взглянуть шире, то это уже давно так, просто вектора были 256 битными но их было два штуки, объединение в более широкий позволит юзать горизонтальные операции и ускорять некоторые алгоритмы больше. SIMD хорош тем, что это низколатентная числодробилка, GPU не ориентирован на низкую латентность, а на пропускную способность, разное железо - разное применение.
Матричный ускоритель не числодробилка? Демагог.
Кстати, SIMD это специализированная числодробилка.
Сейчас техпроцессы ещё шаг-два сделают и SIMD 512 бит станет обычной ерундой валяющейся куда ни глянь, а если взглянуть шире, то это уже давно так, просто вектора были 256 битными но их было два штуки, объединение в более широкий позволит юзать горизонтальные операции и ускорять некоторые алгоритмы больше. SIMD хорош тем, что это низколатентная числодробилка, GPU не ориентирован на низкую латентность, а на пропускную способность, разное железо - разное применение.
Матричный ускоритель не числодробилка? Демагог.
Кстати, SIMD это специализированная числодробилка.
-
Denvys5
Member
- Звідки: Kyiv
От про це треба казатиvmsolver: ↑ 17.06.2024 13:06SIMD хорош тем, что это низколатентная числодробилка
І саме для цього SIMD найбільш корисний. А не для рахування 25 міль'ярдів знаків числа Пі.
Той же arraysort чи regex match не дадуть збрехати
Востаннє редагувалось 17.06.2024 13:09 користувачем Denvys5, всього редагувалось 1 раз.
-
Scoffer
Member
Якщо ти не розумієш в чому різниця між матричним прискорювачем і числодробильнею аля гексагон то про що з тобою взагалі говорити? Експерт в процесорах знайшовсяvmsolver: ↑ 17.06.2024 13:06Матричный ускоритель не числодробилка?
Це все чудово лягає на прискорювачі, епл не дасть збрехати. Всі аж верещать наскільки круто і швидко працює писаний під прискорювачі софт і наскільки він же повільно працював на інтелах до тогоDenvys5: ↑ 17.06.2024 13:08Той же arraysort чи regex match не дадуть збрехати
-
vmsolver
Member
То же мне эталон числодробилки, его любое х64 ядро в формате SIMDa порвёт в вычислениях как тузик грелку, единственная причина существования гексагона это делать тупую арифметику как можно более экономно, поэтому в нём есть только самое необходимое и в том масштабе в каком требуют задачи на него возложенные, это ж обычный сигнальный процессор.Scoffer: ↑ 17.06.2024 13:09аля гексагон
Кстати, основа ЦОС это умножение и сложение, FMA, которая, сюрприз-сюрприз, тоже является основой матричной арифметики.
Матричный ускоритель у него уже не числодробилка...
Заканчивай демогогию, тебя прижимаешь по одной теме и ты её резко меняешь на другую, и так до бесконечности, разговор превращается в броуновское движение с нулевым итоговым результатом, ты таскаешь разную ахинею вокруг да околоScoffer: ↑ 17.06.2024 13:09Під розкажи еплу і квалкому шо вони якісь лошари шо два прискорювача завезли замість одного.
-
Scoffer
Member
vmsolver
У тебе якась шизофренія. Питаєш чому випилюють сімди, гіпертрейдінг і інший непотріб, відповідаю тобі кирилицею по сірому бо жруть і замінюються прискорювачі, недоядра і оте все. З піною у рота сперечаєшся шо це неправда, і тут же заявляєш що гексагон з його в десять раз меншим жором на флопс не потрібен бо у нього якісь не такі флопси, рожеві мабуть якісь чи навіть не знаю.
Я вже раз сто мабуть тільки в цій темі сказав що головна причина жор. Це єдине що зараз всіх парить. А ти вічно носишся то зі своєми транзисторами, то ще з якоюсь маячнею.
Лікуватись не пробував?
Відправлено через 4 хвилини 41 секунду:
Матричний процесор множить матриці по 64к за раз, складає їх в локальний буфер, а потім множить ще раз, і так скільки треба. Робить це дуже швидко, дуже економно, натомість більше нічого не вміє. JPEG, котрий теж FMA в усю юзає на ньому не розкодуєш, або якщо і розкодуєш то швидкість не сподобається.
Відправлено через 11 хвилин 22 секунди:
Топові контори всі як один клепають спец прискорювачі на кожне більш-менш розповсюджене завдання, в тому числі в серверах вже, випилюють "універсальні рішення", але місцеві форумні експерти звісно ж знають шо контори не шарять, а вони зробили б краще бо любимка амуде слоупок і відстає від усіх
У тебе якась шизофренія. Питаєш чому випилюють сімди, гіпертрейдінг і інший непотріб, відповідаю тобі кирилицею по сірому бо жруть і замінюються прискорювачі, недоядра і оте все. З піною у рота сперечаєшся шо це неправда, і тут же заявляєш що гексагон з його в десять раз меншим жором на флопс не потрібен бо у нього якісь не такі флопси, рожеві мабуть якісь чи навіть не знаю.
Я вже раз сто мабуть тільки в цій темі сказав що головна причина жор. Це єдине що зараз всіх парить. А ти вічно носишся то зі своєми транзисторами, то ще з якоюсь маячнею.
Лікуватись не пробував?
Відправлено через 4 хвилини 41 секунду:
Основа пива - солод, хміль і вода. Пробував колись жувати їх? Так от судячи з усього варто було б щоб не нести подібну ахінею.vmsolver: ↑ 17.06.2024 13:38Кстати, основа ЦОС это умножение и сложение
Матричний процесор множить матриці по 64к за раз, складає їх в локальний буфер, а потім множить ще раз, і так скільки треба. Робить це дуже швидко, дуже економно, натомість більше нічого не вміє. JPEG, котрий теж FMA в усю юзає на ньому не розкодуєш, або якщо і розкодуєш то швидкість не сподобається.
Відправлено через 11 хвилин 22 секунди:
Топові контори всі як один клепають спец прискорювачі на кожне більш-менш розповсюджене завдання, в тому числі в серверах вже, випилюють "універсальні рішення", але місцеві форумні експерти звісно ж знають шо контори не шарять, а вони зробили б краще бо любимка амуде слоупок і відстає від усіх
-
vmsolver
Member
Это у тебя шизофрения, я у тебя ничего не спрашивал, мало того мне такая мысль в голову прийти не может, ибо ты несёшь какую-то околесицу и тебя постоянно надо направлять на свет истинный, а ты только лбом бьёшся и всё отскакиваетScoffer: ↑ 17.06.2024 13:47У тебе якась шизофренія. Питаєш чому випилюють сімди, гіпертрейдінг і інший непотріб, відповідаю тобі кирилицею по сірому бо жруть і замінюються прискорювачі, недоядра і оте все
Вот пример очередной ахинеи, не не такие, а сигнальники сделали чтобы батарейку экономить, они пашут на 300-600 МГц, конечно они будут энергоэффективнее 4 ГГц процов, ты за деревьями не видишь леса. Да и с последовательностью у тебя проблемы.Scoffer: ↑ 17.06.2024 13:47і тут же заявляєш що гексагон з його в десять раз меншим жором на флопс не потрібен бо у нього якісь не такі флопси, рожеві мабуть якісь чи навіть не знаю.
Не жор, а отношение perf/power. И ты ошибаешься, что его портит SIMD, есть примеры повышения и понижения энергоэффективности, что значит есть зависимость от того, как его использовать. Хватит уже сравнивать с Apple, у них процессоры выполнены по самым тонким техпроцессам и они на два-три шага впереди по ним, конечно у них будет лучше perf/power, ведь это от техпроцесса сильно зависит, смысл сравнивать с уже древними интел 7, когда через пару месяцев будет интел 20А, тогда и сравнивать.Scoffer: ↑ 17.06.2024 13:47Я вже раз сто мабуть тільки в цій темі сказав що головна причина жор. Це єдине що зараз всіх парить
Так и ДСП дают не все задачи решать, и чё?Scoffer: ↑ 17.06.2024 13:47Основа пива - солод, хміль і вода. Пробував колись жувати їх? Так от судячи з усього варто було б щоб не нести подібну ахінею
В JPEG DSP это косинусное преобразование, а сжатие Хаффмана никакого FMA не требует, деревья не требуют умножения, обычный АЛУ сгодится, так что не пробовал ты солод, хмель и воду, раз лепишь в кучу всё подрядScoffer: ↑ 17.06.2024 13:47JPEG, котрий теж FMA
Відправлено через 8 хвилин 21 секунду:
И тут Остапа понеслоScoffer: ↑ 17.06.2024 13:59Топові контори всі як один клепають спец прискорювачі на кожне більш-менш розповсюджене завдання, в тому числі в серверах вже, випилюють "універсальні рішення", але місцеві форумні експерти звісно ж знають шо контори не шарять, а вони зробили б краще бо любимка амуде слоупок і відстає від усіх
Топовые конторы клепают специализированное в борьбе за perf/power, при этом SIMD из процов никто не выпиливает, его дополняют сигнальниками и тензор-ускорителями, каждому железу своё назначение: SIMD - универсальная числодробилка на основных ядрах, на DSP отправляют конкретную нагрузку в рамках какой-то стандартной для системы задачи, NPU - аналогично, но для AI.
Scoffer: ↑ 17.06.2024 13:59але місцеві форумні експерти звісно ж знають шо контори не шарять, а вони зробили б краще бо любимка амуде слоупок і відстає від усіх
АМД любимка? У меня?
Поциент окончательно сломался
-
waryag
Member
- Звідки: Суми
Инженеры интел сделали маленькое чудо, когда в целом сохранили рыночную долю и паритет в производительности при технологическом отставании.DuckRider: ↑ 17.06.2024 00:18Будет ли кто-то спорить с теми, кто застряли в развитии на сандале на много лет и ничего лучше чем переименовать свой техпроцесс на что-то левое и собрать кое-как рабочую печку на 250вт+ и с гнущейся от чиха крышкой, родить уже не способны? Хм... Спорить с такими небожителями явно не стоит
Наброс про сенди комментировать не буду, слишком жирно.
-
Scoffer
Member
vmsolver
Так ніхто не випилює шо аж інтел випилив avx-512, а apple принципово не реалізовує sve/sve2, тільки заморожений в розвитку старий 64/128-бітний неон з часів ARMv7 хоча зараз вже 9та специфікація арма в котрій неон прямо записаний в депрікейтед і поки що допустимий лише для зворотньої сумісності.
Іншу маячню навіть коментувати не стану.
Так ніхто не випилює шо аж інтел випилив avx-512, а apple принципово не реалізовує sve/sve2, тільки заморожений в розвитку старий 64/128-бітний неон з часів ARMv7 хоча зараз вже 9та специфікація арма в котрій неон прямо записаний в депрікейтед і поки що допустимий лише для зворотньої сумісності.
Іншу маячню навіть коментувати не стану.
-
Sanc
Member
Люди живуть в своєму маня-світі, з рожевими понями і халявою, вони слухати голос розуму не будуть.Scoffer: ↑ 17.06.2024 17:50 vmsolver
Так ніхто не випилює шо аж інтел випилив avx-512, а apple принципово не реалізовує sve/sve2, тільки заморожений в розвитку старий 64/128-бітний неон з часів ARMv7 хоча зараз вже 9та специфікація арма в котрій неон прямо записаний в депрікейтед і поки що допустимий лише для зворотньої сумісності.![]()
Іншу маячню навіть коментувати не стану.
Для них тяжко зрозуміти, що для виробників головна ціль зробити продукт:
- швидше і ефективніше (або щоб в це повірили, шляхом маркетингу);
- дешевше у виробництві;
- продати більше і по можливості дорожче.
АВХ 256 і 512 робилися під сервери для заміни числодробилок GPU в серваках і суперкомпютерах, бо Інтелу не було чим конкурувати з іНвідія, а в звичайних ядрах просто проходило обкатку.
В домашніх ПК і в звичайних робочих ПК (а тим більше в ноутах) - воно непотріб (нікому не потрібне), в іграх теж непотріб (типові 64 і лише в пари ігр 128 АВХ) при цьому займає місце і підвищує сильно пасивне енергоспоживання процесора. І цію площу і енергоспоживання вигідніше банально потратити на щось інше.
Це не говорячи, що Правило Мура уже не діє і діяти не буде. Основний скачок лишився один - на перехід від 3 сторонньо-ізольованого затвору до 4 сторонього (від FinFet до GAAFET).
А хто трохи вивчив тему знає, що довжина Р-N і визначає основне споживання і вольт\амперні характеристики транзистора, при цьому довжина P-N переходу на 5нм FinFET-ТСМЦ складає реальних 28нм, на 2нм GAAFET складає 22нм, у Інтел 10А буде складати 16нм, в Інтел 5А і аналогах - буде 14нм, а теоретичний мінімум Кремній-Галій Арсеніду 11нм).
Тобто запасу від розвитку техпроцесів лишилося на прискорення в 2рази і зменшення споживання на 25%, при цьому щільність теплового потоку виросте в 2є, а щільність розміщення транзисторів в 3є. Раніше за рахунок скачкоподібного розвитку техпроцесів можна було експерементувати і впарювати маркетинговий хлам.
Тепер тільки оптимізація, тільки хардкор. І чим далі в часі - тим більше. Будуть все непотрібне - викидати, а що потрібне максимально оптимізовувати.
Сліпо моляться на нові техпроцеси, не вникаючи в їх суть і думати головою не хочуть. Вірять в прихід "щастя нахаляву"
Реальність натомість насправді жорстока і прагматична.
-
botva
Member
Sanc
ви трохи сплутали причини із наслідками. інтел залюбки б інтегрував нові блоки у процесори користувацького сегменту, але ж виробники софта не поспішають його адаптувати під нові технології. й так, доки ефект від цього впровадження спостерігається лише на специфічних задачах, логічніше навантажити гаманець тих, хто цього насправді потребує. якщо (коли) софт адаптують, ви навіть не помітете, як інтел все це швиденько активує. це ж було вже з mmx, sse2, тощо.
ви трохи сплутали причини із наслідками. інтел залюбки б інтегрував нові блоки у процесори користувацького сегменту, але ж виробники софта не поспішають його адаптувати під нові технології. й так, доки ефект від цього впровадження спостерігається лише на специфічних задачах, логічніше навантажити гаманець тих, хто цього насправді потребує. якщо (коли) софт адаптують, ви навіть не помітете, як інтел все це швиденько активує. це ж було вже з mmx, sse2, тощо.
-
SergiusTheBest
Member
- Звідки: Київ
Тут Інтел сам собі підклав свиню. Замість того, щоб зробити один AVX-512, як до того був SSE, SSE2, ..., AVX, AVX-2 - він наплодив десяток різних варіацій AVX-512. І розробникам важко визначитися, під що саме оптимізувати. AVX-10 об'єднав різні варіації AVX-512 в одну, щоб виправити цю проблему.botva: ↑ 19.06.2024 09:35 ви трохи сплутали причини із наслідками. інтел залюбки б інтегрував нові блоки у процесори користувацького сегменту, але ж виробники софта не поспішають його адаптувати під нові технології. й так, доки ефект від цього впровадження спостерігається лише на специфічних задачах, логічніше навантажити гаманець тих, хто цього насправді потребує. якщо (коли) софт адаптують, ви навіть не помітете, як інтел все це швиденько активує. це ж було вже з mmx, sse2, тощо.
- спойлер
