Офіційно: серверні чипи Intel Xeon Scalable 4-го покоління вийдуть на початку січня

ronemun · Сообщение 02.11.2022 18:16

Пропоную обговорити Офіційно: серверні чипи Intel Xeon Scalable 4-го покоління вийдуть на початку січня

В них ця біда з 10нм процесом з 2015 року тянеться. Але раніше, в 2018му, навіть маленькі 2х ядерні кристали CannonLake невиходили, приходилось графіку відключати, а тепер чіпи більше 400 мм.кв. кожен - другий. І це напевно з врахуванням відключення ядер. А оскільки ядер в чіпі всього 14 штук то і відключати несильно вийде. Дивує що там третину площі займають 5 міжкристальних EMIB зєднань - який сенс в такому інтерконекті?

Kashtan · Сообщение 02.11.2022 18:38

У флагмана 764 вати обмеження в біосі при формальному пл2 420 ватт.
У голден ков кеш другого рівня 1.25 МБ, в сапфір рапідс - 2 МБ. Ознака ядер рептор ков.

ronemun · Сообщение 02.11.2022 18:42

Взяти готові чіплети з Core 12900-13900, без графіки і дисплеїв, без е-ядер, тільки 16-20 p-ядер, вийшло б 200-240 мм.кв., з 2ма контролерами памяті + шини PCIe/UPI. І могли б окремо продавати як готові проци, або зєднувати з додатковим IO чіпом через PCIe v5/UPI, як у АМД. Може б IO чіп готовий в TSMC замовили б, на 6нм, такий як в АМД

На чіпі 12900-13900 дуже багато вільного місця, тому що блоки е і p ядер трохи різні по довжині, а також по ширині, кеші L3 менші біля 4х ядерних е-блоків, контролер памяті мало займає, можна спокійно ще 3й-4й канал робити, про запас, або більше UPI-CXL-PCIev5

vmsolver · Сообщение 02.11.2022 19:15

ronemun: ↑ 02.11.2022 18:42 Взяти готові чіплети з Core 12900-13900, без графіки і дисплеїв, без е-ядер, тільки 16-20 p-ядер, вийшло б 200-240 мм.кв., з 2ма контролерами памяті + ...

Не получится, там ядра другие, два полнотемповых юнита AVX512 в каждом ядре, в десктопном один, также в серверном AVX512 другой набор поддерживаемых семейств инструкций (их там наклепали гору просто).

Ну и наверное же драйвера к HBM занимают место. Интересно будет посмотреть тесты, в январе вроде бы лонч, хорошо.

l-m · Сообщение 02.11.2022 20:33

ronemun: ↑ 02.11.2022 18:16 А оскільки ядер в чіпі всього 14 штук то і відключати несильно вийде.

Лінь шукати, але попереднім слайдам було фізичних 16, але 2 шт одразу віддані під брак, тому й 14 активних.

Scoffer · Сообщение 02.11.2022 21:03

Проц затримується не через техпроцес, а через занадто високу доступність потужних речовин у розробників.
12 степінгів, овер 500 знайдених апаратних помилок в процесі лише за офіційною версією.

Відправлено через 2 хвилини 21 секунду:

Максимальне число x86-ядер має скласти 56 штук

За новими слухами - до 72 доступних при 80 фізичних (4*20)

ronemun · Сообщение 03.11.2022 00:36

Scoffer
72 ядра це добрі новини.
Щодо речовин, то теж так здогадувався - в Алдерах 8 p-ядер з кешом і агентами кільця 80 мм.кв. 32 ядра буде 320, і ще лишиться на 4+ каналів памяті і 64+ PCie v5/UPI/CLX - ці блоки в Інтела дуже мало займають. І в Алдера ще оптимізовано для високих частот, ксеони взагалі холодні будуть. Спокійно можна 2 кристала впакувати і зєднати між собою і ще купа ліній UPI залишиться вільні - навіть 1 блок по 20 ліній це 80 ГБайт в кожну сторону, з дуже низькими затримками. Можна і більше ліній, але контролери памяті і PCIe тут же в кристалі, і нема потреби як в АМД на одну шину грузити все. А як ще меншими кристалами, так щоб брак був низький, наприклад на 200+ мм.кв., це все одно по 20+ ядер вийде, але тоді вже краще як в АМД всі кристали через спільний IO блок чіпляти, наприклад в TSMC замовити. Або через EMIB, але щоб зєднання було між агентами кільцевої шини - тоді між кристалами взагалі нульові затримки будуть.
Щодо інших ядер в Ксеонах - не так вже вони й більші - на 10 нм значно менші ніж на 14нм, і ще один блок AVX3 погоди не робить, і кешу на ядро меньше - всього 3,375, а не 4,25-5,0 як у Алдер/Рапід, які на 5,5-6 ГГц призначені

Scoffer · Сообщение 03.11.2022 02:46

ronemun
Особисто я був би значно більш задоволений від 2х ядер по 72ГГц, ніж від 72 ядер по 2ГГц.
Абсолютна більшість корпоративних завдань або не масштабуються далі 4-8 потоків зовсім, або масштабуються з мізерним приростом. Типу було 16 відер, зробив 64, і стало швидше не в 4 рази, а на чверть

Всі ці мільйони ядер в одному сокеті в реальності не більше ніж понторізка. Навіть віртуалізація на 64+ ядрах починає потроху просідати, хоча це абсолютно багатопоточне завдання, і накладні росходи на неї доводиться закладувати не 5-10%, а вже 15-20. Що там буде відбуватись на 2 по 128 навіть дивитись не хочу.
Тупіковий шлях розвитку.

alexxusss · Сообщение 03.11.2022 09:06

Scoffer: ↑ 02.11.2022 21:0512 степінгів, овер 500 знайдених апаратних помилок в процесі лише за офіційною версією.

Вони ж казали, що чотири техпроцеса планують освоїти за 5 років?