Пропоную обговорити Офіційно: серверні чипи Intel Xeon Scalable 4-го покоління вийдуть на початку січня
В них ця біда з 10нм процесом з 2015 року тянеться. Але раніше, в 2018му, навіть маленькі 2х ядерні кристали CannonLake невиходили, приходилось графіку відключати, а тепер чіпи більше 400 мм.кв. кожен - другий. І це напевно з врахуванням відключення ядер. А оскільки ядер в чіпі всього 14 штук то і відключати несильно вийде. Дивує що там третину площі займають 5 міжкристальних EMIB зєднань - який сенс в такому інтерконекті?
Последние статьи и обзоры
Новости
Офіційно: серверні чипи Intel Xeon Scalable 4-го покоління вийдуть на початку січня
-
ronemun
Advanced Member
-
Kashtan
Member
- Откуда: Яготин
У флагмана 764 вати обмеження в біосі при формальному пл2 420 ватт.
У голден ков кеш другого рівня 1.25 МБ, в сапфір рапідс - 2 МБ. Ознака ядер рептор ков.
У голден ков кеш другого рівня 1.25 МБ, в сапфір рапідс - 2 МБ. Ознака ядер рептор ков.
-
ronemun
Advanced Member
Взяти готові чіплети з Core 12900-13900, без графіки і дисплеїв, без е-ядер, тільки 16-20 p-ядер, вийшло б 200-240 мм.кв., з 2ма контролерами памяті + шини PCIe/UPI. І могли б окремо продавати як готові проци, або зєднувати з додатковим IO чіпом через PCIe v5/UPI, як у АМД. Може б IO чіп готовий в TSMC замовили б, на 6нм, такий як в АМД
На чіпі 12900-13900 дуже багато вільного місця, тому що блоки е і p ядер трохи різні по довжині, а також по ширині, кеші L3 менші біля 4х ядерних е-блоків, контролер памяті мало займає, можна спокійно ще 3й-4й канал робити, про запас, або більше UPI-CXL-PCIev5
На чіпі 12900-13900 дуже багато вільного місця, тому що блоки е і p ядер трохи різні по довжині, а також по ширині, кеші L3 менші біля 4х ядерних е-блоків, контролер памяті мало займає, можна спокійно ще 3й-4й канал робити, про запас, або більше UPI-CXL-PCIev5
-
vmsolver
Member
Не получится, там ядра другие, два полнотемповых юнита AVX512 в каждом ядре, в десктопном один, также в серверном AVX512 другой набор поддерживаемых семейств инструкций (их там наклепали гору просто).ronemun: ↑ 02.11.2022 18:42 Взяти готові чіплети з Core 12900-13900, без графіки і дисплеїв, без е-ядер, тільки 16-20 p-ядер, вийшло б 200-240 мм.кв., з 2ма контролерами памяті + ...
Ну и наверное же драйвера к HBM занимают место. Интересно будет посмотреть тесты, в январе вроде бы лонч, хорошо.
-
l-m
Member
Лінь шукати, але попереднім слайдам було фізичних 16, але 2 шт одразу віддані під брак, тому й 14 активних.ronemun: ↑ 02.11.2022 18:16 А оскільки ядер в чіпі всього 14 штук то і відключати несильно вийде.
-
Scoffer
Member
Проц затримується не через техпроцес, а через занадто високу доступність потужних речовин у розробників.
12 степінгів, овер 500 знайдених апаратних помилок в процесі лише за офіційною версією.
Відправлено через 2 хвилини 21 секунду:
12 степінгів, овер 500 знайдених апаратних помилок в процесі лише за офіційною версією.
Відправлено через 2 хвилини 21 секунду:
За новими слухами - до 72 доступних при 80 фізичних (4*20)Максимальне число x86-ядер має скласти 56 штук
-
ronemun
Advanced Member
Scoffer
72 ядра це добрі новини.
Щодо речовин, то теж так здогадувався - в Алдерах 8 p-ядер з кешом і агентами кільця 80 мм.кв. 32 ядра буде 320, і ще лишиться на 4+ каналів памяті і 64+ PCie v5/UPI/CLX - ці блоки в Інтела дуже мало займають. І в Алдера ще оптимізовано для високих частот, ксеони взагалі холодні будуть. Спокійно можна 2 кристала впакувати і зєднати між собою і ще купа ліній UPI залишиться вільні - навіть 1 блок по 20 ліній це 80 ГБайт в кожну сторону, з дуже низькими затримками. Можна і більше ліній, але контролери памяті і PCIe тут же в кристалі, і нема потреби як в АМД на одну шину грузити все. А як ще меншими кристалами, так щоб брак був низький, наприклад на 200+ мм.кв., це все одно по 20+ ядер вийде, але тоді вже краще як в АМД всі кристали через спільний IO блок чіпляти, наприклад в TSMC замовити. Або через EMIB, але щоб зєднання було між агентами кільцевої шини - тоді між кристалами взагалі нульові затримки будуть.
Щодо інших ядер в Ксеонах - не так вже вони й більші - на 10 нм значно менші ніж на 14нм, і ще один блок AVX3 погоди не робить, і кешу на ядро меньше - всього 3,375, а не 4,25-5,0 як у Алдер/Рапід, які на 5,5-6 ГГц призначені
72 ядра це добрі новини.
Щодо речовин, то теж так здогадувався - в Алдерах 8 p-ядер з кешом і агентами кільця 80 мм.кв. 32 ядра буде 320, і ще лишиться на 4+ каналів памяті і 64+ PCie v5/UPI/CLX - ці блоки в Інтела дуже мало займають. І в Алдера ще оптимізовано для високих частот, ксеони взагалі холодні будуть. Спокійно можна 2 кристала впакувати і зєднати між собою і ще купа ліній UPI залишиться вільні - навіть 1 блок по 20 ліній це 80 ГБайт в кожну сторону, з дуже низькими затримками. Можна і більше ліній, але контролери памяті і PCIe тут же в кристалі, і нема потреби як в АМД на одну шину грузити все. А як ще меншими кристалами, так щоб брак був низький, наприклад на 200+ мм.кв., це все одно по 20+ ядер вийде, але тоді вже краще як в АМД всі кристали через спільний IO блок чіпляти, наприклад в TSMC замовити. Або через EMIB, але щоб зєднання було між агентами кільцевої шини - тоді між кристалами взагалі нульові затримки будуть.
Щодо інших ядер в Ксеонах - не так вже вони й більші - на 10 нм значно менші ніж на 14нм, і ще один блок AVX3 погоди не робить, і кешу на ядро меньше - всього 3,375, а не 4,25-5,0 як у Алдер/Рапід, які на 5,5-6 ГГц призначені
-
Scoffer
Member
ronemun
Особисто я був би значно більш задоволений від 2х ядер по 72ГГц, ніж від 72 ядер по 2ГГц.
Абсолютна більшість корпоративних завдань або не масштабуються далі 4-8 потоків зовсім, або масштабуються з мізерним приростом. Типу було 16 відер, зробив 64, і стало швидше не в 4 рази, а на чверть Всі ці мільйони ядер в одному сокеті в реальності не більше ніж понторізка. Навіть віртуалізація на 64+ ядрах починає потроху просідати, хоча це абсолютно багатопоточне завдання, і накладні росходи на неї доводиться закладувати не 5-10%, а вже 15-20. Що там буде відбуватись на 2 по 128 навіть дивитись не хочу.
Тупіковий шлях розвитку.
Особисто я був би значно більш задоволений від 2х ядер по 72ГГц, ніж від 72 ядер по 2ГГц.
Абсолютна більшість корпоративних завдань або не масштабуються далі 4-8 потоків зовсім, або масштабуються з мізерним приростом. Типу було 16 відер, зробив 64, і стало швидше не в 4 рази, а на чверть Всі ці мільйони ядер в одному сокеті в реальності не більше ніж понторізка. Навіть віртуалізація на 64+ ядрах починає потроху просідати, хоча це абсолютно багатопоточне завдання, і накладні росходи на неї доводиться закладувати не 5-10%, а вже 15-20. Що там буде відбуватись на 2 по 128 навіть дивитись не хочу.
Тупіковий шлях розвитку.
-
alexxusss
Member
Вони ж казали, що чотири техпроцеса планують освоїти за 5 років?Scoffer: ↑ 02.11.2022 21:0512 степінгів, овер 500 знайдених апаратних помилок в процесі лише за офіційною версією.