FreezerUA:Чекаю коментарів типу "На ці гроші можна було 2 таких зібрати із китайський б/у ксеонів"
![laugh :laugh:](./images/smilies/laugh.gif)
не вийде. я вчора рахував і сам здивувався з результату:
після того як інтел зацінила 1000 дол за 18 ядер CascadeLake китайські ксеони, навіть x8 Xeon 2689 за 70 дол, стали невигідні
Розрахунок. Візьмем за одиницю продуктивності роботу ядра SandyBridge. Cascade ефективніше в 1,35 рази.
x18 Cascade на частоті 4,5 дають 137 одиниць продуктивності (гіпертрейдінг HT дає приріст 1,25) =18*4,5*1,35*1,25=137. При цьому продуктивність на 1 ядро для Cascade складає 1*4,5*1,35=6,1 , при мультипоточності 3,8
8 ядер Xeon e5 2689 (коротко 2689) на частоті 3,3 дають 33,0 , продуктивність на одне ядро 3,3 , при мультипоточності 2,0. Тобто навіть без HT 2689 не наздоганяє Cascade з HT: 3,3 проти 3,8.
Оскільки нам не потрібна вже зовсім дохла система, з малою ефективністю, то в SandyBridge прийдеться виключити HT. Також це значно зменшить його нагрів, що дозволить вписатись в теплопакет 115 Вт, і тим самим втримати максимальну частоту. А при мультипоточних розрахунках також зменшить навантаження на кеші, керування потоками, синхронізацію даних кешів, обмін даними між процами, що ще збільшить ефективність. Тож виходить що 2689 без HT дає не 33,0 а 26,5 од.
Для конкуренції з x18 Cascade прийдеться виставити 138/26,5=5,2 шт 2689, тобто 3 плати по 2 проца, обєднаних хоча б самою дешевою, але високошвидкісною мережею в кластер.
x18 Cascade коштує: 1000 проц, 250 мама, 64 ГБ RAM - 320. Всього 1570.
2689: 6 проців по 70 = 420, 3 мами по 80 = 240, на кожен проц по 16 ГБ RAM, 4х4 планки, 24 дол на проц - всього 140 дол. Мережа 3 шт мінімум по 70 дол - це карта, кабель + гніздо в свічі. ВСЬОГО = 420+240+140+210=1010 дол.
Я вже не враховую, що сучасні ядра ще у декілька раз ефективніші за старі при використанні AVX/FMA інструкцій - Cascade має 2 FPU замість 1 в SandyBrydge, кожен має ширину 1024 біт замість 256, тобто в Cascade в загальному мінімум в 4 рази більша продуктивність на ядро на тій же частоті. Також всі ядра обєдані в одному кристалі, одна паміть навсіх, нема пересилок між сокетами-платами, просідання продуктивності. У 2 рази вища продуктивність на ядро без AVX при 1 потоці на ядро, що важливо для баз даних і т.п.