waryag
ну це вже якась ахі
унея, вибачте за слово
яскравий приклад дуже складного паралельного коду для обчислень - LAMMPS (молекулярна динаміка) білка родопсину.
Складна тим що вимагає розрахунку дуууже далеких і слабих взаємодій е/м випромінювання, якими не можна знехтувати, як прийнято часто. А все тому що це білок який відчуває світло в оці - він настільки чутливий. Тому тут необхідна паралельна робота багатьох ядер і швидкість обчислення дуже мала порівняно з іншими задачами
В результаті на 1ше місце вийшли зараз...ARM
І то
з величезним відривом-\
ARMv8 Neoverse-V2 72-ядернийний на 3,0 ГГц обганяє AMD EPYC 9575F 64-ядерний на 4,5ГГц, самий ефективний багатоядерний проц АМД, в 1,35 раз - 58 ns/day проти 43. А від результатів інших проців АМД/Intel взагалі жалість пробирає - AMD EPYC 9655 96-ядер - 47 ns/day, 2 x AMD EPYC 9654 96-ядерний (2х96) - 50.8, 2 x AMD EPYC 9575F 64-ядерний (2х64)- 66. Останній так взагалі - замість 2х43 ns/day дав всього 66 - в 1,5 рази. До речі, Ryzen 9950 дає 21, половину від EPYC 9575F, а навіть Core 285k - 25 ns, і це всього 8p ядер на 5.5 ГГц, решту 16 слабші в 1,4 рази на 4.6
При цьому АМД має 2 потоки на ядро що і ефективність ядра значно підвищує, на 30% мінімум, і паралельність - все таки затримка між потоками всього 4нс проти 25 нс між ядрами - ідеально для обміну даних по мережі. І в EPYC 9575F кожен чіплети маю широке зєднання IF - 100 ГБайт/с на вхід і на вихід, проти 64/32 у Ryzen. Але й це не сильно помогло проти 9950@5.5 - потужний однопотік знааачно важливіший, а 2 потоки на ядро однопотік сильно понижають, адже ядро дає загалом лише в 1,3-1,5 рази більше, однопотік падає в 1,5 рази - стає 1,33/2=0,66 проти 1. Та ще й частота ядра при 2х потоках переважно опускається через обмеження струму/потужності/температури
P.S. Neoverse v2 це старе ядро, ще 22 року розробки, 23 року вийшло, даний проц напевно від Nvidia Grace, тобто він ще й з великою затримкою памяті LPDDR5 працював. Вже вийшли проци з Neoverse v3
Відправлено через 29 хвилин 37 секунд:
А що там робити для корпорації в 3+ трильйона - раз плюнути.
Драйвер Нвідії відкритий, його вже навіть на Risc-v портнули
Нвідія сама зацікавлена мати кліжнтом Apple
Я не за Apple тяну, мені х86 дуже подобається, але АМД/Інтел друть сильно ціни за те що ARM вже за копійки віддає.
по суті ARM вже покриває 90+ % всіх алгоритмів, але якщо самому замовляти кремній то ціна за ядра впаде до пару доларів за ядро, і то з солідним прибутком, а за 64 ядра АМД взагалі здирає 10к доларів - 160 доларів за ядро!!!
І не тре приводити за великкий хаб IF/PCIe чи багато каналів ddr - цю фігню вже клепають всі хто може за корійки і маштабується за горизонт, + зараз нові стандарти вже пішли так далеко що вже хаб на 10 терабайт/с з підтримкою всіх можливих самих сучасних протоколів на 112/224 Гтс з найменшими затримками з суперкрутим інтелектом управління цим всім не рахується за серйозне, а в АМД IO на всього пару терабайт/с і то з застарілим PCie v5 і IF з затримкою між чіплетами в 80нс

і 150нс між сокетами