Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників

bes · Повідомлення 16.01.2025 15:18

Предлагаю обсудить Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників

Главное не размер

Megaclite · Повідомлення 16.01.2025 15:31

Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників

Вони зменшились

тепер 5060 буде мати 20sm замість 24

dead_rat · Повідомлення 16.01.2025 15:38

Нічого, відсутність росту чіпа буде скомпенсовано ростом ціни

SergN · Повідомлення 16.01.2025 15:40

Megaclite: ↑ 16.01.2025 15:31тепер 5060 буде мати 20sm замість 24

... і 96 біт/6Гб

Robostyle · Повідомлення 16.01.2025 15:40

Это то о чем я писал раньше, как хуанг будет отодвигать гейминг-гпу на задний план.
Нет, он не будет закрывать жифорс в угоду АІ, аутомотив и т.д. Он просто пустит весь кремний в высокомаржовый ИИ, а игорькам за счастье будут доставаться обрезки кожи и жира с барского стола, размером не более 300мм2
Еще повезло что GB203 не 278мм2...за 1199$

в комментах по ссылке валялось

aaleksandrenko · Повідомлення 16.01.2025 15:47

AMD Ryzen 9000 має на 27% більше транзисторів чим 7000 і це не дало помітного ефекту швидкої (відсотків 5 напевно)
А тут профіт транзисторів 0, накрутили енергоспоживання і приправили намальованими кадрами. ну мрія хом'яка

Megaclite · Повідомлення 16.01.2025 15:58

SergN: ↑ 16.01.2025 15:40
Megaclite: ↑ 16.01.2025 15:31тепер 5060 буде мати 20sm замість 24
... і 96 біт/6Гб

було би прикольно якби таке випустили
подивитись як лахи будуть купувати таку карту за $300, назва же потужна - RTX 5060
і №1 в стімі

vsx · Повідомлення 16.01.2025 16:15

Я весь в предвкушении увидеть как 5060 догонит 4070 в 1080р.
Хотя если 5070=4090 то 5060=4080

ronemun · Повідомлення 16.01.2025 16:42

4090 - 144 блоки SM - 76.3 млрд.транз.
5090 - 192 блоки SM - 92.2 млрд.транз.
Цікаво, як вони умудрились в +21% транзисторів вмістити +33% шейдерних блоків і + 33% шини памяті. При цьому блоки значно продуктивніші в матрицях, а память ggdr7 явно складніша за gddr6. Ще pcie став v5 проти v4.
Можливо на кешах зекономили
Щодо техпроцесу то це не завжди важливо - на 28 нм спочатку зробили кеплер 680 з 1532 ядра, потім кеплер Тітан 2880 ядер х32 і 960ядер х64, потім Максвелл Тітан Х 3072ядра

Відправлено через 13 хвилин 7 секунд:

aaleksandrenko: ↑ 16.01.2025 15:47 AMD Ryzen 9000 має на 27% більше транзисторів чим 7000 і це не дало помітного ефекту швидкої (відсотків 5 напевно)
А тут профіт транзисторів 0, накрутили енергоспоживання і приправили намальованими кадрами. ну мрія хом'яка

Ще цікавіше що ядра реально зросли знаачно більше, адже 32МБ кешу L3 і 8 МБ L2 залишились, а це мінімум 40*64=2,5 млрд. транзисторів. А ще є теги, десь 10% від обєму кешу, і 2 лінка IF той же. Нехай Все разом з кешами буде 3 млрд
але тоді ядро Zen5 має (8.3-3.0)/8=0.66 млрд. трн., а Zen4 (6.5-3.0)/8=0.44, отже Zen5 в 1.5

рази більший, недаремно ядро Zen5, саме його робоча частина, без кешу, знаачно більша ніж zen4, і це на кращому техпроцесі
Найцікавіше виглядають ядра Zen3 - в них, з врахуванням що кеш L2=0.5МБ, виходить що ядро має всього 175-200 млн. трн., в 3+ рази меньше ніж у Zen5, а IPC меньший лише в 1.2 раз.

VRoman · Повідомлення 16.01.2025 17:21

Это чудо надо было назвать Ada Lovelace 2, а не Blackwell. Если я правильно помню Maxwell 2 принёс больше улучшений по сравнению с первой версией

Отправлено спустя 2 минуты 16 секунд:

ronemun: ↑ 16.01.2025 16:55 4090 - 144 блоки SM - 76.3 млрд.транз.
5090 - 192 блоки SM - 92.2 млрд.транз.
Цікаво, як вони умудрились в +21% транзисторів вмістити +33% шейдерних блоків і + 33% шини памяті. При цьому блоки значно продуктивніші в матрицях, а память ggdr7 явно складніша за gddr6. Ще pcie став v5 проти v4.
Можливо на кешах зекономили
Щодо техпроцесу то це не завжди важливо - на 28 нм спочатку зробили кеплер 680 з 1532 ядра, потім кеплер Тітан 2880 ядер х32 і 960ядер х64, потім Максвелл Тітан Х 3072ядра

Во всех чипах примерно так. Чего-то ненужное вырезали.

Robostyle · Повідомлення 16.01.2025 17:31

VRoman: ↑ 16.01.2025 17:23 Это чудо надо было назвать Ada Lovelace 2, а не Blackwell. Если я правильно помню Maxwell 2 принёс больше улучшений по сравнению с первой версией

Ampere 3

vmsolver · Повідомлення 16.01.2025 18:43

В Blackwell много чего поменяли, но не стоит ожидать, что это полностью новая архитектура с нуля. С нуля делают не часто, последней такой архитектурой был Тьюринг, который и привнёс аппаратное ускорение трассировки, все последующие архитектуры это допиливание первой. Со временем изменения накапливаются и становятся значительными.

Немного про Blackwell внутри, пока в общих словах, но много полезных мелочей, везде где-то да и улучшили, РТ сделали привычное удвоение, плюс много нового. Более точное и быстрое управление частотой, отключение простаивающих блоков на лету, одновременное выполнение обычных и матричных вычислений, если я верно понял, они даже распределяются по SM-ам независимо. И так далее. Это всё не заменяет документацию, которой всё ещё нет.
https://wccftech.com/nvidia-blackwell-r ... hnologies/

Я вот жду, чтобы SM, а точнее processing block-и в нём научили исполнять CUDA-ядрами на выбор одну из двух инструкций, какую из этих двух исполняет то или иное CUDA-ядро зависит от маски, таким методом можно будет исполнять обе ветки условного ветвления одновременно. В Аде такое ждал, не дождался, посмотрим что скажет Blackwell по этому поводу

ronemun · Повідомлення 16.01.2025 21:53

може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)

IronWithin · Повідомлення 18.01.2025 11:57

ronemun: ↑ 16.01.2025 21:53 може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)

Сумніви з приводу титану, скоріш за все повні чипи у повному складі підуть у проф/серверний сегмент

Melofon · Повідомлення 18.01.2025 12:21

Megaclite: ↑ 16.01.2025 15:31
Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників
Вони зменшились

тепер 5060 буде мати 20sm замість 24

Не факт!, особенно если верить этому сайту https://www.techpowerup.com/gpu-specs/? ... &sort=name на GB207 будет 5050, а 5060 от 5060ти чипом вообще отличатся не будет (GB206) а только размером видеопамяти https://www.techpowerup.com/gpu-specs/g ... 5060.c4219 , https://www.techpowerup.com/gpu-specs/g ... 0-ti.c4246 и я больше склонен верить этому сайту т.к. GB207 с его 2560 куда ядрами реально больше подходит для младшей 5050 но никак не для 5060.

Отправлено спустя 5 минут 26 секунд:

ronemun: ↑ 16.01.2025 21:53 може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)

И кто вам сказал что GB202 у 5090 так сильно порезан? вообще-то как раз в этот раз хх90 вышла на полноценном GB202-400 https://www.techpowerup.com/gpu-specs/g ... 5090.c4216 , так что не стоит надеятся на какой-то титан или 5090ти, их точно не будет, та даже когда вышла 4090 на немного порезанном AD102-300 всё равно потом не выпустили титан или 4090ти на полноценном AD102-400, а у 5090 и так полноценный, дальше некуда.

ronemun · Повідомлення 18.01.2025 20:07

Melofon
все таки там саме 192 блоки, точніше 12GPC по 16SM кожен. слайд від Нвідії нижче. Детальніше тут

спойлер

p.s. GB202-400 значить лише що в основі чіп gb202, а решту - це просто номер варіанту конфігурації невідключених блоків. Та навіть число 170 не ділиться ні на 4, ні на 8 і т.д., лише на 2, 5, 10, 17 і 85 - вже по цьому видно що блоків реально більше. Та й чіп здоровенний, там багато блоків буде з відхиленнями від норми, що сильно занижатиме середню частоту. ще одне видає число 192 - це кількість ROP. Вони давно інтегровані в GPC, а не окремо привязані до шини памяті, як раніше. А їх в 5090 якраз 192, по 2х8 шт. на GPC. Отже ви праві, включені всі GPC (і в них всі ROP), але відключено по 2 SM на кожен GPC, в деяких 1, всього 22 SM.

VolandInferno · Повідомлення 18.01.2025 20:10

Як я себе постійно переконую, розмір - не головне.

Melofon · Повідомлення 19.01.2025 21:49

ronemun

Вот как раз следующий номер после номера чипа через тире означает степень порезки чипа где цифра 400 это обязательно полноценный чип, а всё что ниже обрезки и например 350 это менее порезанный чем 300 или 300 менее порезанный чем 250 и так далее, я не отрицаю что на том сайте что я привел пример ошибка на счет того что там 202-400 и скорее всего у 5090 таки 202-300, да и я в это больше верю чем в полноценный кристалл у огромного топового чипа, но как я и сказал выше 400 это всегда полноценный и вы можете в этом убедится посмотрев на все их предыдущие видеокарты и чипы где 400-е были всегда на полноценных чипах, например то что у 5080 будет полноценный чип 203-400 у меня меньше сомнений чем на счет полноценного чипа в 5090 т.к. тут чип намного больший и у него будет больше брака и поэтому сложно было бы набрать достаточное кол-во годных полноценных кристаллов для игровой топовой карты, а у 5080 чип намного меньше и тут это в разы проще, так же само было с 4080супер где он тоже был полноценный но его вывели на рынок не сразу, у этого же техпроцесса (4нм) процент годных чипов сразу при заказе от инвидия уже был довольно зрелым в отличии от того на котором делали 4000 линейку (5нм) и он только со временем (примерно через пол года или чуть более производства) стал более зрелым когда уже во всю клепали 4000 поколение, поэтому мы позже увидели 4080супер на полноценном кристалле AD103-400. В общем чем меньше кристалл тем всегда проще получить больший процент годных полноценных чипов.

Отправлено спустя 3 минуты 19 секунд:

VolandInferno: ↑ 18.01.2025 20:10Як я себе постійно переконую, розмір - не головне.

В чипах как раз размер имеет одну из важнейших ролей т.к. при их производстве чем больше чип тем его сложнее и дороже сделать, а у 5090 чип сильно больше чем у 4090 , 744мм2 против 609мм2.