Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників

Обсуждение статей и новостей сайта
Ответить
Автор
Сообщение
Megaclite
Member
Аватара пользователя

Сообщение

Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників
Вони зменшились

тепер 5060 буде мати 20sm замість 24 :lol:
dead_rat
Member
Аватара пользователя
Откуда: Берлін

Сообщение

Нічого, відсутність росту чіпа буде скомпенсовано ростом ціни :super:
SergN
Member
Откуда: Kyiv

Сообщение

Megaclite: 16.01.2025 15:31тепер 5060 буде мати 20sm замість 24 :lol:
... і 96 біт/6Гб ;)
Последний раз редактировалось SergN 16.01.2025 15:41, всего редактировалось 1 раз.
Robostyle
Member

Сообщение

Это то о чем я писал раньше, как хуанг будет отодвигать гейминг-гпу на задний план.
Нет, он не будет закрывать жифорс в угоду АІ, аутомотив и т.д. Он просто пустит весь кремний в высокомаржовый ИИ, а игорькам за счастье будут доставаться обрезки кожи и жира с барского стола, размером не более 300мм2
Еще повезло что GB203 не 278мм2...за 1199$ :laugh:
в комментах по ссылке валялось
Изображение
aaleksandrenko
Member
Аватара пользователя
Откуда: Житомир

Сообщение

AMD Ryzen 9000 має на 27% більше транзисторів чим 7000 і це не дало помітного ефекту швидкої (відсотків 5 напевно)
А тут профіт транзисторів 0, накрутили енергоспоживання і приправили намальованими кадрами. ну мрія хом'яка ;)
Megaclite
Member
Аватара пользователя

Сообщение

SergN: 16.01.2025 15:40
Megaclite: 16.01.2025 15:31тепер 5060 буде мати 20sm замість 24 :lol:
... і 96 біт/6Гб ;)
було би прикольно якби таке випустили
подивитись як лахи будуть купувати таку карту за $300, назва же потужна - RTX 5060
і №1 в стімі
vsx
Member
Аватара пользователя
Откуда: Kyiv

Сообщение

Я весь в предвкушении увидеть как 5060 догонит 4070 в 1080р.
Хотя если 5070=4090 то 5060=4080 :lol:
ronemun
Advanced Member

Сообщение

4090 - 144 блоки SM - 76.3 млрд.транз.
5090 - 192 блоки SM - 92.2 млрд.транз.
Цікаво, як вони умудрились в +21% транзисторів вмістити +33% шейдерних блоків і + 33% шини памяті. При цьому блоки значно продуктивніші в матрицях, а память ggdr7 явно складніша за gddr6. Ще pcie став v5 проти v4.
Можливо на кешах зекономили
Щодо техпроцесу то це не завжди важливо - на 28 нм спочатку зробили кеплер 680 з 1532 ядра, потім кеплер Тітан 2880 ядер х32 і 960ядер х64, потім Максвелл Тітан Х 3072ядра

Відправлено через 13 хвилин 7 секунд:
aaleksandrenko: 16.01.2025 15:47 AMD Ryzen 9000 має на 27% більше транзисторів чим 7000 і це не дало помітного ефекту швидкої (відсотків 5 напевно)
А тут профіт транзисторів 0, накрутили енергоспоживання і приправили намальованими кадрами. ну мрія хом'яка ;)
Ще цікавіше що ядра реально зросли знаачно більше, адже 32МБ кешу L3 і 8 МБ L2 залишились, а це мінімум 40*64=2,5 млрд. транзисторів. А ще є теги, десь 10% від обєму кешу, і 2 лінка IF той же. Нехай Все разом з кешами буде 3 млрд
але тоді ядро Zen5 має (8.3-3.0)/8=0.66 млрд. трн., а Zen4 (6.5-3.0)/8=0.44, отже Zen5 в 1.5 :eek: рази більший, недаремно ядро Zen5, саме його робоча частина, без кешу, знаачно більша ніж zen4, і це на кращому техпроцесі
Найцікавіше виглядають ядра Zen3 - в них, з врахуванням що кеш L2=0.5МБ, виходить що ядро має всього 175-200 млн. трн., в 3+ рази меньше ніж у Zen5, а IPC меньший лише в 1.2 раз.
VRoman
Member
Откуда: Albuquerque, NM, USA

Сообщение

Это чудо надо было назвать Ada Lovelace 2, а не Blackwell. Если я правильно помню Maxwell 2 принёс больше улучшений по сравнению с первой версией

Отправлено спустя 2 минуты 16 секунд:
ronemun: 16.01.2025 16:55 4090 - 144 блоки SM - 76.3 млрд.транз.
5090 - 192 блоки SM - 92.2 млрд.транз.
Цікаво, як вони умудрились в +21% транзисторів вмістити +33% шейдерних блоків і + 33% шини памяті. При цьому блоки значно продуктивніші в матрицях, а память ggdr7 явно складніша за gddr6. Ще pcie став v5 проти v4.
Можливо на кешах зекономили
Щодо техпроцесу то це не завжди важливо - на 28 нм спочатку зробили кеплер 680 з 1532 ядра, потім кеплер Тітан 2880 ядер х32 і 960ядер х64, потім Максвелл Тітан Х 3072ядра
Во всех чипах примерно так. Чего-то ненужное вырезали.
Robostyle
Member

Сообщение

VRoman: 16.01.2025 17:23 Это чудо надо было назвать Ada Lovelace 2, а не Blackwell. Если я правильно помню Maxwell 2 принёс больше улучшений по сравнению с первой версией
Ampere 3
vmsolver
Member

Сообщение

В Blackwell много чего поменяли, но не стоит ожидать, что это полностью новая архитектура с нуля. С нуля делают не часто, последней такой архитектурой был Тьюринг, который и привнёс аппаратное ускорение трассировки, все последующие архитектуры это допиливание первой. Со временем изменения накапливаются и становятся значительными.

Немного про Blackwell внутри, пока в общих словах, но много полезных мелочей, везде где-то да и улучшили, РТ сделали привычное удвоение, плюс много нового. Более точное и быстрое управление частотой, отключение простаивающих блоков на лету, одновременное выполнение обычных и матричных вычислений, если я верно понял, они даже распределяются по SM-ам независимо. И так далее. Это всё не заменяет документацию, которой всё ещё нет.
https://wccftech.com/nvidia-blackwell-r ... hnologies/

Я вот жду, чтобы SM, а точнее processing block-и в нём научили исполнять CUDA-ядрами на выбор одну из двух инструкций, какую из этих двух исполняет то или иное CUDA-ядро зависит от маски, таким методом можно будет исполнять обе ветки условного ветвления одновременно. В Аде такое ждал, не дождался, посмотрим что скажет Blackwell по этому поводу :)
ronemun
Advanced Member

Сообщение

може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)
IronWithin
Member
Аватара пользователя

Сообщение

ronemun: 16.01.2025 21:53 може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)
Сумніви з приводу титану, скоріш за все повні чипи у повному складі підуть у проф/серверний сегмент
Melofon
Member
Аватара пользователя
Откуда: Николаев

Сообщение

Megaclite: 16.01.2025 15:31
Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників
Вони зменшились

тепер 5060 буде мати 20sm замість 24 :lol:
Не факт!, особенно если верить этому сайту https://www.techpowerup.com/gpu-specs/? ... &sort=name на GB207 будет 5050, а 5060 от 5060ти чипом вообще отличатся не будет (GB206) а только размером видеопамяти https://www.techpowerup.com/gpu-specs/g ... 5060.c4219 , https://www.techpowerup.com/gpu-specs/g ... 0-ti.c4246 и я больше склонен верить этому сайту т.к. GB207 с его 2560 куда ядрами реально больше подходит для младшей 5050 но никак не для 5060.

Отправлено спустя 5 минут 26 секунд:
ronemun: 16.01.2025 21:53 може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)
И кто вам сказал что GB202 у 5090 так сильно порезан? вообще-то как раз в этот раз хх90 вышла на полноценном GB202-400 https://www.techpowerup.com/gpu-specs/g ... 5090.c4216 , так что не стоит надеятся на какой-то титан или 5090ти, их точно не будет, та даже когда вышла 4090 на немного порезанном AD102-300 всё равно потом не выпустили титан или 4090ти на полноценном AD102-400, а у 5090 и так полноценный, дальше некуда.
ronemun
Advanced Member

Сообщение

Melofon
все таки там саме 192 блоки, точніше 12GPC по 16SM кожен. слайд від Нвідії нижче. Детальніше тут
спойлер
Изображение
p.s. GB202-400 значить лише що в основі чіп gb202, а решту - це просто номер варіанту конфігурації невідключених блоків. Та навіть число 170 не ділиться ні на 4, ні на 8 і т.д., лише на 2, 5, 10, 17 і 85 - вже по цьому видно що блоків реально більше. Та й чіп здоровенний, там багато блоків буде з відхиленнями від норми, що сильно занижатиме середню частоту. ще одне видає число 192 - це кількість ROP. Вони давно інтегровані в GPC, а не окремо привязані до шини памяті, як раніше. А їх в 5090 якраз 192, по 2х8 шт. на GPC. Отже ви праві, включені всі GPC (і в них всі ROP), але відключено по 2 SM на кожен GPC, в деяких 1, всього 22 SM.
Последний раз редактировалось ronemun 18.01.2025 20:20, всего редактировалось 5 раз.
VolandInferno
Member
Аватара пользователя
Откуда: Київ

Сообщение

Як я себе постійно переконую, розмір - не головне.
Melofon
Member
Аватара пользователя
Откуда: Николаев

Сообщение

ronemun

Вот как раз следующий номер после номера чипа через тире означает степень порезки чипа где цифра 400 это обязательно полноценный чип, а всё что ниже обрезки и например 350 это менее порезанный чем 300 или 300 менее порезанный чем 250 и так далее, я не отрицаю что на том сайте что я привел пример ошибка на счет того что там 202-400 и скорее всего у 5090 таки 202-300, да и я в это больше верю чем в полноценный кристалл у огромного топового чипа, но как я и сказал выше 400 это всегда полноценный и вы можете в этом убедится посмотрев на все их предыдущие видеокарты и чипы где 400-е были всегда на полноценных чипах, например то что у 5080 будет полноценный чип 203-400 у меня меньше сомнений чем на счет полноценного чипа в 5090 т.к. тут чип намного больший и у него будет больше брака и поэтому сложно было бы набрать достаточное кол-во годных полноценных кристаллов для игровой топовой карты, а у 5080 чип намного меньше и тут это в разы проще, так же само было с 4080супер где он тоже был полноценный но его вывели на рынок не сразу, у этого же техпроцесса (4нм) процент годных чипов сразу при заказе от инвидия уже был довольно зрелым в отличии от того на котором делали 4000 линейку (5нм) и он только со временем (примерно через пол года или чуть более производства) стал более зрелым когда уже во всю клепали 4000 поколение, поэтому мы позже увидели 4080супер на полноценном кристалле AD103-400. В общем чем меньше кристалл тем всегда проще получить больший процент годных полноценных чипов.

Отправлено спустя 3 минуты 19 секунд:
VolandInferno: 18.01.2025 20:10Як я себе постійно переконую, розмір - не головне.
В чипах как раз размер имеет одну из важнейших ролей т.к. при их производстве чем больше чип тем его сложнее и дороже сделать, а у 5090 чип сильно больше чем у 4090 , 744мм2 против 609мм2.
Ответить