Останні статті і огляди
Новини
Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників
-
bes
Member
- Звідки: Kryvyi Rih
Предлагаю обсудить Молодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників
Главное не размер
Главное не размер
-
Megaclite
Member
Вони зменшилисьМолодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників
тепер 5060 буде мати 20sm замість 24
-
dead_rat
Member
- Звідки: Берлін
Нічого, відсутність росту чіпа буде скомпенсовано ростом ціни
-
SergN
Member
- Звідки: Kyiv
... і 96 біт/6ГбMegaclite: ↑ 16.01.2025 15:31тепер 5060 буде мати 20sm замість 24
Востаннє редагувалось 16.01.2025 15:41 користувачем SergN, всього редагувалось 1 раз.
-
Robostyle
Member
Это то о чем я писал раньше, как хуанг будет отодвигать гейминг-гпу на задний план.
Нет, он не будет закрывать жифорс в угоду АІ, аутомотив и т.д. Он просто пустит весь кремний в высокомаржовый ИИ, а игорькам за счастье будут доставаться обрезки кожи и жира с барского стола, размером не более 300мм2
Еще повезло что GB203 не 278мм2...за 1199$
Нет, он не будет закрывать жифорс в угоду АІ, аутомотив и т.д. Он просто пустит весь кремний в высокомаржовый ИИ, а игорькам за счастье будут доставаться обрезки кожи и жира с барского стола, размером не более 300мм2
Еще повезло что GB203 не 278мм2...за 1199$
- в комментах по ссылке валялось
-
aaleksandrenko
Member
- Звідки: Житомир
AMD Ryzen 9000 має на 27% більше транзисторів чим 7000 і це не дало помітного ефекту швидкої (відсотків 5 напевно)
А тут профіт транзисторів 0, накрутили енергоспоживання і приправили намальованими кадрами. ну мрія хом'яка
А тут профіт транзисторів 0, накрутили енергоспоживання і приправили намальованими кадрами. ну мрія хом'яка
-
Megaclite
Member
було би прикольно якби таке випустилиSergN: ↑ 16.01.2025 15:40... і 96 біт/6ГбMegaclite: ↑ 16.01.2025 15:31тепер 5060 буде мати 20sm замість 24
подивитись як лахи будуть купувати таку карту за $300, назва же потужна - RTX 5060
і №1 в стімі
-
vsx
Member
- Звідки: Kyiv
Я весь в предвкушении увидеть как 5060 догонит 4070 в 1080р.
Хотя если 5070=4090 то 5060=4080
Хотя если 5070=4090 то 5060=4080
-
ronemun
Advanced Member
4090 - 144 блоки SM - 76.3 млрд.транз.
5090 - 192 блоки SM - 92.2 млрд.транз.
Цікаво, як вони умудрились в +21% транзисторів вмістити +33% шейдерних блоків і + 33% шини памяті. При цьому блоки значно продуктивніші в матрицях, а память ggdr7 явно складніша за gddr6. Ще pcie став v5 проти v4.
Можливо на кешах зекономили
Щодо техпроцесу то це не завжди важливо - на 28 нм спочатку зробили кеплер 680 з 1532 ядра, потім кеплер Тітан 2880 ядер х32 і 960ядер х64, потім Максвелл Тітан Х 3072ядра
Відправлено через 13 хвилин 7 секунд:
але тоді ядро Zen5 має (8.3-3.0)/8=0.66 млрд. трн., а Zen4 (6.5-3.0)/8=0.44, отже Zen5 в 1.5 рази більший, недаремно ядро Zen5, саме його робоча частина, без кешу, знаачно більша ніж zen4, і це на кращому техпроцесі
Найцікавіше виглядають ядра Zen3 - в них, з врахуванням що кеш L2=0.5МБ, виходить що ядро має всього 175-200 млн. трн., в 3+ рази меньше ніж у Zen5, а IPC меньший лише в 1.2 раз.
5090 - 192 блоки SM - 92.2 млрд.транз.
Цікаво, як вони умудрились в +21% транзисторів вмістити +33% шейдерних блоків і + 33% шини памяті. При цьому блоки значно продуктивніші в матрицях, а память ggdr7 явно складніша за gddr6. Ще pcie став v5 проти v4.
Можливо на кешах зекономили
Щодо техпроцесу то це не завжди важливо - на 28 нм спочатку зробили кеплер 680 з 1532 ядра, потім кеплер Тітан 2880 ядер х32 і 960ядер х64, потім Максвелл Тітан Х 3072ядра
Відправлено через 13 хвилин 7 секунд:
Ще цікавіше що ядра реально зросли знаачно більше, адже 32МБ кешу L3 і 8 МБ L2 залишились, а це мінімум 40*64=2,5 млрд. транзисторів. А ще є теги, десь 10% від обєму кешу, і 2 лінка IF той же. Нехай Все разом з кешами буде 3 млрдaaleksandrenko: ↑ 16.01.2025 15:47 AMD Ryzen 9000 має на 27% більше транзисторів чим 7000 і це не дало помітного ефекту швидкої (відсотків 5 напевно)
А тут профіт транзисторів 0, накрутили енергоспоживання і приправили намальованими кадрами. ну мрія хом'яка
але тоді ядро Zen5 має (8.3-3.0)/8=0.66 млрд. трн., а Zen4 (6.5-3.0)/8=0.44, отже Zen5 в 1.5 рази більший, недаремно ядро Zen5, саме його робоча частина, без кешу, знаачно більша ніж zen4, і це на кращому техпроцесі
Найцікавіше виглядають ядра Zen3 - в них, з врахуванням що кеш L2=0.5МБ, виходить що ядро має всього 175-200 млн. трн., в 3+ рази меньше ніж у Zen5, а IPC меньший лише в 1.2 раз.
-
VRoman
Member
- Звідки: Albuquerque, NM, USA
Это чудо надо было назвать Ada Lovelace 2, а не Blackwell. Если я правильно помню Maxwell 2 принёс больше улучшений по сравнению с первой версией
Отправлено спустя 2 минуты 16 секунд:
Отправлено спустя 2 минуты 16 секунд:
Во всех чипах примерно так. Чего-то ненужное вырезали.ronemun: ↑ 16.01.2025 16:55 4090 - 144 блоки SM - 76.3 млрд.транз.
5090 - 192 блоки SM - 92.2 млрд.транз.
Цікаво, як вони умудрились в +21% транзисторів вмістити +33% шейдерних блоків і + 33% шини памяті. При цьому блоки значно продуктивніші в матрицях, а память ggdr7 явно складніша за gddr6. Ще pcie став v5 проти v4.
Можливо на кешах зекономили
Щодо техпроцесу то це не завжди важливо - на 28 нм спочатку зробили кеплер 680 з 1532 ядра, потім кеплер Тітан 2880 ядер х32 і 960ядер х64, потім Максвелл Тітан Х 3072ядра
-
Robostyle
Member
Ampere 3VRoman: ↑ 16.01.2025 17:23 Это чудо надо было назвать Ada Lovelace 2, а не Blackwell. Если я правильно помню Maxwell 2 принёс больше улучшений по сравнению с первой версией
-
vmsolver
Member
В Blackwell много чего поменяли, но не стоит ожидать, что это полностью новая архитектура с нуля. С нуля делают не часто, последней такой архитектурой был Тьюринг, который и привнёс аппаратное ускорение трассировки, все последующие архитектуры это допиливание первой. Со временем изменения накапливаются и становятся значительными.
Немного про Blackwell внутри, пока в общих словах, но много полезных мелочей, везде где-то да и улучшили, РТ сделали привычное удвоение, плюс много нового. Более точное и быстрое управление частотой, отключение простаивающих блоков на лету, одновременное выполнение обычных и матричных вычислений, если я верно понял, они даже распределяются по SM-ам независимо. И так далее. Это всё не заменяет документацию, которой всё ещё нет.
https://wccftech.com/nvidia-blackwell-r ... hnologies/
Я вот жду, чтобы SM, а точнее processing block-и в нём научили исполнять CUDA-ядрами на выбор одну из двух инструкций, какую из этих двух исполняет то или иное CUDA-ядро зависит от маски, таким методом можно будет исполнять обе ветки условного ветвления одновременно. В Аде такое ждал, не дождался, посмотрим что скажет Blackwell по этому поводу
Немного про Blackwell внутри, пока в общих словах, но много полезных мелочей, везде где-то да и улучшили, РТ сделали привычное удвоение, плюс много нового. Более точное и быстрое управление частотой, отключение простаивающих блоков на лету, одновременное выполнение обычных и матричных вычислений, если я верно понял, они даже распределяются по SM-ам независимо. И так далее. Это всё не заменяет документацию, которой всё ещё нет.
https://wccftech.com/nvidia-blackwell-r ... hnologies/
Я вот жду, чтобы SM, а точнее processing block-и в нём научили исполнять CUDA-ядрами на выбор одну из двух инструкций, какую из этих двух исполняет то или иное CUDA-ядро зависит от маски, таким методом можно будет исполнять обе ветки условного ветвления одновременно. В Аде такое ждал, не дождался, посмотрим что скажет Blackwell по этому поводу
-
ronemun
Advanced Member
може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)
-
IronWithin
Member
Сумніви з приводу титану, скоріш за все повні чипи у повному складі підуть у проф/серверний сегментronemun: ↑ 16.01.2025 21:53 може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)
-
Melofon
Member
- Звідки: Николаев
Не факт!, особенно если верить этому сайту https://www.techpowerup.com/gpu-specs/? ... &sort=name на GB207 будет 5050, а 5060 от 5060ти чипом вообще отличатся не будет (GB206) а только размером видеопамяти https://www.techpowerup.com/gpu-specs/g ... 5060.c4219 , https://www.techpowerup.com/gpu-specs/g ... 0-ti.c4246 и я больше склонен верить этому сайту т.к. GB207 с его 2560 куда ядрами реально больше подходит для младшей 5050 но никак не для 5060.Megaclite: ↑ 16.01.2025 15:31Вони зменшилисьМолодші графічні процесори Nvidia Blackwell не виросли в розмірах щодо попередників
тепер 5060 буде мати 20sm замість 24
Отправлено спустя 5 минут 26 секунд:
И кто вам сказал что GB202 у 5090 так сильно порезан? вообще-то как раз в этот раз хх90 вышла на полноценном GB202-400 https://www.techpowerup.com/gpu-specs/g ... 5090.c4216 , так что не стоит надеятся на какой-то титан или 5090ти, их точно не будет, та даже когда вышла 4090 на немного порезанном AD102-300 всё равно потом не выпустили титан или 4090ти на полноценном AD102-400, а у 5090 и так полноценный, дальше некуда.ronemun: ↑ 16.01.2025 21:53 може я не замітив, але чомусь нігде не вказується що чіп 5090 насправді має 192 блоки SM, а не ті 170 що включені. Отже може ще вийде Тітан
Тобто повний чіп GB202 в реалі на 1/3 більше ніж повний AD102, 192/144, в т.ч. і шина 512/384=1.33, але тут вже gddr7, яка через рік+ скочить до 40 Гбіт/с (вже почалось масове виробництво)
Хоча відносно початкової 4090 зі всього 128 блоками (з 144) і ті 170 теж багато, +33% (ще був AD102-250 зі всього 114 блоків, 14592 ALU)
-
ronemun
Advanced Member
Melofon
все таки там саме 192 блоки, точніше 12GPC по 16SM кожен. слайд від Нвідії нижче. Детальніше тут
все таки там саме 192 блоки, точніше 12GPC по 16SM кожен. слайд від Нвідії нижче. Детальніше тут
- спойлер
Востаннє редагувалось 18.01.2025 20:20 користувачем ronemun, всього редагувалось 5 разів.
-
VolandInferno
Member
- Звідки: Київ
Як я себе постійно переконую, розмір - не головне.
-
Melofon
Member
- Звідки: Николаев
ronemun
Вот как раз следующий номер после номера чипа через тире означает степень порезки чипа где цифра 400 это обязательно полноценный чип, а всё что ниже обрезки и например 350 это менее порезанный чем 300 или 300 менее порезанный чем 250 и так далее, я не отрицаю что на том сайте что я привел пример ошибка на счет того что там 202-400 и скорее всего у 5090 таки 202-300, да и я в это больше верю чем в полноценный кристалл у огромного топового чипа, но как я и сказал выше 400 это всегда полноценный и вы можете в этом убедится посмотрев на все их предыдущие видеокарты и чипы где 400-е были всегда на полноценных чипах, например то что у 5080 будет полноценный чип 203-400 у меня меньше сомнений чем на счет полноценного чипа в 5090 т.к. тут чип намного больший и у него будет больше брака и поэтому сложно было бы набрать достаточное кол-во годных полноценных кристаллов для игровой топовой карты, а у 5080 чип намного меньше и тут это в разы проще, так же само было с 4080супер где он тоже был полноценный но его вывели на рынок не сразу, у этого же техпроцесса (4нм) процент годных чипов сразу при заказе от инвидия уже был довольно зрелым в отличии от того на котором делали 4000 линейку (5нм) и он только со временем (примерно через пол года или чуть более производства) стал более зрелым когда уже во всю клепали 4000 поколение, поэтому мы позже увидели 4080супер на полноценном кристалле AD103-400. В общем чем меньше кристалл тем всегда проще получить больший процент годных полноценных чипов.
Отправлено спустя 3 минуты 19 секунд:
Вот как раз следующий номер после номера чипа через тире означает степень порезки чипа где цифра 400 это обязательно полноценный чип, а всё что ниже обрезки и например 350 это менее порезанный чем 300 или 300 менее порезанный чем 250 и так далее, я не отрицаю что на том сайте что я привел пример ошибка на счет того что там 202-400 и скорее всего у 5090 таки 202-300, да и я в это больше верю чем в полноценный кристалл у огромного топового чипа, но как я и сказал выше 400 это всегда полноценный и вы можете в этом убедится посмотрев на все их предыдущие видеокарты и чипы где 400-е были всегда на полноценных чипах, например то что у 5080 будет полноценный чип 203-400 у меня меньше сомнений чем на счет полноценного чипа в 5090 т.к. тут чип намного больший и у него будет больше брака и поэтому сложно было бы набрать достаточное кол-во годных полноценных кристаллов для игровой топовой карты, а у 5080 чип намного меньше и тут это в разы проще, так же само было с 4080супер где он тоже был полноценный но его вывели на рынок не сразу, у этого же техпроцесса (4нм) процент годных чипов сразу при заказе от инвидия уже был довольно зрелым в отличии от того на котором делали 4000 линейку (5нм) и он только со временем (примерно через пол года или чуть более производства) стал более зрелым когда уже во всю клепали 4000 поколение, поэтому мы позже увидели 4080супер на полноценном кристалле AD103-400. В общем чем меньше кристалл тем всегда проще получить больший процент годных полноценных чипов.
Отправлено спустя 3 минуты 19 секунд:
В чипах как раз размер имеет одну из важнейших ролей т.к. при их производстве чем больше чип тем его сложнее и дороже сделать, а у 5090 чип сильно больше чем у 4090 , 744мм2 против 609мм2.VolandInferno: ↑ 18.01.2025 20:10Як я себе постійно переконую, розмір - не головне.