Відеокарти AMD Radeon RX 7900 XTX та Radeon RX 7900 XT представлені офіційно

Kashtan · Повідомлення 04.11.2022 23:12

konb999: ↑ 04.11.2022 16:19 4090 сейчас абсолютный чемпион а до её выхода таковой была 3090ти.

Сумнівне твердження. Абсолютний чемпіон - це переможець поза всіма категоріями, є ігри і режими де 3090 ti програла 6950. І їх не мало.

спойлер: В 3дмарку TimeSpy Extreme, який найважчий для амд відеокарт після бенчмарків із промінням, нині теж перевагу по середньому балу в графіці не на користь 3090 ti.
Average score: 10690 RX 6950
Average score: 10640 3090 ti

В інших бенчмарках окрім промінневого - повний розгром.

Скоротриндець · Повідомлення 04.11.2022 23:24

minesweeper: ↑ 04.11.2022 11:29 Отправлено спустя 1 минуту 21 секунду:
Это от части рофл, если что. Ещё раз не в обиду

Че, только после написания ти понял на столько ти оказался прав?
не 6.7 ведь на руки получают) Таких сейчас больше половиньі.

Відправлено через 46 хвилин 55 секунд:

Nuclear World: ↑ 04.11.2022 17:21 С картами радеон ещё хоть как то обосновано, но как аргументировать аппетиты жадной кожанки? За предтоп 1200 баксов это шендец я считаю...

Той момент коли чіп з пластини коштує 50 уе а ти купити можешь тільки за х20-30...

ronemun · Повідомлення 05.11.2022 01:21

Народ, що ви всі причепилися до променів у АМД. В неї FP16 відносно FP32 сильніше у 2 рази, на відміну від Нвідії, в якої вони однакові. А це 120 TFlops. fp16 підходить для любих обчислень, а т.ч рендеру графіки - наприклад у всіх смартфонах Adreno від Qualcomm, чи в A1х від Apple, вся графіка і її обробка розраховується вже на fp16, і лише де його недостатньо - там на fp32. Так само і AI, і рейтрейсінг, і фізика, і згладжування, і багато чого можна. Це не додачу до основних RTX і Ai блоків.
Щодо променів немає потреби для їх точного рендеру - давного використовується методика воксельної обробки, коли промені використовуються лише для області, а не для кожного пікселя, фактично для пучків, щоб визначити розподіл освітлення. А решту йде звичайний рендер з корекцією освітлення на основі RTX. Там взагалі хватає звичайної відяхи щоб кінематографічу картинку отримати. Хто забув, може нагадати собі фільм Гравітація, який за це Оскар отримав
Крім того, враховуючи нові віяння у генерації художньої графіки за допомогою AI мереж, здається про RTX скоро забудуть - за допомогою Ai можна легко симулювати абсолютно будь-які ефекти, а не тільки RTX, то ж навіщо транзистори тратити на дуже спеціалізовану фічу.

lewerlin · Повідомлення 05.11.2022 11:43

the lamer: ↑ 04.11.2022 12:56Во-вторых, никто не ожидал, что объем InfinityCache в новом поколении уменьшится (96МБ у нового флагмана против 128МБ у прошлого). Все предполагали минимум 32МБ кэша на плитку, а оказалось 16МБ.

В новині трохи не так. ІС в основному чіпі окремо, чіплети окремо. Маємо 96+192.

Vecchio · Повідомлення 05.11.2022 12:11

Nuclear World: ↑ 04.11.2022 17:21 С картами радеон ещё хоть как то обосновано, но как аргументировать аппетиты жадной кожанки?

GameWorks и жесткие NDA со всеми теми, кто получает от них карты. Это основа.
Понятное дело, что все вышеперечисленные причины (техпроцесс, плата, элементы, СО, etc) относятся в том числе и к новым картам Нвидии, но, по-моему мнению, не в большей мере.

alexxusss · Повідомлення 05.11.2022 12:37

ronemun: ↑ 05.11.2022 01:21В неї FP16 відносно FP32 сильніше у 2 рази, на відміну від Нвідії, в якої вони однакові. А це 120 TFlops. fp16 підходить для любих обчислень, а т.ч рендеру графіки - наприклад у всіх смартфонах Adreno від Qualcomm, чи в A1х від Apple, вся графіка і її обробка розраховується вже на fp16, і лише де його недостатньо - там на fp32. Так само і AI, і рейтрейсінг, і фізика, і згладжування, і багато чого можна. Це не додачу до основних RTX і Ai блоків.
Щодо променів немає потреби для їх точного рендеру - давного використовується методика воксельної обробки, коли промені використовуються лише для області, а не для кожного пікселя, фактично для пучків, щоб визначити розподіл освітлення.

Бачиш, маркетинг на стороні Нвідії. середньостатистичний покупець, побачить, що в променях вони сильніші, плюс частка ринку, плюс люди звикли, тому він готовий переплатити. Насправді, 4090 по факту жере менше, ніж та сама 3090ti, хоча TDP на коробці написане однакове. Чомусь АМД не захотіли зробити ширший чіп і на 450W. В реальності споживання менше. Кристал на 300мм по міркам відях - це взагалі малютка. 5,3 ТБ/с інтерконект, можливість настакати кешу у два поверхи у них є. Так би з 4090/ti змогли потягатись. Не бачу причин, чому б там не вистачило 3х8-pin коннектора.

minesweeper · Повідомлення 05.11.2022 14:23

alexxusss: ↑ 05.11.2022 12:37
ronemun: ↑ 05.11.2022 01:21В неї FP16 відносно FP32 сильніше у 2 рази, на відміну від Нвідії, в якої вони однакові. А це 120 TFlops. fp16 підходить для любих обчислень, а т.ч рендеру графіки - наприклад у всіх смартфонах Adreno від Qualcomm, чи в A1х від Apple, вся графіка і її обробка розраховується вже на fp16, і лише де його недостатньо - там на fp32. Так само і AI, і рейтрейсінг, і фізика, і згладжування, і багато чого можна. Це не додачу до основних RTX і Ai блоків.
Щодо променів немає потреби для їх точного рендеру - давного використовується методика воксельної обробки, коли промені використовуються лише для області, а не для кожного пікселя, фактично для пучків, щоб визначити розподіл освітлення.
Бачиш, маркетинг на стороні Нвідії. середньостатистичний покупець, побачить, що в променях вони сильніші, плюс частка ринку, плюс люди звикли, тому він готовий переплатити. Насправді, 4090 по факту жере менше, ніж та сама 3090ti, хоча TDP на коробці написане однакове. Чомусь АМД не захотіли зробити ширший чіп і на 450W. В реальності споживання менше. Кристал на 300мм по міркам відях - це взагалі малютка. 5,3 ТБ/с інтерконект, можливість настакати кешу у два поверхи у них є. Так би з 4090/ti змогли потягатись. Не бачу причин, чому б там не вистачило 3х8-pin коннектора.

Я теж огляд у того блогера подививсь. Думаю, що сучасні ігри не використовують весь потенціал чіпа, можливо в синтетиці. Навіщо тоді 2 біоса, один на 450 ватт, другий на 600, якщо в іграх не більше 400...

vmsolver · Повідомлення 05.11.2022 18:33

ronemun: ↑ 05.11.2022 01:21В неї FP16 відносно FP32 сильніше у 2 рази, на відміну від Нвідії, в якої вони однакові. А це 120 TFlops. fp16 підходить для любих обчислень, а т.ч рендеру графіки

Из обзора Веги, в которой эти FP16 появились

На англ + ссылка: https://www.anandtech.com/show/11717/th ... 6-review/4
As for gaming, the situation is more complex still. While FP16 operations can be used for games (and in fact are somewhat common in the mobile space), in the PC space they are virtually never used. When PC GPUs made the jump to unified shaders in 2006/2007, the decision was made to do everything at FP32 since that’s what vertex shaders typically required to begin with, and it’s only recently that anyone has bothered to look back. So while there is some long-term potential here for Vega’s fast FP16 math to become relevant for gaming, at the moment it doesn’t do much outside of a couple of benchmarks and some AMD developer relations enhanced software. Vega will, for the present, live and die in the gaming space primarily based on its FP32 performance.

Щодо ігор, то ситуація ще складніша. У той час як операції FP16 можна використовувати для ігор (і насправді є дещо поширеними в мобільному просторі), у просторі ПК вони практично ніколи не використовуються. Коли графічні процесори ПК зробили стрибок до уніфікованих шейдерів у 2006/2007 роках, було прийнято рішення робити все на FP32, оскільки це те, що зазвичай потрібно для вершинних шейдерів, і лише нещодавно хтось потрудився озирнутися назад. Таким чином, хоча тут є деякий довгостроковий потенціал для того, щоб швидка математика Vega FP16 стала актуальною для ігор, на даний момент вона не дає багато чого, окрім кількох тестів і деякого розширеного програмного забезпечення для зв’язків з розробниками AMD. На даний момент Vega буде жити і помирати в ігровому просторі в основному завдяки своїй продуктивності FP32.

Так что FP16 там не для игр. Если хочется поиграться в FP16 на 4090, то тензор-ядра поддерживают матричные операции с ними, надо всего лишь переделать всю арифметику на матрицы (а арифметика пространства в играх изначально на матрицах). У меня сложилось (давно) впечатление, что для игр этот формат использовать не будут в ПК, нет смысла. А вот для нейросеток очень даже подходит, там и FP8 добавили. Для мобилок этот формат - спасение, так как графика там обычно на порядки проще, модели как правило лоуполи, там как раз всё в FP16 делать.

Что касается новых видеокарт АМД, надо смотреть как они будут на практике, цена снижена не просто так, АМД с удовольствием задрала бы цены вверх, но, по всей видимости, не может. Мне сейчас больше интересны подробности об устройстве нового CU.

ClockedToTheMax · Повідомлення 05.11.2022 22:20

vmsolver: ↑ 05.11.2022 18:33 Мне сейчас больше интересны подробности об устройстве нового CU.

Именно. Почему-то не обращают внимания на потрясающую новость. Все SP стали унифицированными. По идее, со снижением разрешения, тот же RT будет считаться быстрее не только потому что считать нужно меньше, но и потому что освобождаются SP из пула рендера. Так мыслю.

ronemun · Повідомлення 05.11.2022 22:42

vmsolver
я думаю АМД краще знає чи потрібна FP16. Не можна порівнювати степінь застосування fp16 тоді коли вийшла vega і зараз - дуже багато вдосконалень в алгоритми рендеру ввели з тих пір. Навіть на процесорах впровадили fp16 для рендеру, не те що на відяхах. В Apple прямо заявили що fp16 в більшості хватає для ігор, в них в драйверах і графіці якась інтелектуальна система яка на ходу визначає якої точності достатньо щоб не було замітно артефактів графіки. Адже невелика відмінність кольорів незамітна для людини, тим більше в русі.

the lamer · Повідомлення 05.11.2022 22:55

lewerlin: ↑ 05.11.2022 11:43
the lamer: ↑ 04.11.2022 12:56Во-вторых, никто не ожидал, что объем InfinityCache в новом поколении уменьшится (96МБ у нового флагмана против 128МБ у прошлого). Все предполагали минимум 32МБ кэша на плитку, а оказалось 16МБ.
В новині трохи не так. ІС в основному чіпі окремо, чіплети окремо. Маємо 96+192.

Можете указать источник информации?
Я, в процитированном вами сообщении, привел ссылку на оффсайт AMD, где для 7900 XTX упоминание про кэш в единственной строчке: "Infinity Cache 96 MB" (при этом 96:6=16).
Думаю, если бы там было суммарно 288МБ, AMD не постеснялись бы о этом написать.

vmsolver · Повідомлення 05.11.2022 23:21

ClockedToTheMax: ↑ 05.11.2022 22:20Именно. Почему-то не обращают внимания на потрясающую новость.

Потому что такие подробности интересны единицам

ClockedToTheMax: ↑ 05.11.2022 22:20Все SP стали унифицированными

На унифицированную архитектуру перешли в 2006/2007 году, с тех пор у Nvidia и AMD все АЛУ унифицированы. В этом плане ничего не поменялось.

ClockedToTheMax: ↑ 05.11.2022 22:20По идее, со снижением разрешения, тот же RT будет считаться быстрее не только потому что считать нужно меньше, но и потому что освобождаются SP из пула рендера.

Есть и другие ограничения, снизу, и со временем они становятся всё значимее, по мере увеличения количества SP. GPU стали очень широкими. При рендере изображение разделяется на части, называемые тайлами, и каждый тайл пропускается по конвейеру. Но если количество тайлов не велико, а при низком разрешении это так, то их не хватает чтобы загрузить все CU/SM (процессоры), поэтому сейчас уже несколько поколений наибольший прирост происходит именно в 4к.

ronemun: ↑ 05.11.2022 22:42я думаю АМД краще знає чи потрібна FP16

Безусловно, и ответ тут: нейросети. Если бы FP16 был нужен для игр, Nvidia бы этот факт как-то бы проявила в спеках новых GPU, но такого нет и близко, что говорит нам о том, что FP16 нужен для нейросетей, а для них есть тензор-ядра которые закопают любой FP16 на АМД.

ronemun: ↑ 05.11.2022 22:42Не можна порівнювати степінь застосування fp16 тоді коли вийшла vega і зараз - дуже багато вдосконалень в алгоритми рендеру ввели з тих пір. Навіть на процесорах впровадили fp16 для рендеру, не те що на відяхах

Но графический конвейер не изменился, с чего бы FP16 стал бы более значимым сейчас? Какие события произошли за это время в рендере игр? В процессоры внедрили FP16 отнюдь не для рендера, а для нейросетей. Даже ленивый поиск в гугле приводит к выводу, что FP16 и более мелкие форматы нужны в рамках работ по теме глубокого обучения. Просто потому что другие задачи, как правило снисходительно улыбаются, когда им предлагают даже FP32, им FP64 подавай.

ronemun: ↑ 05.11.2022 22:42В Apple прямо заявили що fp16 в більшості хватає для ігор, в них в драйверах і графіці якась інтелектуальна система яка на ходу визначає якої точності достатньо щоб не було замітно артефактів графіки. Адже невелика відмінність кольорів незамітна для людини, тим більше в русі.

А где она это заявила?
На первый взгляд, FP16 нужен больше для той интеллектуальной системы, чем для рендера для GPU. Хотя, для пиксельных шейдеров наверное FP16 был бы достаточен для многих случаев, но не всех. Цвет пикселя обычно это 8 бит, в HDR - 10 бит и вроде бы 12 бит где-то есть (наверное), для последних точности FP16 уже не хватает, у FP16 мантисса всего 11 бит, то есть для HDR рендера у FP16 перспектив нет никаких, совсем, ведь для промежуточных вычислений нужно иметь точность выше, этот запас зависит от сложности арифметики цвета. Я думаю, никто в эти нюансы вдаваться не будет, будут просто юзать привычный FP32, который есть везде и не морочить себе голову.

Scoffer · Повідомлення 05.11.2022 23:27

vmsolver: ↑ 05.11.2022 23:21А где она это заявила?

Та щось таке було. Однак треба враховувати специфіку епл - ігрульки в першу чергу для яблофона, а там і текстур сильно-сильно поменше, і полігонів, і кольорами з обмеженої палітри нікого не здивуєш.

vmsolver: ↑ 05.11.2022 23:21 Но если количество тайлов не велико, а при низком разрешении это так, то их не хватает чтобы загрузить все CU/SM (процессоры), поэтому сейчас уже несколько поколений наибольший прирост происходит именно в 4к.

Вихід є - out of order CU/SM і 10 кіловатний БЖ

vmsolver · Повідомлення 05.11.2022 23:42

Scoffer
Так айфон это мобилка, там FP16 юзается давно и является стандартом, там игры проще и FP16 экономит энергию батарейки, что там важно. Но мы ведь о ПК. Для ПК и выше, мелкие форматы используются не столько ради экономии энергии, сколько для повышения производительности

Scoffer · Повідомлення 05.11.2022 23:47

vmsolver
То я тобі про те звідки ноги заяви епла ростуть. Те що в пекарнях FP16 щастя не зробить я згоден.

ClockedToTheMax · Повідомлення 05.11.2022 23:56

vmsolver: ↑ 05.11.2022 23:21
ClockedToTheMax: ↑ 05.11.2022 22:20Все SP стали унифицированными
На унифицированную архитектуру перешли в 2006/2007 году, с тех пор у Nvidia и AMD все АЛУ унифицированы. В этом плане ничего не поменялось.

Radeon RX 6800 XT - Количество блоков рендеринга 128 - Количество ядер Ray Accelerato 72. В середине 2000-х унифицировали SP для пиксел и вертекс шейдерных программ. Сейчас тоже самое произошло для shader\RT\AI.

vmsolver · Повідомлення 06.11.2022 00:35

ClockedToTheMax: ↑ 05.11.2022 23:56 Radeon RX 6800 XT - Количество блоков рендеринга 128 - Количество ядер Ray Accelerato 72. В середине 2000-х унифицировали SP для пиксел и вертекс шейдерных программ. Сейчас тоже самое произошло для shader\RT\AI.

Хм, путаница распутывается так, SP/шейдер/АЛУ это одно и тоже, и оно унифицировано с 2006, используется для всех вычислений, это по сути своей обычный вычислитель с некоторыми GPU-нюансами. А вот RT/AI/tensor/ROP/TMU и тому подобное это так называемые SFU (special functional unit), это специальные блоки делающие специфические вычисления, нужны они для того, чтобы универсальные АЛУ не тратили свои ресурсы на эти вычисления, так как их скорость будет не впечатляющая, а специально разработанные для этих вычислений блоки делают это по определению эффективно и быстро, т.к. они для этого разработаны.

Так вот, в RDNA3 шейдеры как были унифицированы так и остались, SFU как были специализированы, так они и остались специализированными, им могут добавить функций, расширить их функционал, добавить поддерживаемые форматы и т.д., но суть их так и осталась - быть специализированными, это меняться не будет, потому что все и так на своих местах и делают то ради чего были созданы. И сейчас, в этом плане, ничего не изменилось.

ClockedToTheMax · Повідомлення 06.11.2022 03:02

vmsolver: ↑ 06.11.2022 00:35 И сейчас, в этом плане, ничего не изменилось.

Ну кое что всё таки изменилось. А именно:

RDNA 3 switches to a new “unified” compute unit that uses dual-issue wave 32 units, so AMD can issue either integer or floating point instructions as needed depending on the workload, which Naffziger says can speed up gaming frame rates and AI tasks alike. An enhanced general purpose register file with 50 percent more capacity than the RDNA 2 design likewise helps keep all tasks fed.

Yes, I said AI tasks. Two generations after Nvidia introduced tensor AI cores for DLSS and more in its RTX 20-series GeForce GPUs, AMD is finally following suit. Each RDNA 3 Compute Unit (CU) packs a pair of AI cores, as well as an enhanced ray tracing core that supports new dedicated instructions, 1.5x more rays in flight, and fresh ray box sorting and transversal capabilities.

Хотя я надеялся на полную унификацию процессоров. Специализированные ядра справляются со своими узкими задачами конечно быстрее, но у унификации как говорится "strength in numbers".

manbearboar · Повідомлення 06.11.2022 06:43

Блок схема N31 и комментарии разработчиков.

спойлер

MessiaH · Повідомлення 06.11.2022 11:49

NightVoron: ↑ 04.11.2022 16:23Согласен что лучи на текущий момент это в первую очередь маркетинг. Именно отражения и затем тени я всегда уменьшаю в настройках в первую очередь если нужно повысить фпс.

Поиграй в Анчартед, игра по графонию и без лучей всё лучистое заткнёт за пояс