Потому что такие подробности интересны единицам
На унифицированную архитектуру перешли в 2006/2007 году, с тех пор у Nvidia и AMD все АЛУ унифицированы. В этом плане ничего не поменялось.
ClockedToTheMax: ↑
05.11.2022 22:20По идее, со снижением разрешения, тот же RT будет считаться быстрее не только потому что считать нужно меньше, но и потому что освобождаются SP из пула рендера.
Есть и другие ограничения, снизу, и со временем они становятся всё значимее, по мере увеличения количества SP. GPU стали очень широкими. При рендере изображение разделяется на части, называемые тайлами, и каждый тайл пропускается по конвейеру. Но если количество тайлов не велико, а при низком разрешении это так, то их не хватает чтобы загрузить все CU/SM (процессоры), поэтому сейчас уже несколько поколений наибольший прирост происходит именно в 4к.
Безусловно, и ответ тут: нейросети. Если бы FP16 был нужен для игр, Nvidia бы этот факт как-то бы проявила в спеках новых GPU, но такого нет и близко, что говорит нам о том, что FP16 нужен для нейросетей, а для них есть тензор-ядра которые закопают любой FP16 на АМД.
ronemun: ↑
05.11.2022 22:42Не можна порівнювати степінь застосування fp16 тоді коли вийшла vega і зараз - дуже багато вдосконалень в алгоритми рендеру ввели з тих пір. Навіть на процесорах впровадили fp16 для рендеру, не те що на відяхах
Но графический конвейер не изменился, с чего бы FP16 стал бы более значимым сейчас? Какие события произошли за это время в рендере игр? В процессоры внедрили FP16 отнюдь не для рендера, а для нейросетей. Даже ленивый поиск в гугле приводит к выводу, что FP16 и более мелкие форматы нужны в рамках работ по теме
глубокого обучения. Просто потому что другие задачи, как правило снисходительно улыбаются, когда им предлагают даже FP32, им FP64 подавай.
ronemun: ↑
05.11.2022 22:42В Apple прямо заявили що fp16 в більшості хватає для ігор, в них в драйверах і графіці якась інтелектуальна система яка на ходу визначає якої точності достатньо щоб не було замітно артефактів графіки. Адже невелика відмінність кольорів незамітна для людини, тим більше в русі.
А где она это заявила?
На первый взгляд, FP16 нужен больше для той интеллектуальной системы, чем для рендера для GPU. Хотя, для пиксельных шейдеров наверное FP16 был бы достаточен для многих случаев, но не всех. Цвет пикселя обычно это 8 бит, в HDR - 10 бит и вроде бы 12 бит где-то есть (наверное), для последних точности FP16 уже не хватает, у FP16
мантисса всего 11 бит, то есть для HDR рендера у FP16 перспектив нет никаких, совсем, ведь для промежуточных вычислений нужно иметь точность выше, этот запас зависит от сложности арифметики цвета. Я думаю, никто в эти нюансы вдаваться не будет, будут просто юзать привычный FP32, который есть везде и не морочить себе голову.