Nvidia раскрыла архитектурные особенности 8-нм видеоядер Ampere

erazel · Повідомлення 03.09.2020 17:03

ostman: ампер в цьому плані схожий на максвел, тоді теж перейшли на чисту графіку з перевантаженого кеплера. но, можливо, це все мої фантазії

Стоп, то ж вроді Кеплер був "заточеним суто під ігри" після перевантаженого Фермі

Мав 670 і SLI p 2*570. Одиночний 670 в 3Дмарку(тобто синтетичному тесті де СЛІ мав би давати майже 2-х кратний приріст) обходив СЛІ з попереднього покоління. Тоді в іграх кеплер рванув вперед суттєво.
А от нажалаь порівняти в задачах рендерингу відео чи шумоподавлення в відеоредакторі якось руки не дійшли, про що тепер шкодую. Цікаво було порівняти наскільки саме порізали Кеплер у неігрових завданнях.

Megaclite · Повідомлення 03.09.2020 17:16

Сделал отличия в более наглядной форме

спойлер

В результате этого каждый массив способен обрабатывать либо 32 операции FP32, либо одновременно 16 FP32 и 16 INT32

Вот по этому прирост в играх не такой огромный, как прирост самих FP32
А где параллелизм? или это у них такой задел на поправку в следующей архитектуре, там все блоки одновременно молотить смогут

WWQ · Повідомлення 03.09.2020 18:36

ronemun:Найцікавіше, що в ga104, тобто в 3070, 20Тфлопс при 17млрд трн., а в 2080ti в 1,5 ради меньше при 19 млрд- невже відразу не здогадились робити як у 3070

думаю догадались, думаю еще в 2010, прогресс надо выдавать порционно, иначе бабла в догосрочной перспективе не поднять...

ronemun · Повідомлення 03.09.2020 19:06

за словами самої Нвідії int обчислення займають до 30 %, не більше. Звичайно, ці блоки дуже прості і їх було мудро виділити окремо - +30 % продуктивності майже безплатно. Але, як видно, 20й серії це не сильно допомогло. Головне, все таки, FP обчислення.
3070 не може на всі 100 використати свій потенціал в іграх, на відміну від 2080 Ті, через int блоки в останньої, і меншу швидкість памяті і її кількість. Ну і драйвера ще не ідельні

Бедный студент · Повідомлення 03.09.2020 21:05

FP64 розпиляли ще заради ціни. Не вийде швидко якісно і надійно. От і пішло під ніж те, без чого можна жити. Оце правильне рішення, і як результат чудова продуктивність за таки вміняєму ціну.

Pil Ferer · Повідомлення 04.09.2020 07:47

ronemun:В Нвідіі все таки геніальні інженери- в них ріст кількості ядер фактично лінійно збільшує швидкість в іграх, в АМД завжди ефективність на порядок нижча була до Nextgena

"На порядок" означает в 10 раз. Зачем бы так преувеличивать?

ronemun · Повідомлення 04.09.2020 18:41

Pil Ferer
в цифровій техніці, за замовчуванням, означає в 2 рази. В відеокартах порядок приблизно у 1,5-2 рази - 1030-1050-1060-1080
хоча, якщо згадати Radeon 2xxx-5xxx, з їх 320 ядер, які були слабші за 64 ядра Нвідії (Geforce 9600)
Rаdeon 7950 1800*2*1ГГц=3,6 Tflops, а в іграх в 2 рази слабше з Geforce 1060 такої ж обчислювальної потужності, швидкості памяті і т.п. Навіть RX570-580 з їх 5-6 Tflops в іграх на рівні Geforce 1060, і це при більших швидкості і обємі памяті

waryag · Повідомлення 04.09.2020 21:49

ronemun:в цифровій техніці, за замовчуванням, означає в 2 рази

Нет.

Цифровая техника использует ту же математику, что и остальной мир. Так что порядок остается порядком, 2 раза - 2 разами.

Единственная особенность - единицы памяти, но и там разница обусловнена округлением при переходе от двоичной системы к десятичной, а не особой компьютерной магией.