Nvidia раскрыла архитектурные особенности 8-нм видеоядер Ampere

Обсуждение статей и новостей сайта
Автор
Повідомлення
erazel
Member
Аватар користувача
Звідки: Тернопіль

Повідомлення

ostman: ампер в цьому плані схожий на максвел, тоді теж перейшли на чисту графіку з перевантаженого кеплера. но, можливо, це все мої фантазії :gigi:
Стоп, то ж вроді Кеплер був "заточеним суто під ігри" після перевантаженого Фермі :rolleyes:
Мав 670 і SLI p 2*570. Одиночний 670 в 3Дмарку(тобто синтетичному тесті де СЛІ мав би давати майже 2-х кратний приріст) обходив СЛІ з попереднього покоління. Тоді в іграх кеплер рванув вперед суттєво.
А от нажалаь порівняти в задачах рендерингу відео чи шумоподавлення в відеоредакторі якось руки не дійшли, про що тепер шкодую. Цікаво було порівняти наскільки саме порізали Кеплер у неігрових завданнях.
Megaclite
Member
Аватар користувача

Повідомлення

Сделал отличия в более наглядной форме
спойлер
Зображення
В результате этого каждый массив способен обрабатывать либо 32 операции FP32, либо одновременно 16 FP32 и 16 INT32
Вот по этому прирост в играх не такой огромный, как прирост самих FP32
А где параллелизм? или это у них такой задел на поправку в следующей архитектуре, там все блоки одновременно молотить смогут
WWQ
Member
Аватар користувача

Повідомлення

ronemun:Найцікавіше, що в ga104, тобто в 3070, 20Тфлопс при 17млрд трн., а в 2080ti в 1,5 ради меньше при 19 млрд- невже відразу не здогадились робити як у 3070
думаю догадались, думаю еще в 2010, прогресс надо выдавать порционно, иначе бабла в догосрочной перспективе не поднять...
ronemun
Advanced Member

Повідомлення

за словами самої Нвідії int обчислення займають до 30 %, не більше. Звичайно, ці блоки дуже прості і їх було мудро виділити окремо - +30 % продуктивності майже безплатно. Але, як видно, 20й серії це не сильно допомогло. Головне, все таки, FP обчислення.
3070 не може на всі 100 використати свій потенціал в іграх, на відміну від 2080 Ті, через int блоки в останньої, і меншу швидкість памяті і її кількість. Ну і драйвера ще не ідельні
Бедный студент
Member
Аватар користувача
Звідки: Кропивницький

Повідомлення

FP64 розпиляли ще заради ціни. Не вийде швидко якісно і надійно. От і пішло під ніж те, без чого можна жити. Оце правильне рішення, і як результат чудова продуктивність за таки вміняєму ціну.
Pil Ferer
Member

Повідомлення

ronemun:В Нвідіі все таки геніальні інженери- в них ріст кількості ядер фактично лінійно збільшує швидкість в іграх, в АМД завжди ефективність на порядок нижча була до Nextgena
"На порядок" означает в 10 раз. Зачем бы так преувеличивать?
ronemun
Advanced Member

Повідомлення

Pil Ferer
в цифровій техніці, за замовчуванням, означає в 2 рази. В відеокартах порядок приблизно у 1,5-2 рази - 1030-1050-1060-1080
хоча, якщо згадати Radeon 2xxx-5xxx, з їх 320 ядер, які були слабші за 64 ядра Нвідії (Geforce 9600)
Rаdeon 7950 1800*2*1ГГц=3,6 Tflops, а в іграх в 2 рази слабше з Geforce 1060 такої ж обчислювальної потужності, швидкості памяті і т.п. Навіть RX570-580 з їх 5-6 Tflops в іграх на рівні Geforce 1060, і це при більших швидкості і обємі памяті
waryag
Member
Аватар користувача
Звідки: Суми

Повідомлення

ronemun:в цифровій техніці, за замовчуванням, означає в 2 рази
Нет. :-/ Цифровая техника использует ту же математику, что и остальной мир. Так что порядок остается порядком, 2 раза - 2 разами.

Единственная особенность - единицы памяти, но и там разница обусловнена округлением при переходе от двоичной системы к десятичной, а не особой компьютерной магией.
Відповісти