Архитектура Turing и особенности новых видеокарт GeForce RTX

Обсуждение статей и новостей сайта
Автор
Повідомлення
Maxhope
Member
Аватар користувача

Повідомлення

Aves
ну для 1440р абсолютный минимум это 1070, если хочешь 60фпс везде , то 1080ти
Aves
Junior
Аватар користувача
Звідки: Одесса

Повідомлення

Maxhope
Понял!
evgeniyproweb
Member
Аватар користувача
Звідки: Zaporizhzhya

Повідомлення

Aves
о каком монике хоть речь ?)
Aves
Junior
Аватар користувача
Звідки: Одесса

Повідомлення

evgeniyproweb
Бюджетный самсунг (LC27H711QEIXCI)
Savage3D
Junior

Повідомлення

Scoffer:wolfsanek
Фігня це все. Якщо прибрати маркетингові назви, то тензорні ядра вміють робити рівно одну операцію: D = A x B + C для матриць 4х4 низької точності.
Тобто 1 в 1 FMA4 з проца але для матриць. Я б не сказав, що для FMA знайши достатньо багато застосувань щоб хоч якось відчути наявність або відсутність даної команди в процесорі.
Зовсім не фігня. Вся логіка рендеру основана на 4-значних векторах і 4х4-матрицях: поворот, зміщення, скейлінг, розрахунок нормалей, перенос між різними системами координат і т.д. Врахуй тепер, що ці всі операції виконуються для кожної вершини 3D-обєктів на сцені, 60 раз за секунду. Тому вся архітектура сучасних відеокарт фактично побудована навколо обчислень задач лінійної алгебри. До речі обрахунок іде на рівні шейдерів (програм для GPU), CPU буде справлятися з цим самим набором задач в десятки разів повільніше. Відповідно і порівнювати інструкції для CPU з архітектурою GPU не зовсім коректно.
evgeniyproweb
Member
Аватар користувача
Звідки: Zaporizhzhya

Повідомлення

Aves, если брать 2560 x 1440, то лучше уже не VA а IPS матрицу, по такой же цене можно взять, но тут стоит вопрос тогда с видеокартой, все как и сказал выше Maxhope, теоретически можно подождать 2060, но не факт что она будет дешевле чем 1070ti(за 13к можно взять palit js), с одной стороны там не будет RT и ценник должен быть гуманней, главное реши для себя готов ли помимо моника за 11-12к выложить еще за ВК от 12-15к, если нет, тогда карта 1060 6гб + фулл хд моник = около 15-16к в сумме
Aves
Junior
Аватар користувача
Звідки: Одесса

Повідомлення

evgeniyproweb
Дело в том что мне не сильно нравиться ва матрица,но как вы говорите присмотрюсь к ипсу именно с этим разрешением,хотелось бы 4к но не сейчас,дорого сильно.
У меня сейчас плс матрица 27 дюймов 1920х1080,1060 6г. ок. 8600 без к. и очень доволен,(как не слишком требовательный геймер),но хочу немного проапгрейдить,до такого уровня,но с разрешением 2к. И понял что нужно дождаться 2060,и там уже смотреть,расстаться, пока не готов одновременно брать и то и другое,по очереди! :)
Благодарю за советы.
Scoffer
Member
Аватар користувача

Повідомлення

Savage3D
Вся логіка рендеру в рази складніша описаного, інакше cuda-ядра, так само як і gcn-ядра, на котрих це все обчислюється, не були б відносно жирними risc-ядрами, в той час як можна обійтись примітивними тензорними.
Наклепати 100500 ядер під одну примітивну дію ніколи не було проблемою, то чому раніше не клепали?

А тому, що воно не треба нам, воно треба гуглу для розпізнавання картинок, для чого вони зробили свої власні тензорні проци з матрицями 256х256, і треба нвідії для автопілотів, котрі все одно не дуже пілотують :rotate: Але заплатиш за це ти, бо маркетологи тебе вже переконали, що без тензорних ядер життя немає, а те, що якщо вкинути транзисторний бюджет з них в cuda-ядра, то в усіх твоїх завданнях було б швидше - це незначні подробиці :laugh:
Savage3D
Junior

Повідомлення

Scoffer:Savage3D
Вся логіка рендеру в рази складніша описаного, інакше cuda-ядра, так само як і gcn-ядра, на котрих це все обчислюється, не були б відносно жирними risc-ядрами, в той час як можна обійтись примітивними тензорними.
Наклепати 100500 ядер під одну примітивну дію ніколи не було проблемою, то чому раніше не клепали?
Звичайно, графічний пайплайн набагато складніший, але в основі все одно лежить робота з векторами/матрицями. Можеш відкрити будь-яку книгу по OpenGL чи DirectX, і перший розділ буде завжди "лінійна алгебра".

А хто тобі сказав, що раніше не клепали? Взагалі-то у відеокарті і зараз оці всі CUDA-ядра - це набір однотипних архітектурних рішень, які паралельно виконують векторні/матричні обчислення. Просто в стандартному GPU вони більш універсальні, щоб справлятися з різними типами шейдерів і перетвореннями різних типів. В той час, як тензорні ядра будуть більш спеціалізовані: робота з матрицями + величинами типу float16.

Отправлено спустя 12 минут 53 секунды:
Scoffer: Але заплатиш за це ти, бо маркетологи тебе вже переконали, що без тензорних ядер життя немає
Маркетинг чи ні, побачимо по факту виходу нових ігор.

Для прикладу розглянемо ситуацію. Я пишу вертексний шейдер і на вхід йому кидаю масив з координат вершин, які, як правило, мають тип float32. Але, знаючи, що є технології, які пришвидшують обрахунок операцій з float16, я можу вибрати дані, які поміщаються у float16, і кинути їх на обрахунок цим тензорним ядрам. Якщо це дійсно дасть профіт у швидкодії, то чому б ним не скористатися? Так що я не був би так скептично налаштований, не бачучи реальної можливості тензорних ядер в дії.
Scoffer
Member
Аватар користувача

Повідомлення

Savage3D
От краще відкрий будь-яку презенташку з сучасних графічних архітектур, наприклад цю, прямо з сайту nvidia:
https://www.nvidia.com/content/PDF/ferm ... epaper.pdf
І почитай на 8й сторінці що таке ядро cuda, і що воно може. А воно не може ні в вектори, ні тим більше в матриці. Воно може в звичану цілочисельну і FP по стандарту IEEE 754 арифметику. Воно не може в вектори і матриці бо інакше було б тупо. Ядра cuda, і так сформовані в паралельні масиви. Якщо кожне з них ще й навчити працювати з матрицями, то сумарна обчислювана модулем SM матриця вийде тривимірною, а враховуючи, що SM модуль в відеокарты не один, то чотиривимірною (з натяжкою, там є моменти), а це не потрібно в реальних графічних завданнях.
Набори тензорних ядер якраз таку тривимірну(? або чотиривимірну, не знайшов інфи) матрицю на один модуль і формують. В додачу до цього, вони спроможні виконати одну і тільки одну операцію множення-складання, на відміну від нормального ядра. Ніяких інших операцій ні над якими іншими структурами воно не опрацьовує. Це дуже сильно обмежує список завдань де цю обчислювальну потужність можна використати.
Savage3D
Junior

Повідомлення

Scoffer: А воно не може ні в вектори, ні тим більше в матриці. Воно може в звичану цілочисельну і FP по стандарту IEEE 754 арифметику.
Ти просто не розумієш як працювати з векторами / матрицями і для чого вони використовуються в рендері. Вектор, матриця - це не абстрактне поняття. Це просто набір чисел, згрупованих певним образом. Операції над векторами/матрицями виконуються поелементно, іншими словами, над float'ами. А в них можуть всі відеокарти без виключення.

Інше навіть коментувати не хочеться, бо таке враження, що ти не дуже уявляєш, що відбувається на рівні рендера. Зрозумій, що, наприклад, просте переміщення обєкту на екрані - це множення матриці переміщення (4х4) на положення кожної вершини, яка задається у вигляді 4-елементного набору ("вектора"). Аналогічно з поворотом, масштабуванням, перенесенням у координатний простір камери і т.д.

P.S. Маю відношення до написання низькорівневого рендеру і шейдерів на C/C++ і OpenGL, і трохи шурупаю в тому, що пишу. Тому пропоную, не розвивати далі цю тему.

P.P.S. Так, невеличка стаття для ознайомлення, що "роблять" матриці у світі GPU: http://www.opengl-tutorial.org/ru/begin ... -matrices/
Scoffer
Member
Аватар користувача

Повідомлення

Savage3D
Я в курсі що таке вектори і матриці, не хвилюйся. Давай ти напишеш щоч щось корисне на тензорних ядрах, а потім побалакаємо. А то 30 років воно нікому не всралось, а тут різко потрібно стало :laugh:

Отправлено спустя 7 минут 45 секунд:
Ти так і не зрозумів, що матриця не 4х4, а 4х4х?х? (не зрозуміло поки в числах на скільки), чотиривимірна, бо тобі не буде доступне одне ядро для того щоб йому накидати даних, буде доступний якийсь масив ядер. А тепер прикрути до чотиривимірної матриці вищезгадані обчислення.
Savage3D
Junior

Повідомлення

Scoffer: Отправлено спустя 7 минут 45 секунд:
Ти так і не зрозумів, що матриця не 4х4, а 4х4х?х? (не зрозуміло поки в числах на скільки), чотиривимірна, бо тобі не буде доступне одне ядро для того щоб йому накидати даних, буде доступний якийсь масив ядер. А тепер прикрути до чотиривимірної матриці вищезгадані обчислення.
Я тобі ще раз пишу, що ти зеленого поняття не маєш для чого в рендері використовуються матриці і як відбувається обчислення над ними. Просто сходи по тому лінку, що я тобі скинув. Можеш погуглити аналог по DirectX, Vulkan, Metal. Або ж просто наведи посилання чи формули, які описують розрахунок, скажімо, положення вершини через матриці 3-го чи 4-го порядку.
Scoffer:Savage3D
А то 30 років воно нікому не всралось, а тут різко потрібно стало :laugh:

З таким підходом ми би всі й досі сиділи на софтварному рендері і гунділи: "30 років ті відеоакселератори нікому не всралися, а тут різко потрібно стало :rotate: "
Scoffer
Member
Аватар користувача

Повідомлення

Savage3D
Підхід нормальний. Тензорні ядра - найпростіше, що тільки вигадати можна з масово-паралельних обчисленях. Найпростіше ж і в реалізації в залізі. Їх клепають всі кому не лінь, під свої конкретні завдання на 146% пов'язані з машиним навчанням, навіть ті хто чіпи ніколи не робив і більше не буде, типу гугла.
Якщо їх досі не було в відяхах, то вони не потрібні. Їх можна було наклепати ще в часи RIVA TNT, ніяких технологічних проблем. Це не якісь там космічні технології.
В нинішніх відяхах вони виключно тому, що Хуангу, на фоні відсутності конкуренції, стало лінь вигадувати окрему ігрову відеокарту, а на теслах він якраз і збирає свої AI/DL-рішення, включно з автомобільними, на котрі зараз велика ставка йде.
UV
Member

Повідомлення

Maxhope:
Aves: То есть существенно будет отклонение по производительности от 1920х1080?
в 1440р на 80% больше пикселей, соответственно и падение производительности будет где то на этом уровне.
Как-то жёстко :-) не так всё печально на самом деле, разница с фулл-хд процентов 30%, а то что вы описали скорее подходит картам типа 1030 или 550
catdoom
Member
Аватар користувача

Повідомлення

Content Adaptive Shading — уменьшает скорость шейдинга для зон со слабо изменяющимся цветом;
Motion Adaptive Shading — вариативное качество для движущихся объектов;
Foveated Rendering — снижение качества для областей вне зоны фокусировки.

Подобными фишками нас кормят со времён Водоо5,а в реальности разработчики игр этим не когда не заморачивались.

"Якщо їх досі не було в відяхах, то вони не потрібні"Просто Нвидиа нашла для них применение,будут замыливать определённые не значительные области изображения,кароче ИИ мыло лопатами. :gigi: Эти фишки НВ заработают в играх не скоро,для 5% видеокарт их пришют в 1-2 играх,а уже через года три может быть получат распространение,хотя сомнительно. Не переживайте,хуангу не в первой выкидывать фишки на свалку. Я конечно же не против всех этих новшеств которые могут повысить фпс,но парадоксально, что эти фишки совсем не нужны для разработчиков игр,так как тратить трудо-часы что бы вы получили на 5-10фпс больше,не кто не станет.
washburn_t15
Member
Аватар користувача

Повідомлення

Напиши плохо про Нв - получи плюсики, напиши правду про амд - получи минус. Традиции оц.юа, чё уж тут.
По сабжу - карта открывает дверь в новую эру, вполне возможно, что в последствии картинка станет гораздо лучше из-за рейтрейсинга и диплёрнинг фишек, которые смогут разгрузить ГПУ и рисовать эффекты, основываясь на характеристиках и расположении объекта, что приблизит тот заветный фотореализм, которого мы ждём с начала нулевых.
Dr_Zorge
Member

Повідомлення

washburn_t15: По сабжу - карта открывает дверь в новую эру
В новую эру откроет дверь то, что поставят в приставки, как самые массовые игровые устройства. И пока там не появится рейтрейсинг все эти лучи на rtx будут лишь как пришитая белыми нитками фишка, типа волос в ведьмаке.
А пока, в каком-нибудь God of War я видел такое освещение и такой рыхлый снег, который моя 1070 мне ни разу не показывала. Так что все в руках игроделов.
Aves
Junior
Аватар користувача
Звідки: Одесса

Повідомлення

Не знаю кто и как,но я лично увидел разницу между моей старой видеокартой 770 и новой 1060,первое что бросилось в глаза так это сочность и насыщенность цветовой гаммы,очень приятно удивило.То что производительность это естественно,как бы 770 не плохо справлялась тоже,но постоянно надоедала нехватка памяти в 2 ГБ.
washburn_t15
Member
Аватар користувача

Повідомлення

Dr_Zorge:В новую эру откроет дверь то, что поставят в приставки
Никогда такого не было. Консоли дают среднюю производительность, ничего принципиально нового в технологиях нет, особенно в последнем поколении. А тот запредельный графон, о котором говорят сонибои - всего лишь результат кропотливой работы, по сырой производительности консоли слабее среднестатистического игрового ПК.
Відповісти