Новини
Останні статті і огляди
NVIDIA повернулася до роботи над лінійкою відеокарт GeForce RTX 50 Super
-
yungmanpro
Member
Сподіваюся суперів не буде, бо вже хочу свою 5060Ті 16Гб на 6070 міняти. 5070 не взяв з огляду на 12 гіг, чекав супер версію 18Гб на початок року цього, а тепер ні, вибачте, давайте наступне покоління наступного року. (для тих, хто надумає писати, чому ж тоді не брав 5070Ті, відразу скажу - мій корпус не вмістить такого велетня)
-
leif
Member
для великих MoE так, може бути справді перспективно, в такому варіанті як ви описалиlw_007: ↑ 05.06.2026 16:52PS про 50 t/s це я мав на увазі MoE
-
Sanьka
Member
5070 Супер 18ГБ цікаво....... 
-
vmsolver
Member
Они меньше весов активируют на один токен, поэтому они гибче и поэтому быстрее, разница в 5-7 раз, но качество хуже и надо знать что когда использовать (хинт - Клода использовать))lw_007: ↑ 05.06.2026 16:52 Хіба MoE не стільки ж пам'яті хавають? Тільки швидші.
-
byaka
Member
rtx5070 супер та rtx6070 краще не чекати поки не пройде криза пам'яті
-
lw_007
Member
Так я ж про об'єм пам'яті.vmsolver: ↑ 05.06.2026 17:39Они меньше весов активируют на один токен, поэтому они гибче и поэтому быстрее, разница в 5-7 раз, но качество хуже и надо знать что когда использовать (хинт - Клода использовать))lw_007: ↑ 05.06.2026 16:52 Хіба MoE не стільки ж пам'яті хавають? Тільки швидші.
З швидкодією то й так ясно)
Доречі, щодо якості. Прям помітно втрачають?
Ну а що коли використовувати то й так знати треба. Як і вміти запити писати)
Відправлено через 1 хвилину 40 секунд:
Оце ви оптимстиbyaka: ↑ 05.06.2026 17:45 поки не пройде криза пам'яті
Криза і не пройде ніколи, це нові реалії (
-
Sanьka
Member
Нічого, завжди є 9070хтbyaka: ↑ 05.06.2026 17:45rtx5070 супер та rtx6070 краще не чекати поки не пройде криза пам'яті
-
byaka
Member
Вона теж зросла в цiнiSanьka: ↑ 05.06.2026 17:49Нічого, завжди є 9070хтbyaka: ↑ 05.06.2026 17:45rtx5070 супер та rtx6070 краще не чекати поки не пройде криза пам'яті
-
CnC_General
Member
- Звідки: Kyiv
яка криза? ви про що?
ви про поточне зростання цін на комплектуючі? так це було заплановано. а щодо того хто почав, так це привід.
потім трошки спутсять рівень цін. ми видохнемо. спустимо пар. а потім знову те саме - рівень інфляції/рівень цін на паливо/ криза робочих рук/повстання роботів/ нехватка кремнію/ охолодження води.... вибирайте що хочете. головне знову підняти ціни. та прибутки для акціонерів.
ви про поточне зростання цін на комплектуючі? так це було заплановано. а щодо того хто почав, так це привід.
потім трошки спутсять рівень цін. ми видохнемо. спустимо пар. а потім знову те саме - рівень інфляції/рівень цін на паливо/ криза робочих рук/повстання роботів/ нехватка кремнію/ охолодження води.... вибирайте що хочете. головне знову підняти ціни. та прибутки для акціонерів.
-
byaka
Member
Sanьka,я тут завис в новi грi
-
Nikolay Yeryomenko
Member
byaka
А то у Nvidia було все чітко? Чи ти до цього новини не читав, а ходиш на якийсь кацапський сайт?
А то у Nvidia було все чітко? Чи ти до цього новини не читав, а ходиш на якийсь кацапський сайт?
-
byaka
Member
В нвiдiя хотфiкси зазвичай випускають якi тут так не подобаються людям та якi дуже б зайшли гравцям форза на картах амдNikolay Yeryomenko: ↑ 05.06.2026 19:10 byaka
А то у Nvidia було все чітко? Чи ти до цього новини не читав, а ходиш на якийсь кацапський сайт?
Сайт не кацапський, просто не перемкнув мову
-
vmsolver
Member
MoE позволяют частичную загрузку во VRAM, а чего не хватает подгружать по PCIe в реальном времени, тут одна PCIe 5.0 уже даст грубо 64/3GB активного слоя = ~20 т/с, если учесть что часть нейронки сидит во VRAM, то и получаются 65-80 т/с в зависимости от загрузки контекстного окна. Плотные модели такого не позволяют, они сами большие, а контекст в обоих случаях должен быть во VRAM. Так что объем важен, но и архитектура сети не менее важна.
-
lw_007
Member
О, дякую, цього нюансу не знав.vmsolver: ↑ 05.06.2026 19:38MoE позволяют частичную загрузку во VRAM, а чего не хватает подгружать по PCIe в реальном времени, тут одна PCIe 5.0 уже даст грубо 64/3GB активного слоя = ~20 т/с, если учесть что часть нейронки сидит во VRAM, то и получаются 65-80 т/с в зависимости от загрузки контекстного окна. Плотные модели такого не позволяют, они сами большие, а контекст в обоих случаях должен быть во VRAM. Так что объем важен, но и архитектура сети не менее важна.
тобто з умовною 70-80B маючи карту на 16-24 ще нічого толком не зліпиш(бо контекст нормально так забере), а з 27B-31B вже можна?
Ps. хоча поки все ж не розумію як там з управлінням пам'ятью. Але дякую, буде час - погуглю)