Дуже сумніваюсь про швидкодію, єдине що там краще за ігрові карти - більший розмір моделі та контексту який можна завантажити. А так в кращому випадку буде на рівні 9060ХТ. Ганяти 100б + моделі память все одно буде повільніша ніж на умовний 3090 і швидкодія буде у рази нижча.SergiusTheBest: ↑ 21.05.2026 10:51По швидкодії в LLM краще за Apple та ігрові відеокарти.
Новости
Последние статьи и обзоры
AMD оцінила міні-ПК Ryzen AI Halo з процесором Ryzen AI Max+ 395 та 128 ГБ ОЗП у $3999
-
Fulkrum
Member
- Откуда: Днепр
-
SergiusTheBest
Member
- Откуда: Київ
Теж так думав, але:Fulkrum: ↑ 21.05.2026 13:05 Дуже сумніваюсь про швидкодію, єдине що там краще за ігрові карти - більший розмір моделі та контексту який можна завантажити. А так в кращому випадку буде на рівні 9060ХТ. Ганяти 100б + моделі память все одно буде повільніша ніж на умовний 3090 і швидкодія буде у рази нижча.
Код: Выделить всё
120B models:
Hardware Price (USD) tok/s
RTX 5090 2500–3500 5–15
RTX 4090 1500–2500 3–12
RX 7900 XTX 800–1200 3–10
Mac M4 Pro 1600–2500 5–15
Ryzen AI Max+ 395 1800–3000 5–18
70B models:
Hardware Price (USD) tok/s
RTX 5090 2500–3500 10–25
RTX 4090 1500–2500 8–20
RX 7900 XTX 800–1200 6–18
Mac M4 Pro 1600–2500 10–25
Ryzen AI Max+ 395 1800–3000 10–25
-
Denvys5
Member
- Откуда: Kyiv
SergiusTheBest
70B models
120B models
RTX 5090
Моделі які ну ніяк не лізуть в ту 5090 порівнюєм з системами де вони лізуть повністю в локальну пам'ять
Порівняти з 7-14B моделями ту ж 4090/5090, результат буде драматично відрізнятись
70B models
120B models
RTX 5090
Моделі які ну ніяк не лізуть в ту 5090 порівнюєм з системами де вони лізуть повністю в локальну пам'ять
Порівняти з 7-14B моделями ту ж 4090/5090, результат буде драматично відрізнятись
-
SergiusTheBest
Member
- Откуда: Київ
Звісно. Але чим більша модель, тим вона розумніша.Denvys5: ↑ 21.05.2026 13:40 Моделі які ну ніяк не лізуть в ту 5090 порівнюєм з системами де вони лізуть повністю в локальну пам'ять
Порівняти з 7-14B моделями ту ж 4090/5090, результат буде драматично відрізнятись
-
Fulkrum
Member
- Откуда: Днепр
Так в тому і фішка що ти можеш за ціну цієї коробки мати 3-4 3090 з сумарно 72-96 гб супер швидкої рами і чіпами у рази швидшими.SergiusTheBest: ↑ 21.05.2026 13:29Теж так думав, але:
Для домашнього використання світспот це 27-30б моделі, для них однієї карти високого рівня достатньо і вона буде видавати 50+ токенів.
-
lw_007
Member
1. У мене є конкретні задачі. Пк має бути достатньо продуктивним, але при цьому маленьким.Fulkrum: ↑ 21.05.2026 01:23Дуже вузька ринкова ніша - Аі miniПК. Так то варіків непоганих повно як просто для дому взяти. Навіть Asrock Deskmini та Deskmeet. А саме для штучного інтелекту нашо робити комп маленьким? Тоді вже простіше його у хмарі крутити.lw_007: ↑ 20.05.2026 19:20Але от мені цкаво що б ви могли мені зібрати в корпусі обємом до 10л, наприклад, із TDP 120w
От бюджетний варік біля 5-6к баксів з чотирма 3090 можна зібрати https://youtu.be/WRi0jApo9NM?is=jSuXft_7dAsPQymU
2. Про нейронки я нічого не казав. Хоча для серйозної роботи з ними подібні пк підійдуть тільки за наявності thunderbolt/occulink із дискреткою
3. 3090 далеко не найкращий вибір для нейронок, так не працює. Той самий "AI" міні пк потягне те що 3090 навіть не снилося. Не можна просто так взяти і розрізати модель на куски і покласти в різні відеокарти.
-
Denvys5
Member
- Откуда: Kyiv
ЗвісноSergiusTheBest: ↑ 21.05.2026 13:46Звісно. Але чим більша модель, тим вона розумніша.
І під це збирається сетап з відповідним обє'мом пам'яті (агрегованої), бо інакше порівняння перформансу безтолкове
Для 70Б моделі 4х 3090 або 1хRTX 6000 Pro будуть набагато веселіше за той макміні чи стрікс хало
^Fulkrum: ↑ 21.05.2026 14:22за ціну цієї коробки мати 3-4 3090 з сумарно 72-96 гб супер швидкої рами і чіпами у рази швидшими.
Як альтернативний спосіб порівняння, можна взяти MoE моделі. Gemma 4 MoE в мене на 9070ХТ видає ~35 т/с, і це типу 26B модель (4B експерти), чи може strix halo чи макміні видавати схожий рівень перформансу? Аналогічно буде 4090/5090 і більші MoE моделі, на кшталт того ж DeepSeek R1
-
Fulkrum
Member
- Откуда: Днепр
Asrock Deskmini (4L), Deskmeet (8L) - один для проца з вбудованою графікою, інший з дискреткою. Ціна питання 200-300 євро плюс проц (300-500 євро), память (1200 євро), СіСіДі (500 євро). Ітого 2200-2500.lw_007: ↑ 21.05.2026 14:241. У мене є конкретні задачі. Пк має бути достатньо продуктивним, але при цьому маленьким
Емм, шо? А нашо тандерболт?lw_007: ↑ 21.05.2026 14:24подібні пк підійдуть тільки за наявності thunderbolt/occulink із дискреткою
Саме так і працює. Відос же я скидував на попередній сторінці, там хлопак збирає системи під локальний Аі.lw_007: ↑ 21.05.2026 14:24так не працює
-
lw_007
Member
- спойлер
- Fulkrum: ↑ 21.05.2026 16:18
Asrock Deskmini (4L), Deskmeet (8L) - один для проца з вбудованою графікою, інший з дискреткою. Ціна питання 200-300 євро плюс проц (300-500 євро), память (1200 євро), СіСіДі (500 євро). Ітого 2200-2500.lw_007: ↑ 21.05.2026 14:241. У мене є конкретні задачі. Пк має бути достатньо продуктивним, але при цьому маленьким
Емм, шо? А нашо тандерболт?lw_007: ↑ 21.05.2026 14:24подібні пк підійдуть тільки за наявності thunderbolt/occulink із дискреткою
Саме так і працює. Відос же я скидував на попередній сторінці, там хлопак збирає системи під локальний Аі.lw_007: ↑ 21.05.2026 14:24так не працює
Тим паче всі можливості є)
А коментив я тому що у нас тут "експерти" які безапеляційно все знають, вони сказали що неттопи нікому не потрібні, значить так і є
Тандерболт і оккулінк дають можливість юзати eGPU.
Хоча особисто мені цікавіші варіанти типу зібрати щось на microATX/miniITX.
Все ж PCI-e це дуже приємно і дає багато можливостей)
Правда живлення без громоздких БП це окрема тема, 150W ізі, а от для 600 треба вже попаритися.
Але сценарії в мене специфічні, готуюсь збирати невеличку СЕС і АКБ для будиночку, відповідно у мене розрахунок не на 230В AC а на 48В DC.
По темі нарізки моделей.
не знаю, мб вже щось і змінилося, та поки крутив (пару років тому) то з дифузорами так не виходило. Нема там тензорного паралелізму.
Ну і LLM я не навчаю, у мене свої задачі та інтереси, і там десятки гігів памяті треба не для навчання а для генерації (та й то якщо справа піде і воно мені треба буде)
Так що комусь ферми з 3090, хай навчають і радіють перебоям електропостачання.
А мені цікаві компактність продуктивність та енергоефективність в одному флаконі і нейронки для мене не критичні)
-
Fulkrum
Member
- Откуда: Днепр
Так ми про інференцію і говоримо. Різні слої (леєрс) завантажуються на різні відухи от і весь паралелізм. Додасться трохи лагу при обробці але не критично, у рази швидше ніж вивантажувати зайве у системну память.lw_007: ↑ 21.05.2026 17:23 не для навчання а для генерації
Для домашніх задач, виклику тулз, 7-9б моделі з головою. Квен 3.6 9б за хвилину може ігри простенькі писати у html на сучасному процессорі без відухи.
-
lw_007
Member
Кхм, ок, ще раз, мб я щось сильно пропустив за півтора року.Fulkrum: ↑ 21.05.2026 18:07Так ми про інференцію і говоримо. Різні слої (леєрс) завантажуються на різні відухи от і весь паралелізм. Додасться трохи лагу при обробці але не критично, у рази швидше ніж вивантажувати зайве у системну память.lw_007: ↑ 21.05.2026 17:23 не для навчання а для генерації
Для домашніх задач, виклику тулз, 7-9б моделі з головою. Квен 3.6 9б за хвилину може ігри простенькі писати у html на сучасному процессорі без відухи.
от є Flux 1.D (fp16) разом з LoRA, ControlNet ітд не завжди в 30Gb вміщається.
Що там може бути з умовним Flux 1.Kontext навіть пробувати не хотілося.
А зараз, коли вийшов Flux 2 то там взагалі вимоги не для простих смертних.
Так як мені їх розкидати на декілька GPU, щоб воно не утикалось в спільну память яку дає оперативка?
Ps. і це мова навіть не про генерацію відео)
Psps. Ок, погуглив, можна перекинути VAE на іншу карту і виграти 4-5 Гб.
проте для важких задач цього недостатньо
-
Buldozer.
Member
- Откуда: Харьков
капец. странные барыги какие-то. Заработать хотятagsamfisher: ↑ 20.05.2026 18:04 Тобто у нас якщо і можна буде купити - то від 6000$, наші "бариги" не втратять такої можливості щоб заробити!
п.с. так и выжу очередь из барыг, которые это по 180 тыс покупают на перепродажу
-
Fulkrum
Member
- Откуда: Днепр
Тут весь чат був про текстову генерацію. Девайс у новині занадто дохлий для комфортного фото/відео. 3090 одна буде швидша у рази і дешевша теж.lw_007: ↑ 21.05.2026 19:05Ps. і це мова навіть не про генерацію відео)
-
freezers
Junior
По швидкодії LLM - гірше ніж ігрові відеокарти. Тут 250GB/s пропускна здатність відеопам'ятіSergiusTheBest: ↑ 21.05.2026 10:51Щоб була власна AI хмара в маленькій коробочці. По швидкодії в LLM краще за Apple та ігрові відеокарти.Fulkrum: ↑ 21.05.2026 01:23 Дуже вузька ринкова ніша - Аі miniПК. Так то варіків непоганих повно як просто для дому взяти. Навіть Asrock Deskmini та Deskmeet. А саме для штучного інтелекту нашо робити комп маленьким? Тоді вже простіше його у хмарі крутити.
Отправлено спустя 5 минут 25 секунд:
А, вже сказали)
-
SergiusTheBest
Member
- Откуда: Київ
Ігрові мають мало пам'яті, тому сильно просідають на великих моделях.freezers: ↑ 22.05.2026 11:23 По швидкодії LLM - гірше ніж ігрові відеокарти. Тут 250GB/s пропускна здатність відеопам'яті