Серед кроків "оптимізації" - Halving GPU Frequency
Новини
Останні статті і огляди
Imec пропонує метод оптимізації 3D-чипів HBM-on-GPU для зниження робочих температур
-
Denvys5
Member
- Звідки: Kyiv
Пропоную обговорити Imec пропонує метод оптимізації 3D-чипів HBM-on-GPU для зниження робочих температур
Серед кроків "оптимізації" - Halving GPU Frequency

Серед кроків "оптимізації" - Halving GPU Frequency
-
Scoffer
Member
Denvys5
Можна ще чіллером оптимізувати
Можна ще чіллером оптимізувати
-
Mozdev
Member
Вони б туди ще елементи Пельтьє запропонували вмонтувати 
-
Yaroslav308
Member
Самі створили проблему, а потім героїчно її вирішували. Давайте похлопаємо.
-
denizen
Member
- Звідки: Київ
Круто, двосторонне охолодження, прям свято якесь
-
yariksom
Member
Я в цьому профан повний, але запитаю чи можна теоретично процесор зробити наприклад в 120 нанометрів розміром з каналізаційний люк і цим вирішити проблему,
чи така ідея дурня?
чи така ідея дурня?
-
denizen
Member
- Звідки: Київ
Ну чого ж, неможна, можнаyariksom: ↑ 09.12.2025 17:14 Я в цьому профан повний, але запитаю чи можна теоретично процесор зробити наприклад в 120 нанометрів розміром з каналізаційний люк і цим вирішити проблему,
чи така ідея дурня?
https://www.cerebras.ai/chip
а нащо це Вам?
-
yariksom
Member
denizen
Просто з цікавості, фактично питання в тому чи можна оптимізувати таким чином затрати на живлення і охолодження, і чи дешевше утримувати таку структуру чим сучасну.
Крім того, потрібні будуть нові (інші) лінії виробництва і здешевлення цін на звичайні комплектуючі
Просто з цікавості, фактично питання в тому чи можна оптимізувати таким чином затрати на живлення і охолодження, і чи дешевше утримувати таку структуру чим сучасну.
Крім того, потрібні будуть нові (інші) лінії виробництва і здешевлення цін на звичайні комплектуючі
-
mrigi
Member
Можна добитися ще кращіх результатів не вмикаючи GPU
-
VRoman
Member
- Звідки: Albuquerque, NM, USA
Зачем добиваться высокого уровня производительности на единицу площади? В чём может заключаться преимущество? Всё равно кристаллы GPU и памяти производятся раздельно и в сумме площадь самих кристаллов не меняется, тем самым не снижая себестоимости производства. Но уж если так сильно хочется, то почему не последовать примеру АМД устанавливая горячий чип GPU поверх холодной памяти? Зачем делать одеяло для GPU из чипов HBM, а потом мучаться с его охлаждением?
-
ronemun
Advanced Member
я не розумію - ну рішення ж очевидне!
робоча речовина в теплотрубках відводить тепло до 10 раз ефективніше ніж мідь і в 3-4 рази ніж вода, при цьому коштує копійки
ну візьміть всю конструкцію і заізолюйте в обєм з тою речовиною, а вже ззовні відводьте тепло як хочете. Така собі випарна камера але з прямим контактом до самих гарячих зон зі всіх сторін.
При цьому не потрібно термопасти, рідкого металу, складних радіторів окремо на кожен чіп і загального ще складнішої форми, навіть теплотрубок не тре
Навпаки, тре максимально відкритий доступ
робоча речовина в теплотрубках відводить тепло до 10 раз ефективніше ніж мідь і в 3-4 рази ніж вода, при цьому коштує копійки
ну візьміть всю конструкцію і заізолюйте в обєм з тою речовиною, а вже ззовні відводьте тепло як хочете. Така собі випарна камера але з прямим контактом до самих гарячих зон зі всіх сторін.
При цьому не потрібно термопасти, рідкого металу, складних радіторів окремо на кожен чіп і загального ще складнішої форми, навіть теплотрубок не тре
-
waryag
Member
- Звідки: Суми
Умовний (хай навіть 14нм) суперчип доведеться набирати з купи маленьких (зараз сканер дозволяє не більше 800 кв.мм.), це незручно, дорого і краде продуктивність.yariksom: ↑ 09.12.2025 17:14Я в цьому профан повний, але запитаю чи можна теоретично процесор зробити наприклад в 120 нанометрів розміром з каналізаційний люк і цим вирішити проблему,
чи така ідея дурня?
Та й проблеми немає.
Будь-який гарячий чип можна запустити з меншими робочими частотами і споживанням та суттєво покращити тепловий режим з помірною втратою продуктивності. А якщо перепроєктувати його під більш енергоефективний режим, можна зрізати кути і покращити результат при інших рівних.
Але великі компанії по ряду причин зацікавлені у максимальній продуктивності на систему/стійку датацентру і їх не дуже лякають високі температури і споживання.
-
Scoffer
Member
Воно не нескінченно вниз масштабується.waryag: ↑ 09.12.2025 21:09Будь-який гарячий чип можна запустити з меншими робочими частотами і споживанням
-
ronemun
Advanced Member
yariksom
2D (великі кристали/пластини) i 2.5d це тупик:
- великі кристали мають колосальний брак, він пропорційний площі, очевидно
- величезна купа зєднань в 2D - максимально довгі і густі, при цьому з низьким ККД через потребу постійно передавати тіж дані і багато вузьких місць. Зараз навіть 800мм2 кристали розбивають віртульно на 4-8 частин щоб зменшити перезресний трафік, а у великої пластини це взагалі тупік - шини передачі даних будуть займати 50+% площі, кеш для них ще 20, а на розрахуки нічого не лишиться.
- важко розводити всі ці зєднання і балансувати їх обєм кешу/ширину і частоту шини, розподіл енергії, для максимальної користі
- важко стабільно випускати певну конфігурацію - брак непердбачуваний. ТОму приходиться відключати з великим запасом, як у Нвідії А22 блоків зі 192, або у Інтел в середньому половина ядер на пластинах відключені
А окремі кристали це:
- економія в 2-10 разів на дешевому техпроцесі для на кешів і шин, контролерів памяті/PCIe і їх інтерфейсів.
- проста і дешева відбраковка - кристали малі, їх не шкода
- проста зміна конфігурації, непотрібно новий кристал для кожного набору ядер/памяті/інших блоків
- більше місця на кристалі з дорогим техпроцесом, що збільшує густину важливих блоків/зменшує перекидування даних/зменшує затримку між ними.
- це дешево і швидко - Інтел напаює тисячу кристалів 2 мм2 на 300 пластину за 15хв
3д це зменшення доріжок в 10-100 раз, наприклад в чіпа ddr/HBM сотні тисяч отворів, там шини і швидкість передачі шалені, затримки пару нс, а енергія біта мінімальна. Це дозволяє робити запас шин для швидкого переключення і переконфігування на льоту, наприклад блоки даних в памяті можна переключати на інший чіп/пристрій без необхідності транспортування цих даних до нього і переписування в іншу область памяті. Це значно зменшує затримку між процом і даними і прискорює обробку.
2D (великі кристали/пластини) i 2.5d це тупик:
- великі кристали мають колосальний брак, він пропорційний площі, очевидно
- величезна купа зєднань в 2D - максимально довгі і густі, при цьому з низьким ККД через потребу постійно передавати тіж дані і багато вузьких місць. Зараз навіть 800мм2 кристали розбивають віртульно на 4-8 частин щоб зменшити перезресний трафік, а у великої пластини це взагалі тупік - шини передачі даних будуть займати 50+% площі, кеш для них ще 20, а на розрахуки нічого не лишиться.
- важко розводити всі ці зєднання і балансувати їх обєм кешу/ширину і частоту шини, розподіл енергії, для максимальної користі
- важко стабільно випускати певну конфігурацію - брак непердбачуваний. ТОму приходиться відключати з великим запасом, як у Нвідії А22 блоків зі 192, або у Інтел в середньому половина ядер на пластинах відключені
А окремі кристали це:
- економія в 2-10 разів на дешевому техпроцесі для на кешів і шин, контролерів памяті/PCIe і їх інтерфейсів.
- проста і дешева відбраковка - кристали малі, їх не шкода
- проста зміна конфігурації, непотрібно новий кристал для кожного набору ядер/памяті/інших блоків
- більше місця на кристалі з дорогим техпроцесом, що збільшує густину важливих блоків/зменшує перекидування даних/зменшує затримку між ними.
- це дешево і швидко - Інтел напаює тисячу кристалів 2 мм2 на 300 пластину за 15хв
3д це зменшення доріжок в 10-100 раз, наприклад в чіпа ddr/HBM сотні тисяч отворів, там шини і швидкість передачі шалені, затримки пару нс, а енергія біта мінімальна. Це дозволяє робити запас шин для швидкого переключення і переконфігування на льоту, наприклад блоки даних в памяті можна переключати на інший чіп/пристрій без необхідності транспортування цих даних до нього і переписування в іншу область памяті. Це значно зменшує затримку між процом і даними і прискорює обробку.
-
waryag
Member
- Звідки: Суми
Воно масштабується до рівня, коли охолодження перестає бути суттєвою проблемою.Scoffer: ↑ 09.12.2025 21:18 Воно не нескінченно вниз масштабується.
-
Scoffer
Member
waryag
Ні. Є точка оптимальної продуктивності на ват. Вона вища ніж мінімально можливе споживання. Саме тому мобільні проци скидують частоту до 700-800 мгц, а не, наприклад, до 200. І ця точка зі зниженням техпроцесу росте в гору, як не дивно.
Ні. Є точка оптимальної продуктивності на ват. Вона вища ніж мінімально можливе споживання. Саме тому мобільні проци скидують частоту до 700-800 мгц, а не, наприклад, до 200. І ця точка зі зниженням техпроцесу росте в гору, як не дивно.
-
dext
Member
- Звідки: Dnipro
саме так, і оптимальна частота зазвичай є вищою навіть за мінімальнуScoffer: ↑ 09.12.2025 22:48 waryag
Ні. Є точка оптимальної продуктивності на ват. Вона вища ніж мінімально можливе споживання. Саме тому мобільні проци скидують частоту до 700-800 мгц, а не, наприклад, до 200. І ця точка зі зниженням техпроцесу росте в гору, як не дивно.
-
waryag
Member
- Звідки: Суми
Є, але вона набагато нижче за типову робочу частоту. Що ти хотів сказати?Scoffer: ↑ 09.12.2025 22:48 waryag
Ні. Є точка оптимальної продуктивності на ват. Вона вища ніж мінімально можливе споживання. Саме тому мобільні проци скидують частоту до 700-800 мгц, а не, наприклад, до 200. І ця точка зі зниженням техпроцесу росте в гору, як не дивно.
-
ДядяСаша
Member
- Звідки: Киев
Тю, очевидно треба вмонтовувати в 3D структуру теплопровідні елементи, може це буде окремий кристал, а може метал, а може це буде на рівні транзистора...
Це ж було вже. Була новина на оверах, що в платах в текстоліт вставляють мідні стовпці, які збільшують теплопровідність.
Це ж було вже. Була новина на оверах, що в платах в текстоліт вставляють мідні стовпці, які збільшують теплопровідність.