Imec пропонує метод оптимізації 3D-чипів HBM-on-GPU для зниження робочих температур

Denvys5 · Повідомлення 09.12.2025 15:05

Пропоную обговорити Imec пропонує метод оптимізації 3D-чипів HBM-on-GPU для зниження робочих температур

Серед кроків "оптимізації" - Halving GPU Frequency

Scoffer · Повідомлення 09.12.2025 15:13

Denvys5
Можна ще чіллером оптимізувати

Mozdev · Повідомлення 09.12.2025 15:24

Вони б туди ще елементи Пельтьє запропонували вмонтувати

Yaroslav308 · Повідомлення 09.12.2025 15:43

Самі створили проблему, а потім героїчно її вирішували. Давайте похлопаємо.

denizen · Повідомлення 09.12.2025 16:14

Круто, двосторонне охолодження, прям свято якесь

yariksom · Повідомлення 09.12.2025 17:14

Я в цьому профан повний, але запитаю чи можна теоретично процесор зробити наприклад в 120 нанометрів розміром з каналізаційний люк і цим вирішити проблему,
чи така ідея дурня?

denizen · Повідомлення 09.12.2025 17:18

yariksom: ↑ 09.12.2025 17:14 Я в цьому профан повний, але запитаю чи можна теоретично процесор зробити наприклад в 120 нанометрів розміром з каналізаційний люк і цим вирішити проблему,
чи така ідея дурня?

Ну чого ж, неможна, можна

https://www.cerebras.ai/chip

а нащо це Вам?

yariksom · Повідомлення 09.12.2025 17:22

denizen
Просто з цікавості, фактично питання в тому чи можна оптимізувати таким чином затрати на живлення і охолодження, і чи дешевше утримувати таку структуру чим сучасну.
Крім того, потрібні будуть нові (інші) лінії виробництва і здешевлення цін на звичайні комплектуючі

mrigi · Повідомлення 09.12.2025 17:38

Denvys5: ↑ 09.12.2025 15:05Серед кроків "оптимізації" - Halving GPU Frequency

Можна добитися ще кращіх результатів не вмикаючи GPU

VRoman · Повідомлення 09.12.2025 18:33

Зачем добиваться высокого уровня производительности на единицу площади? В чём может заключаться преимущество? Всё равно кристаллы GPU и памяти производятся раздельно и в сумме площадь самих кристаллов не меняется, тем самым не снижая себестоимости производства. Но уж если так сильно хочется, то почему не последовать примеру АМД устанавливая горячий чип GPU поверх холодной памяти? Зачем делать одеяло для GPU из чипов HBM, а потом мучаться с его охлаждением?

ronemun · Повідомлення 09.12.2025 20:39

я не розумію - ну рішення ж очевидне!
робоча речовина в теплотрубках відводить тепло до 10 раз ефективніше ніж мідь і в 3-4 рази ніж вода, при цьому коштує копійки
ну візьміть всю конструкцію і заізолюйте в обєм з тою речовиною, а вже ззовні відводьте тепло як хочете. Така собі випарна камера але з прямим контактом до самих гарячих зон зі всіх сторін.
При цьому не потрібно термопасти, рідкого металу, складних радіторів окремо на кожен чіп і загального ще складнішої форми, навіть теплотрубок не тре

Навпаки, тре максимально відкритий доступ

waryag · Повідомлення 09.12.2025 21:09

yariksom: ↑ 09.12.2025 17:14Я в цьому профан повний, але запитаю чи можна теоретично процесор зробити наприклад в 120 нанометрів розміром з каналізаційний люк і цим вирішити проблему,
чи така ідея дурня?

Умовний (хай навіть 14нм) суперчип доведеться набирати з купи маленьких (зараз сканер дозволяє не більше 800 кв.мм.), це незручно, дорого і краде продуктивність.

Та й проблеми немає.
Будь-який гарячий чип можна запустити з меншими робочими частотами і споживанням та суттєво покращити тепловий режим з помірною втратою продуктивності. А якщо перепроєктувати його під більш енергоефективний режим, можна зрізати кути і покращити результат при інших рівних.

Але великі компанії по ряду причин зацікавлені у максимальній продуктивності на систему/стійку датацентру і їх не дуже лякають високі температури і споживання.

Scoffer · Повідомлення 09.12.2025 21:18

waryag: ↑ 09.12.2025 21:09Будь-який гарячий чип можна запустити з меншими робочими частотами і споживанням

Воно не нескінченно вниз масштабується.

ronemun · Повідомлення 09.12.2025 22:18

yariksom
2D (великі кристали/пластини) i 2.5d це тупик:
- великі кристали мають колосальний брак, він пропорційний площі, очевидно
- величезна купа зєднань в 2D - максимально довгі і густі, при цьому з низьким ККД через потребу постійно передавати тіж дані і багато вузьких місць. Зараз навіть 800мм2 кристали розбивають віртульно на 4-8 частин щоб зменшити перезресний трафік, а у великої пластини це взагалі тупік - шини передачі даних будуть займати 50+% площі, кеш для них ще 20, а на розрахуки нічого не лишиться.
- важко розводити всі ці зєднання і балансувати їх обєм кешу/ширину і частоту шини, розподіл енергії, для максимальної користі
- важко стабільно випускати певну конфігурацію - брак непердбачуваний. ТОму приходиться відключати з великим запасом, як у Нвідії А22 блоків зі 192, або у Інтел в середньому половина ядер на пластинах відключені
А окремі кристали це:
- економія в 2-10 разів на дешевому техпроцесі для на кешів і шин, контролерів памяті/PCIe і їх інтерфейсів.
- проста і дешева відбраковка - кристали малі, їх не шкода
- проста зміна конфігурації, непотрібно новий кристал для кожного набору ядер/памяті/інших блоків
- більше місця на кристалі з дорогим техпроцесом, що збільшує густину важливих блоків/зменшує перекидування даних/зменшує затримку між ними.
- це дешево і швидко - Інтел напаює тисячу кристалів 2 мм2 на 300 пластину за 15хв
3д це зменшення доріжок в 10-100 раз, наприклад в чіпа ddr/HBM сотні тисяч отворів, там шини і швидкість передачі шалені, затримки пару нс, а енергія біта мінімальна. Це дозволяє робити запас шин для швидкого переключення і переконфігування на льоту, наприклад блоки даних в памяті можна переключати на інший чіп/пристрій без необхідності транспортування цих даних до нього і переписування в іншу область памяті. Це значно зменшує затримку між процом і даними і прискорює обробку.

waryag · Повідомлення 09.12.2025 22:32

Scoffer: ↑ 09.12.2025 21:18 Воно не нескінченно вниз масштабується.

Воно масштабується до рівня, коли охолодження перестає бути суттєвою проблемою.

Scoffer · Повідомлення 09.12.2025 22:48

waryag
Ні. Є точка оптимальної продуктивності на ват. Вона вища ніж мінімально можливе споживання. Саме тому мобільні проци скидують частоту до 700-800 мгц, а не, наприклад, до 200. І ця точка зі зниженням техпроцесу росте в гору, як не дивно.

dext · Повідомлення 10.12.2025 05:31

Scoffer: ↑ 09.12.2025 22:48 waryag
Ні. Є точка оптимальної продуктивності на ват. Вона вища ніж мінімально можливе споживання. Саме тому мобільні проци скидують частоту до 700-800 мгц, а не, наприклад, до 200. І ця точка зі зниженням техпроцесу росте в гору, як не дивно.

саме так, і оптимальна частота зазвичай є вищою навіть за мінімальну

waryag · Повідомлення 10.12.2025 16:38

Scoffer: ↑ 09.12.2025 22:48 waryag
Ні. Є точка оптимальної продуктивності на ват. Вона вища ніж мінімально можливе споживання. Саме тому мобільні проци скидують частоту до 700-800 мгц, а не, наприклад, до 200. І ця точка зі зниженням техпроцесу росте в гору, як не дивно.

Є, але вона набагато нижче за типову робочу частоту. Що ти хотів сказати?

ДядяСаша · Повідомлення 10.12.2025 16:49

Тю, очевидно треба вмонтовувати в 3D структуру теплопровідні елементи, може це буде окремий кристал, а може метал, а може це буде на рівні транзистора...
Це ж було вже. Була новина на оверах, що в платах в текстоліт вставляють мідні стовпці, які збільшують теплопровідність.