Розбираємося у внутрішній структурі мобільних процесорів Intel Lunar Lake

kak_tak · Повідомлення 03.10.2024 17:59

Предлагаю обсудить Розбираємося у внутрішній структурі мобільних процесорів Intel Lunar Lake

L4 кэша полноценного не будет? увы...

Maxhope · Повідомлення 03.10.2024 18:00

А декстопные ultra 200 тоже 3нм TSMC ?

ДядяСаша · Повідомлення 03.10.2024 19:25

SLC на мікросхемі шо то є?

Shikashi · Повідомлення 03.10.2024 21:22

ДядяСаша: ↑ 03.10.2024 19:25 SLC на мікросхемі шо то є?

Пишуть таке

спойлер: SLC Cache
While Low Power Island and E-Cores do not have access to the L3 cache of large cores, they benefit from the so-called SLC (System Level Cache, do not confuse with SLC NAND). This is something like the L4 cache, but it serves not only the CPU cores, but also other blocks in the processor, such as the NPU, GPU, multimedia block.

Piter Cantrope · Повідомлення 03.10.2024 22:46

Maxhope
Так.

max1996 · Повідомлення 03.10.2024 23:23

Просто цікаво є якісь програми що застосовують npu крім windows? Тому що по приколу дивитись на npu в диспетчері задач тому що 8000 серія амд невідповідає вимогам, а куди утилізувати?

FastBullet · Повідомлення 04.10.2024 00:35

max1996: ↑ 03.10.2024 23:23 Просто цікаво є якісь програми що застосовують npu крім windows? Тому що по приколу дивитись на npu в диспетчері задач тому що 8000 серія амд невідповідає вимогам, а куди утилізувати?

я не знаю як буде в ноутах, але на десктопах купєшь відяшку і все, відповідає система вимогам для Copilot)
по суті NPU це среціалзіовний чип і зрозуміло що він буде обробляти завдання в першу чергу пов'язані з відео та звуком, тобто наприклад ауді0 повідомлення розшифрує в текст

ronemun · Повідомлення 04.10.2024 03:19

ДядяСаша: ↑ 03.10.2024 19:25 SLC на мікросхемі шо то є?

позначений на схемі SLC це насправді і є контролер памяті з великими кешами SLC
Аналогічно виглядає і у АМД, і в Інтел 12-14 серії. Тільки раніше в Інтел кешу в контролері памяті було всього 4 МБ, по 2 в кожному каналі, тоненькі смужки, а тут явно більше, напевно по 4 МБ, всього 8

а той блок що підписаний тут Memory Controler, насправді щось інше, і скоріше всього це і MediaEngine

Alekss · Повідомлення 04.10.2024 09:43

FastBullet: ↑ 04.10.2024 00:35
max1996: ↑ 03.10.2024 23:23 Просто цікаво є якісь програми що застосовують npu крім windows? Тому що по приколу дивитись на npu в диспетчері задач тому що 8000 серія амд невідповідає вимогам, а куди утилізувати?
я не знаю як буде в ноутах, але на десктопах купєшь відяшку і все, відповідає система вимогам для Copilot)
по суті NPU це среціалзіовний чип і зрозуміло що він буде обробляти завдання в першу чергу пов'язані з відео та звуком, тобто наприклад ауді0 повідомлення розшифрує в текст

Поделюсь своими мыслями по этому поводу (можете дополнить или исправить). В NPU вычислениях для PC (обычно это 90% языковых моделей LLM) используют 2 разных подхода:

1. Tensor core от Nvidia. Это закрытый подход. Один из лучших способов получить хороший результат в задачах машинного обучения из-за оптимизации софта, который все пишут специально под эти задачи.

Что же делать AMD, Intel, Qualcomm?

2. Direct ML от Microsoft — общедоступный стандарт, который используют AMD, Intel, Qualcomm и который дает менее хороший результат (примерно -30%) по сравнению с подходом Nvidia (делает то же самое, но не так оптимизирован, как Nvidia).

Почему, когда покупаешь видеокарту, PC сразу получает одобрение Copilot? Потому что процессор, хотя и имеет инструкции AVX, AVX2, AVX512 (DirectML), не может давать такую производительность, как видеокарта с большим количеством конвейеров, заточенных под параллельные вычисления типа DirectML.

Что такое NPU в блоке процессора Lunar Lake и в других процессорах AMD и Qualcomm? Это блок, который работает как GPU, только исключительно с параллельными вычислениями DirectML инструкции (я так думаю).
Nvidia Tensor Core — это закрытый стандарт. Не пойму, почему современные встроенные GPU (APU) типа RDNA2 не проходят по Copilot сразу. Возможно, из-за низкой производительности Tflops в 1,5 - 2 Tflops, и блок NPU добавляет им еще 2-4 Tflops, ну и звучит это покруче - типа отдельный блок ускорения искусственного интеллекта..

FastBullet · Повідомлення 04.10.2024 13:30

Alekss: ↑ 04.10.2024 09:43
FastBullet: ↑ 04.10.2024 00:35

я не знаю як буде в ноутах, але на десктопах купєшь відяшку і все, відповідає система вимогам для Copilot)
по суті NPU це среціалзіовний чип і зрозуміло що він буде обробляти завдання в першу чергу пов'язані з відео та звуком, тобто наприклад ауді0 повідомлення розшифрує в текст

Поделюсь своими мыслями по этому поводу (можете дополнить или исправить). В NPU вычислениях для PC (обычно это 90% языковых моделей LLM) используют 2 разных подхода:

1. Tensor core от Nvidia. Это закрытый подход. Один из лучших способов получить хороший результат в задачах машинного обучения из-за оптимизации софта, который все пишут специально под эти задачи.

Что же делать AMD, Intel, Qualcomm?

2. Direct ML от Microsoft — общедоступный стандарт, который используют AMD, Intel, Qualcomm и который дает менее хороший результат (примерно -30%) по сравнению с подходом Nvidia (делает то же самое, но не так оптимизирован, как Nvidia).

Почему, когда покупаешь видеокарту, PC сразу получает одобрение Copilot? Потому что процессор, хотя и имеет инструкции AVX, AVX2, AVX512 (DirectML), не может давать такую производительность, как видеокарта с большим количеством конвейеров, заточенных под параллельные вычисления типа DirectML.

Что такое NPU в блоке процессора Lunar Lake и в других процессорах AMD и Qualcomm? Это блок, который работает как GPU, только исключительно с параллельными вычислениями DirectML инструкции (я так думаю).
Nvidia Tensor Core — это закрытый стандарт. Не пойму, почему современные встроенные GPU (APU) типа RDNA2 не проходят по Copilot сразу. Возможно, из-за низкой производительности Tflops в 1,5 - 2 Tflops, и блок NPU добавляет им еще 2-4 Tflops, ну и звучит это покруче - типа отдельный блок ускорения искусственного интеллекта..

Я думаю все горраздо проще)) Одобрение для Copilot - 40 + трильйон операцій в секунду (TOPS) И если чип соответствует этим требованиям (а последние Интел, амд и квлаком от 45 до 55 кажется), то соответсвенно получается такая вот соответсвующая система. Хотя я не уверен что с 30 или 35TOPS прям не будет работаь копилот, как по мне просто немного медленне должен работать. Ну а видяшки новые там имеют больше 100.
А вот АМД что-то более мене норм в видяшках уже прикрутят в RDNA4. не с проста же FSR4 уже будет основан на ИИ в отличии от FSR3)))

lewerlin · Повідомлення 04.10.2024 13:44

FastBullet: ↑ 04.10.2024 13:30Я думаю все горраздо проще)) Одобрение для Copilot - 40 + трильйон операцій в секунду (TOPS) И если чип соответствует этим требованиям (а последние Интел, амд и квлаком от 45 до 55 кажется),

Там очевидно ще простіше - тупо перевірка по нейму. Як з процесорами і він11 було, 2600 райзен сумісний, а 1600AF - ні

.

Scoffer · Повідомлення 04.10.2024 17:42

lewerlin: ↑ 04.10.2024 13:44Там очевидно ще простіше - тупо перевірка по нейму. Як з процесорами і він11 було, 2600 райзен сумісний, а 1600AF - ні .

Вірно. Наразі ноути зі "старими" процесорами але модними відяхами вимогам копілоту не відповідають.