Розбираємося у внутрішній структурі мобільних процесорів Intel Lunar Lake

Обсуждение статей и новостей сайта
Відповісти
Автор
Повідомлення
kak_tak
Junior
Аватар користувача

Повідомлення

Предлагаю обсудить Розбираємося у внутрішній структурі мобільних процесорів Intel Lunar Lake

L4 кэша полноценного не будет? увы...
Maxhope
Member
Аватар користувача

Повідомлення

А декстопные ultra 200 тоже 3нм TSMC ?
ДядяСаша
Member
Аватар користувача
Звідки: Киев

Повідомлення

SLC на мікросхемі шо то є?
Shikashi
Junior

Повідомлення

ДядяСаша: 03.10.2024 19:25 SLC на мікросхемі шо то є?
Пишуть таке
спойлер
SLC Cache
While Low Power Island and E-Cores do not have access to the L3 cache of large cores, they benefit from the so-called SLC (System Level Cache, do not confuse with SLC NAND). This is something like the L4 cache, but it serves not only the CPU cores, but also other blocks in the processor, such as the NPU, GPU, multimedia block.
Piter Cantrope
Member
Аватар користувача
Звідки: Калуш

Повідомлення

Maxhope
Так.
max1996
Junior

Повідомлення

Просто цікаво є якісь програми що застосовують npu крім windows? Тому що по приколу дивитись на npu в диспетчері задач тому що 8000 серія амд невідповідає вимогам, а куди утилізувати?
FastBullet
Member

Повідомлення

max1996: 03.10.2024 23:23 Просто цікаво є якісь програми що застосовують npu крім windows? Тому що по приколу дивитись на npu в диспетчері задач тому що 8000 серія амд невідповідає вимогам, а куди утилізувати?
я не знаю як буде в ноутах, але на десктопах купєшь відяшку і все, відповідає система вимогам для Copilot)
по суті NPU це среціалзіовний чип і зрозуміло що він буде обробляти завдання в першу чергу пов'язані з відео та звуком, тобто наприклад ауді0 повідомлення розшифрує в текст
ronemun
Advanced Member

Повідомлення

ДядяСаша: 03.10.2024 19:25 SLC на мікросхемі шо то є?
позначений на схемі SLC це насправді і є контролер памяті з великими кешами SLC
Аналогічно виглядає і у АМД, і в Інтел 12-14 серії. Тільки раніше в Інтел кешу в контролері памяті було всього 4 МБ, по 2 в кожному каналі, тоненькі смужки, а тут явно більше, напевно по 4 МБ, всього 8

а той блок що підписаний тут Memory Controler, насправді щось інше, і скоріше всього це і MediaEngine
Alekss
Member

Повідомлення

FastBullet: 04.10.2024 00:35
max1996: 03.10.2024 23:23 Просто цікаво є якісь програми що застосовують npu крім windows? Тому що по приколу дивитись на npu в диспетчері задач тому що 8000 серія амд невідповідає вимогам, а куди утилізувати?
я не знаю як буде в ноутах, але на десктопах купєшь відяшку і все, відповідає система вимогам для Copilot)
по суті NPU це среціалзіовний чип і зрозуміло що він буде обробляти завдання в першу чергу пов'язані з відео та звуком, тобто наприклад ауді0 повідомлення розшифрує в текст

Поделюсь своими мыслями по этому поводу (можете дополнить или исправить). В NPU вычислениях для PC (обычно это 90% языковых моделей LLM) используют 2 разных подхода:

1. Tensor core от Nvidia. Это закрытый подход. Один из лучших способов получить хороший результат в задачах машинного обучения из-за оптимизации софта, который все пишут специально под эти задачи.

Что же делать AMD, Intel, Qualcomm?

2. Direct ML от Microsoft — общедоступный стандарт, который используют AMD, Intel, Qualcomm и который дает менее хороший результат (примерно -30%) по сравнению с подходом Nvidia (делает то же самое, но не так оптимизирован, как Nvidia).

Почему, когда покупаешь видеокарту, PC сразу получает одобрение Copilot? Потому что процессор, хотя и имеет инструкции AVX, AVX2, AVX512 (DirectML), не может давать такую производительность, как видеокарта с большим количеством конвейеров, заточенных под параллельные вычисления типа DirectML.

Что такое NPU в блоке процессора Lunar Lake и в других процессорах AMD и Qualcomm? Это блок, который работает как GPU, только исключительно с параллельными вычислениями DirectML инструкции (я так думаю).
Nvidia Tensor Core — это закрытый стандарт. Не пойму, почему современные встроенные GPU (APU) типа RDNA2 не проходят по Copilot сразу. Возможно, из-за низкой производительности Tflops в 1,5 - 2 Tflops, и блок NPU добавляет им еще 2-4 Tflops, ну и звучит это покруче - типа отдельный блок ускорения искусственного интеллекта..
FastBullet
Member

Повідомлення

Alekss: 04.10.2024 09:43
FastBullet: 04.10.2024 00:35

я не знаю як буде в ноутах, але на десктопах купєшь відяшку і все, відповідає система вимогам для Copilot)
по суті NPU це среціалзіовний чип і зрозуміло що він буде обробляти завдання в першу чергу пов'язані з відео та звуком, тобто наприклад ауді0 повідомлення розшифрує в текст

Поделюсь своими мыслями по этому поводу (можете дополнить или исправить). В NPU вычислениях для PC (обычно это 90% языковых моделей LLM) используют 2 разных подхода:

1. Tensor core от Nvidia. Это закрытый подход. Один из лучших способов получить хороший результат в задачах машинного обучения из-за оптимизации софта, который все пишут специально под эти задачи.

Что же делать AMD, Intel, Qualcomm?

2. Direct ML от Microsoft — общедоступный стандарт, который используют AMD, Intel, Qualcomm и который дает менее хороший результат (примерно -30%) по сравнению с подходом Nvidia (делает то же самое, но не так оптимизирован, как Nvidia).

Почему, когда покупаешь видеокарту, PC сразу получает одобрение Copilot? Потому что процессор, хотя и имеет инструкции AVX, AVX2, AVX512 (DirectML), не может давать такую производительность, как видеокарта с большим количеством конвейеров, заточенных под параллельные вычисления типа DirectML.

Что такое NPU в блоке процессора Lunar Lake и в других процессорах AMD и Qualcomm? Это блок, который работает как GPU, только исключительно с параллельными вычислениями DirectML инструкции (я так думаю).
Nvidia Tensor Core — это закрытый стандарт. Не пойму, почему современные встроенные GPU (APU) типа RDNA2 не проходят по Copilot сразу. Возможно, из-за низкой производительности Tflops в 1,5 - 2 Tflops, и блок NPU добавляет им еще 2-4 Tflops, ну и звучит это покруче - типа отдельный блок ускорения искусственного интеллекта..
Я думаю все горраздо проще)) Одобрение для Copilot - 40 + трильйон операцій в секунду (TOPS) И если чип соответствует этим требованиям (а последние Интел, амд и квлаком от 45 до 55 кажется), то соответсвенно получается такая вот соответсвующая система. Хотя я не уверен что с 30 или 35TOPS прям не будет работаь копилот, как по мне просто немного медленне должен работать. Ну а видяшки новые там имеют больше 100.
А вот АМД что-то более мене норм в видяшках уже прикрутят в RDNA4. не с проста же FSR4 уже будет основан на ИИ в отличии от FSR3)))
lewerlin
Member
Аватар користувача
Звідки: Миронівка

Повідомлення

FastBullet: 04.10.2024 13:30Я думаю все горраздо проще)) Одобрение для Copilot - 40 + трильйон операцій в секунду (TOPS) И если чип соответствует этим требованиям (а последние Интел, амд и квлаком от 45 до 55 кажется),
Там очевидно ще простіше - тупо перевірка по нейму. Як з процесорами і він11 було, 2600 райзен сумісний, а 1600AF - ні :lol: .
Scoffer
Member
Аватар користувача

Повідомлення

lewerlin: 04.10.2024 13:44Там очевидно ще простіше - тупо перевірка по нейму. Як з процесорами і він11 було, 2600 райзен сумісний, а 1600AF - ні .
Вірно. Наразі ноути зі "старими" процесорами але модними відяхами вимогам копілоту не відповідають.
Відповісти