Предлагаю обсудить Intel раскрыла подробности об энергоэффективной микроархитектуре Tremont
Intel доработал FX или Atom Dual Core.
Два декодера по три инструкции вместо одного на 6 инструкций.
Останні статті і огляди
Новини
Intel раскрыла подробности об энергоэффективной микроархитектуре Tremont
-
Grinnie Jax
Member
- Звідки: Менск
Тремор?
-
Kotya
Member
- Звідки: Одеса Україна
Там проскакивает аналог биг/литтл или мне показалось?
-
BigTypoon
Member
- Звідки: Борщагівка - Позняки
Главное, чтобы не заломили цены. А то будет это изделие в 2.5 устройствах.
-
Scoffer
Member
- Було
- Стало
- bulldozer
Що цікавого: а теоретична кількість інструкцій за такт виросла і тепер навіть більше ніж в скайлейках. В скайлейках до 5 інструкцій в декодері, і до 8 на виконанні, з котрих 4 на ALU. А тут до 6 в декодерах, до 10 всього з котрих до 5 на ALU. Причому FP ALU винесені окремо від Integer.
Якби мені показали цю блочну діаграму без прив'язки до назви/сегменту, я б вирішив, що це нова високопродуктивна архітектура на заміну скайлейкам
-
avuremybe
Member
Не исключено, что замена скайлейкам будет иметь что-то похожее.Scoffer:Якби мені показали цю блочну діаграму без прив'язки до назви/сегменту, я б вирішив, що це нова високопродуктивна архітектура на заміну скайлейкам
-
Dream Machines
Member
- Звідки: Киев
Так и есть, это CPU будет использоваться в Microsoft Surface NeoKotya:Там проскакивает аналог биг/литтл или мне показалось?
-
ronemun
Advanced Member
дивно, чомуж раніше ніхто не додумався зліпити два декодери - і чудо - швидкість на такт зростає
а може 3 зліпити, чи навіть 4
мені здається це зроблено для зменшення частоти внутрішніх блоків - а значить напруги-споживання. Вони краще б так само з FMA/AVX зробили в основних процах, особливо серверних
Переклад з Анандтех:
Каждый механизм декодирования, когда имеет дело с различными предсказаниями ветвлений, может принимать отдельный поток команд. Это обеспечивает более высокое среднее использование по обоим механизмам декодирования шириной 3, по сравнению с одним механизмом шириной 6, но когда ветвь отсутствует, это означает, что один из механизмов декодирования может быть синхронизирован по времени для экономии энергии.
(Технически Intel заявляет, что с помощью микрокода они могут изменить механизмы декодирования, чтобы они действовали как единая реализация шириной 6, а не как две машины шириной 3. Это не будет настраиваться OEM-производителем, но исходя из требований, которые Intel может сделать конкретными продукты для клиентов, которые просят это.)
Поэтому, чтобы уточнить, у Tremont нет микрооперационного кеша. Обсуждая с Intel преимущества этой конструкции с механизмом двойного декодирования по сравнению с кэш-памятью микроопераций, Intel заявила, что кэш-память микроопераций может помочь лучше использовать дизайн с широким декодированием, но с меньшим размером декодирования на процессор, они смогли увидеть повышение производительности, а также сохранить площадь штампа с помощью этой двухмоторной конструкции. Intel отказалась комментировать, какая из них лучше, но нам сказали, что с учетом размера кристалла, огибающей мощности Atom и типичного потока команд ядра Atom эта конструкция дала лучшее сочетание производительности, мощности и площади.
а може 3 зліпити, чи навіть 4
мені здається це зроблено для зменшення частоти внутрішніх блоків - а значить напруги-споживання. Вони краще б так само з FMA/AVX зробили в основних процах, особливо серверних
Переклад з Анандтех:
Каждый механизм декодирования, когда имеет дело с различными предсказаниями ветвлений, может принимать отдельный поток команд. Это обеспечивает более высокое среднее использование по обоим механизмам декодирования шириной 3, по сравнению с одним механизмом шириной 6, но когда ветвь отсутствует, это означает, что один из механизмов декодирования может быть синхронизирован по времени для экономии энергии.
(Технически Intel заявляет, что с помощью микрокода они могут изменить механизмы декодирования, чтобы они действовали как единая реализация шириной 6, а не как две машины шириной 3. Это не будет настраиваться OEM-производителем, но исходя из требований, которые Intel может сделать конкретными продукты для клиентов, которые просят это.)
Поэтому, чтобы уточнить, у Tremont нет микрооперационного кеша. Обсуждая с Intel преимущества этой конструкции с механизмом двойного декодирования по сравнению с кэш-памятью микроопераций, Intel заявила, что кэш-память микроопераций может помочь лучше использовать дизайн с широким декодированием, но с меньшим размером декодирования на процессор, они смогли увидеть повышение производительности, а также сохранить площадь штампа с помощью этой двухмоторной конструкции. Intel отказалась комментировать, какая из них лучше, но нам сказали, что с учетом размера кристалла, огибающей мощности Atom и типичного потока команд ядра Atom эта конструкция дала лучшее сочетание производительности, мощности и площади.
-
Charger
Member
- Звідки: Запорожье
Самая грустная фраза в новости "ноутбуки" когда уже додумаются делать корпус из картона? А лучше одноразовые поделия с распаянной qlc и фиксацией материнки на клей
-
Taran
Member
- Звідки: Львів
Тільки мені стьало дивно про 2 ватта? Qualcomm Snapdragon 855+ / 855 Plus жруть при максимальній нагрузці від 3.5 до 5 ватт....Чипы на основе ядер Tremont смогут работать на номинальной частоте около 2,5 ГГц потребляя при этом до 2 Вт.
Гікбенч каже що:
Snapdragon 855 набирає 684 Single-Core Score/ 2451 Multi-Core Score (до 5 ватт)
Intel Pentium Silver N5000 набирає 433 Single-Core Score / 1231 Multi-Core Score (до 6 ватт)
Тобто Tremont (х64) майже дожене квалком (на армі) по потуждності при в 2 рази меншому єнергоспоживанні? Щось я не вірю.
-
ronemun
Advanced Member
3-5 Вт це який сценарій
Гікбенч-тест що ти привів це лише проц. Чисто ядра проца там мало жруть. А сучасні мобільні чіпи це лише на 20% проц, решту це відеокарта, цифровий сигнальний проц, він же штучний інтелект для обробки відео і звуку з камер, ну і модем + контролер NVME - флеш там маслає на 1-2 ГБайт/с, >100к іопс. Відеочіпи вже перескочили 1Тфлопс половинної точності, штучний інтелект 20-50 Топс.
Гікбенч-тест що ти привів це лише проц. Чисто ядра проца там мало жруть. А сучасні мобільні чіпи це лише на 20% проц, решту це відеокарта, цифровий сигнальний проц, він же штучний інтелект для обробки відео і звуку з камер, ну і модем + контролер NVME - флеш там маслає на 1-2 ГБайт/с, >100к іопс. Відеочіпи вже перескочили 1Тфлопс половинної точності, штучний інтелект 20-50 Топс.