Прогрес ARM процесорів

AntonyKandaurov · Повідомлення 27.12.2025 00:40

yuriy_dd: ↑ 27.12.2025 00:37але я не писав про гріється. Я казав про падіння швидкодії

yuriy_dd: ↑ 27.12.2025 00:27запускав Cinebench 2024 декілька раз підряд по 10 хв кожен, падіння швидкодії в багато-потоці - до 20%

Опана, а що це таке? Напевне троттлінг але ж як?

yuriy_dd · Повідомлення 27.12.2025 00:51

AntonyKandaurov: ↑ 27.12.2025 00:40 Опана, а що це таке? Напевне троттлінг але ж як?

на скільки ваш 5600H падає швидкодія в Cinebench 2024 при роботі від батареї? в мене такий був у складі ASUS ROG Strix G17 G713QE-HX023 - то десь в 2 рази

AntonyKandaurov · Повідомлення 27.12.2025 00:51

27 грудня 2025, 00:47

yuriy_dd: ↑ 26 грудня 2025, 14:52
ну я і 10 хв Cinebench 2024 запускав - рівень тротлингу в межах 10%
yuriy_dd: ↑ 27 грудня 2025, 00:27
запускав Cinebench 2024 декілька раз підряд по 10 хв кожен, падіння швидкодії в багато-потоці - до 20%

Давай за оцю брехню пояснюй

Відправлено через 1 хвилину 4 секунди:
yuriy_dd
Ти там давай не ухиляйся від питань, за дурних нас тут маєш.

dext · Повідомлення 27.12.2025 01:02

yuriy_dd: ↑ 27.12.2025 00:30 саме так, реальні тести вони такі, код перед вами - якщо ви бачите проблему - кажіть що поправити

A single Firestorm achieves memory reads up to around 58GB/s, with memory writes coming in at 33-36GB/s

ви про volatile? просто стикався що не допомагало

yuriy_dd · Повідомлення 27.12.2025 01:09

AntonyKandaurov: ↑ 27.12.2025 00:52 Давай за оцю брехню пояснюй

я ж вам вже відповів - ще раз - один прогон - то в межах 10%, якщо декілька - то до 20%
ви це розрізняєте?

dext: ↑ 27.12.2025 01:02A single Firestorm achieves memory reads up to around 58GB/s

ви напишете код який це підтвердить? свій я вам дав

AntonyKandaurov · Повідомлення 27.12.2025 01:13

yuriy_dd
Та все, ти вже хоч що можеш писати але твої пости це суцільна брехня і маніпуляція. Так що приймай титул місцевої плювалки і котись на айтісі, там як раз твоя аудиторія тебе зачекалась

Відправлено через 5 хвилин 32 секунди:
Добродій tornadox вже все тут про тебе розписав під спойлером, тож знімай вже клоунську перуку, вона тобі знадобиться на айтісі

viewtopic.php?f=23&t=292795

yuriy_dd · Повідомлення 27.12.2025 01:29

AntonyKandaurov: ↑ 27.12.2025 01:19твої пости це суцільна брехня і маніпуляція

це треба довести, але у вас на це нема достатньо знань

Відправлено через 30 хвилин 1 секунду:
може спробуйте спитати про допомогу - яка різниця між один раз, і декілька раз підряд, може місцеві фанати х86 - допоможуть
хоча це навіть діти знають

AntonyKandaurov: ↑ 27.12.2025 01:19Добродій tornadox вже все тут про тебе розписав

чудово - і тут маю своїх фанатів, і мої повідомлення колекціонують. А чого добились ви?

dext · Повідомлення 27.12.2025 02:25

yuriy_dd: ↑ 27.12.2025 01:09
dext: ↑ 27.12.2025 01:02A single Firestorm achieves memory reads up to around 58GB/s
ви напишете код який це підтвердить? свій я вам дав

цей код вже давно написаний і має назву memcpy(), ваш код міряє невідомо що тож сховайте його подалі, порція обов'язкової теорії для початківців: https://docs.amd.com/r/en-US/pg456-inte ... terleaving

yuriy_dd · Повідомлення 27.12.2025 08:45

dext: ↑ 27.12.2025 02:25цей код вже давно написаний і має назву memcpy()

а тепер те саме - але доступ до памяті не лінійний, а випадковий, і щоб з одного потоку проц міг розпаралелити на декілька меморі контролерів
в моєму випадку я доступаюсь по 32 або по 64 біта, не зміг написати правильний код при доступі по 16 біт - теоретично такий код мав би показати реальну перевагу 8+ memory controller по 16 біт які є у М4 проца

AntonyKandaurov · Повідомлення 27.12.2025 10:47

yuriy_dd: ↑ 27.12.2025 01:59може спробуйте спитати про допомогу - яка різниця між один раз, і декілька раз підряд, може місцеві фанати х86 - допоможуть
хоча це навіть діти знають

Бла бла бла фанати х86. Твої слова нічого вже не коштують брехливе ти створіння

Відправлено через 2 хвилини 2 секунди:

yuriy_dd: ↑ 27.12.2025 01:59чого добились ви?

Спєрва дабєйся, скільки я раз це чув в житті, як мило що фанат емезінга теж висрав цей вираз. Ще для повного успіху вивали "паживьош - узнаєш" і я тоді закреслюю бінго і йду за пивом

yuriy_dd · Повідомлення 27.12.2025 10:59

AntonyKandaurov: ↑ 27.12.2025 10:49Бла бла бла фанати х86. Твої слова нічого вже не коштують брехливе ти створіння

ну не вийде у вас звинуватити мене у брехні як би ви не старались

попросіть допомоги

а може ви зможете купити і переконатись самостійно?

AntonyKandaurov · Повідомлення 27.12.2025 12:06

yuriy_dd
Бла бла бла бла, купи протестуй бла бла ла

pelia · Повідомлення 27.12.2025 13:07

Треба якось не полінитись, спарсити цей тред і скормити ллмці, щоб вона дала звіт як пан Юрій бреше

Відправлено через 4 хвилини 2 секунди:
А хоча нахіба, у мене є deep research від gemini, працюємо

Відправлено через 28 хвилин 51 секунду:
Ось звіт
https://docs.google.com/document/d/1jOq ... sp=sharing

Найцікавіше в таблицях

спойлер

AntonyKandaurov · Повідомлення 27.12.2025 14:17

Найбільший брехун: Користувач yuriy_dd відповідальний за понад 90% дезінформації в темі. Його дії можна кваліфікувати як свідомий тролінг або прояв фанатичної упередженості.

Ми повернулись до тез які лунали на самому початку цієї теми - Юра просто троль, але одне діло траліравать, а інше діло відверто брехати.
pelia
Дякую за працю

dext · Повідомлення 27.12.2025 15:26

yuriy_dd: ↑ 27.12.2025 08:45 а тепер те саме - але доступ до памяті не лінійний, а випадковий, і щоб з одного потоку проц міг розпаралелити на декілька меморі контролерів
в моєму випадку я доступаюсь по 32 або по 64 біта, не зміг написати правильний код при доступі по 16 біт - теоретично такий код мав би показати реальну перевагу 8+ memory controller по 16 біт які є у М4 проца

у вас в голові якесь сміття, ще раз повторюю:
- ЦП отримує дані виключно кратні Cache Line
- ЦП отримує дані через кеш (L1/L2/L3/L4)
- у вашому лайнокоді банальний pointer chasing тому кожен запит генерує cache miss, через що додається затримка L1/L2/L3 тож навіть один канал КП не може вийти на номінальне навантаження
- у вас немає мат.бази, щоб написати коректний код

pelia · Повідомлення 27.12.2025 16:08

ДО РЕЧІ, лінк на промт, щоб мене не звинуватили в підтасовці даних
https://gemini.google.com/share/3a00ae217300

yuriy_dd · Повідомлення 27.12.2025 17:25

dext: ↑ 27.12.2025 15:26ЦП отримує дані виключно кратні Cache Line

має доказ цього для М проців?
заодно скажіть чому там така висока швидкість роботи з пам'яттю?

dext: ↑ 27.12.2025 15:26у вашому лайнокоді банальний pointer chasing тому кожен запит генерує cache miss

але ж явно про це сказав це і є метою - протестувати швидкість роботи з пам'яттю

dext: ↑ 27.12.2025 15:26тож навіть один канал КП не може вийти на номінальне навантаження

а це вже чому?

dext: ↑ 27.12.2025 15:26у вас немає мат.бази, щоб написати коректний код

бо ви щось не зрозуміли?

Відправлено через 5 хвилин 43 секунди:

pelia: ↑ 27.12.2025 16:08ДО РЕЧІ, лінк на промт, щоб мене не

я збрехав бо М5 та А19 Про - не існує

ще й образив 9950Х бо порівняв тільки одно-потік і забув про багато потік
Зен5 приніс прогрес, а за скільки років? а коли буде Зен6? а у АРМ - кожного року
і тд.

dext · Повідомлення 27.12.2025 17:41

yuriy_dd: ↑ 27.12.2025 17:25 має доказ цього для М проців?

ви взагалі адекват? так працюють всі сучасні ЦП

заодно скажіть чому там така висока швидкість роботи з пам'яттю?

тому що більшість цієї швидкості потрібна виключно iGPU - що на x86 не є необхідним

але ж явно про це сказав це і є метою - протестувати швидкість роботи з пам'яттю

тому ваш код - лайно

а це вже чому?

тому що ви не розумієте, що вам пишуть: у вашій поробці кожен запит до КП затримується через cache miss, щоб протестувати швидкість/визначити кількість КП вам потрібно цього уникати та почитати мануал від AMD, щоб підібрати коректний block interleave для завантаження всіх КП одночасно, уникнення bank conflicts та ін.

бо ви щось не зрозуміли?

бо фанатська самовпевненість у вас є, а от мат.бази немає, див. вище

yuriy_dd · Повідомлення 27.12.2025 18:13

dext: ↑ 27.12.2025 17:41ви взагалі адекват? так працюють всі сучасні ЦП

але на тому самому залізі у apple чомусь виходить значно більше швидкості?

dext: ↑ 27.12.2025 17:41тому що більшість цієї швидкості потрібна виключно iGPU - що на x86 не є необхідним

ця швидкість доступна і процу
а що невже на x86 немає інтегрованого відео?

dext: ↑ 27.12.2025 17:41у вашій поробці кожен запит до КП затримується через cache miss, щоб протестувати швидкість/визначити кількість КП вам потрібно цього уникати та почитати мануал від AMD, щоб підібрати коректний block interleave для завантаження всіх КП одночасно, уникнення bank conflicts та ін.

мені треба наближений до реальності код а всі оптимізації хай робить компілятор
до речі масив - це моя улюблена структура даних

dext · Повідомлення 27.12.2025 18:26

yuriy_dd: ↑ 27.12.2025 18:13 але на тому самому залізі у apple чомусь виходить значно більше швидкості?

не виходить бо більшість цієї швидкості йде на iGPU

ця швидкість доступна і процу

виключно на синтетичному коді, реальний код більше 1-2 каналів не використовує

а що невже на x86 немає інтегрованого відео?

на x86 є дискретні GPU, для чого робити окремі лінійки десктопних ЦП та МП з різною кількістью КП немає потреби

мені треба наближений до реальності код а всі оптимізації хай робить компілятор
до речі масив - це моя улюблена структура даних

я вже казав, що ваш код лайно у і вас немає мат. бази для цього?