Змагаймось в нашій команді Folding@Home!

ShaggY · Повідомлення 17.10.2016 12:24

О, класс, я как-то и не мониторил статистику

Надеюсь на новые видяхи от АМД, как раз ремонт закончу машины))

ronemun · Повідомлення 20.10.2016 18:29

на процах з AVX проект 11920 (ядро a7) дає до 60к на 2600k@4200 в Лінукс і 100к на 4790к@4500 (в Віндовс)
Лінукс, як не дивно, дає більше очок, але тре версію поновіше, щоб AVX2 підтримувала (для Haswell, Broadwell, Skylake, core i3-i7)
Гіпертрейдінг збільшує швидкість в 1,50 рази, а отже ППД у майже 2 рази !!!

Ніяких настройок для слота cpu не потрібно, він іде на всіх client-type крім beta (по замовчуванню client-type=normal)

завдання рахуються швидко, крок для 2600к@4200 50-60 сек

ShaggY · Повідомлення 20.10.2016 21:06

ronemun
А как получить эту задачку? на бету поставить?

ronemun · Повідомлення 20.10.2016 23:27

йде на будь-які настройки, але, правда, сьогодні коли я випробував, то лише кожна 3-5 приходила 11920, решту - 9ххх. Можливо це у віндовсі, народ на формах хвалить задачу в лінуксі.
я лише для тесту, в анонімі, тож взагалі скидував непотріб.

У віндовсі взагалі чудеса з цією задачею:
1. якщо проц має AVX, то іде ядро a7 з папки AVX - але крок виходить в 1,4 рази більший ніж на ядрі a7 без AVX (з папки а7) - тоді лише sse2 викорстовується. Але як запустити розрахунок без AVX - я не знаю - клієнт сам визначає проц і під нього скачує варіант задачі 11920. Я порівнював задачу на 2-ядерному Celeron (IvyBridge, 2,6ГГц), крок=220с. Переносив папку work (так клієнт не скидає задачу) на 2600к@3500 - задача далі рахувалась на 2 ядра (більше не дає виставити

- крок став 150с. З прикидом на smp=8 б бути 52-58с, тоді як на ньому задачі на AVX давали 115с без гіпертрейдінгу, і 82 с з ним. На 3930к@3800 на smp=12 крок=48с, тоді як в лінуксі такий крок отримують на 2600к@4200 з smp=8 (дані з форумів). Те що робота ядра AVX крива видна і потому, що споживання 2600к@3500 при smp=8 всього 62Вт, тоді як лінпак з AVX грузить це й же проц на 84 Вт. До речі, з форуму overclock.net, 2 ядра феном ІІ@3700 теж дають крок=215с, що в перерахунку означає що AVX тормозить. Але це лише у Windows - у лінуксі все ок.
2. дивне маштабування задач: скачав задачу на 2600к@3500 - і випробовую з різними параметрами - smp 8 (тобто 4 ядра+HT) - крок=82с, smp 4 (без НТ) - крок=115, smp=2 крок=155с. Можливо, при smp=2 задача якось швидше рахується, можливо при smp 4 не ті ядра грузило (логічні замість фізичних, тобто 2фіз+2лог). На 3930к (далі smp/крок) - 12/70, 6/48 - тобто з НТ на 50% щвидше.

Тож виходить що ця задача досить вигідна і для проців без AVX, у віндовсі, як з AVX в лінуксі

П.С. 1. на Pentium4400@3300 скайлейк при smp=1 крок=244с, при smp=2 крок=131. Правда, задачі буль різні, тому що, якщо отримав задачу на smp=1, перевести її на обрахунок з smp=2не виходить - далі рахує 1 потік навіть після перезагрузки клієнта. Після цього отримав задачу на смп=2 крок той же =130с, перевів на смп=1 крок=244с
П.С. 2 задачі одна від одної практично не відрізняються по тривалості (на тому ж залізі)
здається, задачі дууже чутливі до швидкості памяті і кеша - тому меньший smp у виграші
навіть набирання тексту в браузері збільшує тпф на 15%

ronemun · Повідомлення 21.10.2016 17:25

файлів ядра А7 є два: з підтримкою AVX в папці AVX\Core_a7.fah, і з sse2 в просто папці Core_a7.fah
якщо проц має AVX, скачується тільки його варіант, шоб дістати sse2 варіант ядра я запускав задачу на іншому проці
Прикол в тому, що якщо замінити AVX-ядро на sse2 варіант то рахунок йде швидше - на 2600к@3500
smp=8: 71с замість 82,
smp=4: 84-97с проти 110
smp=2: 145с проти 155с.
в лінуксі мало б бути десь 58-60с проти 71 (чи 82) у віндовс

ShaggY · Повідомлення 21.10.2016 19:56

ну перекидывать задачи с разных процов - не благодарное дело и времени на такую фигню нет)

ronemun · Повідомлення 21.10.2016 21:28

я, очевидно, за багато написав
у віндовс тре всього переписати ядро a7 для sse2 в папку для AVX - і тоді на компі з AVX задачі 11920 будуть рахуватись на sse2, що швидше.
Але, напевно клієнт буде обновляти ядро, і просто перепише нове - з AVX. Тоді тре знов швидкість виміряти чи просто заблокувати перезапис файла у NTFS
А ще краще лінукс

П.С. Замітив в тебе 6700к - здається на AVX2 використовується інше ядро - а8. В них проблем у віндовсі немає - ППД під 100к

ShaggY · Повідомлення 22.10.2016 20:55

буду на работе проверю какое там ядро. при паралельной работе, и куче браузеров и всего остального, выходит 30-40к ППД

ShaggY · Повідомлення 21.11.2016 15:22

А что сейчас случилось нвидия видяхами, постаивл свежие дрова, поставил 1080 временно подмученую

и драйвера напару с заданием слетают... ЧТо-то забыл поставить?
CUDA Toolkit еще надо ставить?

ronemun · Повідомлення 28.11.2016 23:08

тут і тут підказка
навіть декілька:

проблема 1: новые дрова не ставить, ставить последние стабильно рабочие, а именно 372.70

проблема 2: после установки на 10-м виндоусе апдейта 1607 и 1510 OpenCL недоступен
Переустановил заново клиента (поставил новый 7.4.15) и все заработало

ShaggY · Повідомлення 29.11.2016 00:33

ronemun
Cпасибо, на будущие учту, видяха уже улетела к сожалению..
Значит проблема была в дровах, так как на семерках тестил.

1080/1070 от Палит серии гйемрок, просто супер, холодная и тихая, аж страшно

ronemun · Повідомлення 17.02.2017 19:58

проект 13800 (ядро а7) на smp=10 на ядрах сандібрідж@3800 дає ППД=80к
чомусь не запускається на smp=12, хоча в проца 12 потоків
не розумію як в народу 460к набирається на smp=24

ShaggY · Повідомлення 17.02.2017 20:05

У меня на 6700к @4,5 больше 101к ППД дает, это еще с запущенным всяким мусором в системе, но когда я не работаю за ним. почти как моя 7950))
седня ради спортивного интереса запустил еще на 6700 обычном и 4400, на последнем дает больше 30к ППД. А раньше не более десяти было

помню на старой работе были приколы когда в компе 48 потоков.. фолдинг 24 брал только

ronemun · Повідомлення 17.02.2017 20:25

а в тебе на 6700к всі 8 потоків використовує чи меньше.
і по ссилці з мого попереднього посту виходить що це всього 1 проц хасвел 12ядер/24 потоки @2500 при умові що AVX2 дає у 2 рази більше профіт ніж у мене на 3930к з AVX1. Хіба таке можливо - у 2 рази? Чи це все таки 2 проца.
До речі, спеціально підставив замість ядра а7 з AVX просте ядро а7 (без AVX). TPF виріс з 216сек до 237, тобто у 1,10 рази. Виходить з AVX1 толку мало, хоча може це через Віндовс 7. Тре в Лінуксі попробувати.

ShaggY · Повідомлення 18.02.2017 00:07

Полностью все 8-м.

Ты уже не в нашей команде?)

ronemun · Повідомлення 18.02.2017 11:09

В нашій звичайно ж.
Тільки поки що не рахую - відях нема нормальних, а х6 проци жруть 150Вт при 3800МГц, і всі без AVX2, тільки AVX. А тут ППД максимум 80к. Кучу слабих проців не рахую.

От якби x6 проци в кластер обєднати -60 ядер сандібрідж@3800

- зараз Інфінібенди дешеві. Тут PPD до 2500к буде.

Отправлено спустя 6 минут 2 секунды:

ShaggY:Полностью все 8-м.

а можеш в задачі 13800 крок заміряти мінімільний, тобто коли проц незанятий нічим іншим. Хочу прикинути теоретично скільки сучасні Xeon можуть дати.

ShaggY · Повідомлення 18.02.2017 14:33

2,50 - 2,55 но там еще была удаленка + скайп и рабочие тулзы, и всякая мелочь.. сча ради интереса выключил это все

ronemun · Повідомлення 18.02.2017 23:12

вибач за занудство

, по пунктам
1) 2,50 - 2,55 це 2хв 50сек чи 2 з половиною хв, тобто 2хв 30сек
2) це без сторонніх прог
3) це 8 потоків
4) це задача 13800
наперед дякую

перерахував ефективність AVX2 згідно твоїх (tpf=2хв30сек) і цих даних
вийшло що користь з AVX2 відносно sse2 всього 14%. Це якщо рахувати що мій проц на 10 потоків рахував 5фіз/10логічних, а не 6фіз/4лог - тоді приріст від AVX2 34%, що більше подібно на правду. Отже 1шт. xeon 2670v3 не міг набрати 460к
але при 2х процах на чаcтоті 2300 потужності хватить щоб TPF=67сек і без AVX2, на SSE. якщо 2 проца по 24 потоки то cpu=24 нема сенсу задавати , хіба задача не може більше.
Якщо все ж таки був 1 проц, то виходить що твій 6700к@4500 мав би рахувати у 1,5 рази швидше, тобто TPF=100cек, ППД=250к
який же справді TPF ?

ShaggY · Повідомлення 19.02.2017 09:30

1) это 2 минуты 50 секунд-55 секунд.
2)с ними
3) да 8
4) да 13800

Сейчас ну почти без сторонних прог результат 2 минуты 45 секунд - 47секунд. Это на частоте 4500. Был бы там домашний куллер думаю можно было бы еще что-то выжать, а если скальпировать..)))
опять, если убрать винду и добавить линукс, будет еще чуть больше..

ronemun · Повідомлення 19.02.2017 18:31

на роботі на серваку з Broadwell x6@3500 в задачі 13800 крок 2хв40сек. Виходить, з AVX і AVX2 прискорення лише 15%
Високий ППД тому що така винагорода за задачу.
Pentium 4400 в цій задачі tpf=10хв ppd=17,5к.

ShaggY:седня ради спортивного интереса запустил еще на 6700 обычном и 4400, на последнем дает больше 30к ППД. А раньше не более десяти было

а номерки задач >30к на пні 4400 часом не замітив? які настройки потрібні?

Отправлено спустя 12 минут 12 секунд:
також замітив що у фолдингу старі/слабі проци скоро будуть непотрібні
для задачі 13800 тре мінімум 1 ядро core2@1,8ГГц (~6 Гфлопс) щоб мінімальні очки (базу) отримати за 5 діб розрахунку