ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Понедельник
22 июля
1045026
klen (18.10.2020 18:53, просмотров: 8411)
небольшое исследование о прогрессе в нутбукостроении, пользе новых CPU,avx2,холода как вычислительного ресурса и тд. 

месяц назад поменял свой старый ноут на новый - долго ждал и дождался. asus g14 проц r4900hs, 40gb.

в связи с тем что ежечасно дебагаю gcc и все что вокруг этого, приходится по сто раз на дню пересобирать binutils-gcc-newlib-*(всяко разно) для разных таргетов.

делаю я это на ноуте ибо сейчас оказалось что это самая быстрая счетная машинка в моем окружении.

ноут стоил 139тр и деньги были заплачены в слепой вере что получим максимум возможного на данный момент.

на данный момент накопился экспериментальные данные об эксплуатации ...


сборка тулсов arm-kgp-eabi ранее занимала ~55 минут, почему так долго? большой мультилиб и все накрывается lto оптимизацией.

сейчас это время снизилось до ~20 минут


сборка (компиляция/линковка) это очень хорошие тесты на скорость и выносливость(по теплу) машины , но настоящее назначение многопроцессорных систем - ссуко считать матмодели физ.процессов и тд.


тут уже по теме форума. застрял в заднице раскаленный гвоздь сделать датчик вектора скорости воздуха. быдланам для метеостанции, нормальным пацанам для измерения воздушной скорости,углов атаки и скольжения(фактически вектора воздушной скорости). берем обтекатель формы шара например, сверлим 3 мм дырки и прикручиваем датчики давления изнутри. по распределению давления высчитываем вектор скорости - профит: нет механики и нечему отмерзать. датчиков я положил 5 и обработку их данных буду делать на stm32f4. для оценки как и что делать с алгоритмом решения обратной задачки помоделил "шару" в программке SU2.

пришлось собрать OpenMPI, собрать саму SU2 с максимальными оптимизациями под Zen2. замоделил 'шару' .

в итоге по сравнению с старой машиной время счета снизилось с минут до десяток секунд.


влияние -mavx2 vs -mno-avx2 тут как то непонятно, когда руками вставляешь в код враперы инструкций - то результат виден, практически двукратно ускорение avx->avx2, из под комиллера выдавить это как то явно не получилось - видимо исходники "правильными" должны быть.


вот для красоты картинки результата чтоб было понятно на чем я тестил суть вопроса темы.

поле скоростей

поле давления



итак, можно подвести итоги

0. факт на рыло - прогресс есть! при моей жизни счет ускорился в десятки раз. что было маленькой суперэвм - стало нутбуком.

1. в наших задачах много процессоров не бывает, но в ноуте их душит система теплоотвода

2. конкретно для процессоров amd r4000 применительно к ноутам можно сделать заключение что гипертрединг сомнителен, вероятнее всего дозагрузка модулей конвеера ядер приводит к доп.выделению тепла и это отрабатывается снижением тактовой частоты - в результате производительность иногда даже падает но вцелом "то на то и получается".

3. вынос ноута на улицу приводить к увеличению производительности приверно в ~1.25 раза в моем тесте (в квартире 21С на балконе 4С )

4. в линуксе можно управлять отработкой чатоты по температуре почти руками, но вероятно это чревато тем что проц отпаяется ... есть мысли разобрать ноут и посмотреть на предмет доработки системы охлаждения... ну вдруг!


так что рекомендую, тем кто собирается купить за свои деньги машинку с рязанью 4000 серии, подумать а стоит ли платить за топовый процессор с гипертредингом, тут не все однозначно с производительностью, а вот цена сильно выше. и да! - запасайтесь холодом - ноут становиться быстрее на 25 процентов :) я наверно поселю машику на балконе - пусть померзнет!