-
- …и не просто глупые, а ещё непереписываемые. «Много считать» можно и на шейдерах, а вот тварьчество похапешных школоло уже так не посчитаешь. - Николай Коровин(13.02.2017 02:42)
- В PHP все есть -> -->, а остальное - проблема идиотов, которые школоло на серьезные задачи поставило. - Evgeny_CD(13.02.2017 02:51, ссылка, ссылка)
- Не, тут деление более интересное. Хотя я и сам грешу школоПХПшничаньем и более того — мне это удаётся крайне отвратно, так что печальный стереотип я готов подтвердить личным примером, дело тут всё-таки не в этом. Николай Коровин(618 знак., 13.02.2017 22:13)
- Никогда не забуду слова препода по выч. математике, который в МФТИ учил меня уму разуму. Точнее, пытался научить. Evgeny_CD(859 знак., 13.02.2017 23:30, ссылка)
- Это если задача действительно решается и так, и эдак. А я говорил в первую очередь о том, что есть задачи, которые практически невозможно решить нетрадиционным способом. И вопрос не в «разумности» выбора, а в его отсутствии :) - Николай Коровин(14.02.2017 00:06)
- Никогда не забуду слова препода по выч. математике, который в МФТИ учил меня уму разуму. Точнее, пытался научить. Evgeny_CD(859 знак., 13.02.2017 23:30, ссылка)
- Я очень извиняюсь, попав в толпу ПХПшников, а вот оборачивание матриц для МКЭ считается достойной задачей для серьёзных камней? - Крок(13.02.2017 21:14)
- Да, это типичная задача для FPU, которую можно считать серьезной, т.к. требует double64-арифметику из-за того, что данный процесс чувствителен к потере значащих цифр мантиссы. А с матрицами большой размерности задача становится еще труднее, т.к. Ксения(77 знак., 13.02.2017 21:39)
- А что ж это за сигналы такие непредсказуемого размаха, что для них обязательна плавучка? Обычно высвобожденных битов порядка хватает на то, чтобы тупо создать в фикс. точке запас на все возможные случаи. - Николай Коровин(13.02.2017 23:00)
- Нет. Обращение только в даблах. - Evgeny_CD(13.02.2017 23:05)
- В принципе существуют еще и итерационные методы, когда обратная матрица вычисляется "халтурно" (с большой ошибкой), а затем ее умножают на исходную и смотрят на то, что получилось. Отклонение произведения от диагональной матрицы можно использовать Ксения(594 знак., 13.02.2017 23:45 - 23:50)
- Спасибо за пояснения. Но я все же про embedded, а там - недостаток ресурсов. Лобовой вариант с дабловым FPU выглядит быстрее всех, и по памяти разумно. Открытых исходников тоже много, можно брать и допиливать. - Evgeny_CD(14.02.2017 00:07)
- Кто бы спорил, но не я. До сих пор горюю из-за изгнания типа long double (float80) из компиляторов. Если уж заколодило из-за того, что 80 не является степенью двойки, то за 25 лет уж можно было сделать float128, благо что и стандарт такой есть. Но Ксения(92 знак., 14.02.2017 00:27)
- Купите машину Мир-2, там нет ограничений по разрядности - Крок(14.02.2017 08:51)
- Для меня, кстати, загадка, почему рядом с AVX, на худой конец AVX 512 не угнездился 128 битный float. Но, похоже, он нужен небольшому числу пользователей -> - Evgeny_CD(14.02.2017 00:44, ссылка)
- Потому что тяжело в реализации. Это AVX128-AVX256-AVX512 делаются простым клонированием AVX128 блока, т.к. "этажи" там работают независимо друг от друга. А умножение 128х128 даже выглядит страшно - где-то в квадрате должно быть сложнее, чем 64х64. Ксения(116 знак., 14.02.2017 01:39)
- 5 лет назад => - Ксения(14.02.2017 01:43 - 01:53, ссылка)
- Как время быстро бежит :( - Evgeny_CD(14.02.2017 01:55)
- 5 лет назад => - Ксения(14.02.2017 01:43 - 01:53, ссылка)
- Потому что тяжело в реализации. Это AVX128-AVX256-AVX512 делаются простым клонированием AVX128 блока, т.к. "этажи" там работают независимо друг от друга. А умножение 128х128 даже выглядит страшно - где-то в квадрате должно быть сложнее, чем 64х64. Ксения(116 знак., 14.02.2017 01:39)
- Кто бы спорил, но не я. До сих пор горюю из-за изгнания типа long double (float80) из компиляторов. Если уж заколодило из-за того, что 80 не является степенью двойки, то за 25 лет уж можно было сделать float128, благо что и стандарт такой есть. Но Ксения(92 знак., 14.02.2017 00:27)
- Спасибо за пояснения. Но я все же про embedded, а там - недостаток ресурсов. Лобовой вариант с дабловым FPU выглядит быстрее всех, и по памяти разумно. Открытых исходников тоже много, можно брать и допиливать. - Evgeny_CD(14.02.2017 00:07)
- А, обращение. - Николай Коровин(13.02.2017 23:28)
- В принципе существуют еще и итерационные методы, когда обратная матрица вычисляется "халтурно" (с большой ошибкой), а затем ее умножают на исходную и смотрят на то, что получилось. Отклонение произведения от диагональной матрицы можно использовать Ксения(594 знак., 13.02.2017 23:45 - 23:50)
- Нет. Обращение только в даблах. - Evgeny_CD(13.02.2017 23:05)
- какие страсти Вы рассказываете! Люди попроще разбивают задачу на такие КЭ, чтоб матрица была более-менее обусловленной, а с недостатком точности борются вторым или третьим (крайне редко) прогоном. - Крок(13.02.2017 21:56)
- Я не спец по КЭ, но если есть возможность минимизировать размер матриц и сделать их более обусловленными, то это большая удача. Однако в самом общем случае трудно оценить ранг матрицы, пока не начнешь ее обращать. - Ксения(13.02.2017 22:04)
- Только в самом общем :-) - Крок(13.02.2017 22:08)
- Тогда вы сами себе ответили, что ваша задача несерьезна :) - Ксения(13.02.2017 22:25)
- Только в самом общем :-) - Крок(13.02.2017 22:08)
- Я не спец по КЭ, но если есть возможность минимизировать размер матриц и сделать их более обусловленными, то это большая удача. Однако в самом общем случае трудно оценить ранг матрицы, пока не начнешь ее обращать. - Ксения(13.02.2017 22:04)
- А что ж это за сигналы такие непредсказуемого размаха, что для них обязательна плавучка? Обычно высвобожденных битов порядка хватает на то, чтобы тупо создать в фикс. точке запас на все возможные случаи. - Николай Коровин(13.02.2017 23:00)
- У нас LPC3250 работал с кучкой матриц 120х120 в даблах. В том числе обращал их. Все получалось на пределе возможностей. - Evgeny_CD(13.02.2017 21:39)
- Зависит от числа КЭ. очевидно же.. :) - Хаос(13.02.2017 21:24, )
- Да, это типичная задача для FPU, которую можно считать серьезной, т.к. требует double64-арифметику из-за того, что данный процесс чувствителен к потере значащих цифр мантиссы. А с матрицами большой размерности задача становится еще труднее, т.к. Ксения(77 знак., 13.02.2017 21:39)
- Не, тут деление более интересное. Хотя я и сам грешу школоПХПшничаньем и более того — мне это удаётся крайне отвратно, так что печальный стереотип я готов подтвердить личным примером, дело тут всё-таки не в этом. Николай Коровин(618 знак., 13.02.2017 22:13)
- В PHP все есть -> -->, а остальное - проблема идиотов, которые школоло на серьезные задачи поставило. - Evgeny_CD(13.02.2017 02:51, ссылка, ссылка)
- Я не спорю :) Я просто привел это как пример достижений человечества :) А задача распараллеливания и оптимизации исполнения на куче ядер - она сложна, Закон Амдала однако :) Evgeny_CD(101 знак., 13.02.2017 02:33)
- Здесь он упрется в потолок гораздо раньше, чем по Амдалу, т.к. шина памяти будет тормозить, а значительно ее расширить нельзя - мало пинов у чипа. Ксения(679 знак., 13.02.2017 03:22)
- …я и на SoC так хотел, ну да вы все наверняка помните :) Только на меньшем уровне иерархии — вместо каждого модуля памяти там блок M×N бит DRAM, вместо 4 ядер — сделать авторефреш «умным», чтобы он согласно программе что-то куда-то перенёс, Николай Коровин(123 знак., 13.02.2017 15:14)
- Физическая реализация памяти вам виднее, но меня лично ужаснула фраза в описании теста ZEN: "Память DDR4-2400 работала с задержками 17-17-17-39 2T". Не понимаю, как на такой памяти 8 ядер могут показать высокую производительность, а уж про 60 ядер Ксения(26 знак., 13.02.2017 20:21, ссылка)
- Ксения, это стандартные тайминги DDR4 -> --> Интел будет работать с такой памятью точно так же. - Evgeny_CD(13.02.2017 21:50 - 14.02.2017 00:22, ссылка, ссылка)
- Физическая реализация памяти вам виднее, но меня лично ужаснула фраза в описании теста ZEN: "Память DDR4-2400 работала с задержками 17-17-17-39 2T". Не понимаю, как на такой памяти 8 ядер могут показать высокую производительность, а уж про 60 ядер Ксения(26 знак., 13.02.2017 20:21, ссылка)
- …я и на SoC так хотел, ну да вы все наверняка помните :) Только на меньшем уровне иерархии — вместо каждого модуля памяти там блок M×N бит DRAM, вместо 4 ядер — сделать авторефреш «умным», чтобы он согласно программе что-то куда-то перенёс, Николай Коровин(123 знак., 13.02.2017 15:14)
- Здесь он упрется в потолок гораздо раньше, чем по Амдалу, т.к. шина памяти будет тормозить, а значительно ее расширить нельзя - мало пинов у чипа. Ксения(679 знак., 13.02.2017 03:22)
- …и не просто глупые, а ещё непереписываемые. «Много считать» можно и на шейдерах, а вот тварьчество похапешных школоло уже так не посчитаешь. - Николай Коровин(13.02.2017 02:42)