-
- И в чем разница на аппаратном уровне? Разница на уровне программы, и всего-то. Т.е. имея массив процессоров надо размножить одну и ту же программу на кучку процов. Чтобы каждый обрабатывал свой набор данных. И будет всполне себе вектор. Evgeny_CD(142 знак., 16.02.2012 16:34)
- Т.е. суть в способе написания программы и способе трансляции в код для проциков. А в чем в аппаратуре должны бытьотличия? - Evgeny_CD(16.02.2012 16:37)
- С педивикией фиг поспоришь :) Д.ARMоед(763 знак., 16.02.2012 17:38 - 17:46)
- У них там действительно мутно все декларировано. И POSIX, и какой-то непонятный язык "С с плюшками". Суть Вы описали верно - падение скорости при увеличении доступного процессору размера памяти с произвольным доступом. Решение тоже понятное - Evgeny_CD(123 знак., 16.02.2012 17:50)
- Обратная сторона медали -> Д.ARMоед(150 знак., 18.02.2012 10:53, ссылка)
- В первой ссылке народ показал, что некий набор алгоритмов AI распараллеливается почти идеально на набор от 2 до 64 ядер. Но вопрос - все ли это алгоритмы, и есть ли широко используемые на практике алгоритмы AI, которые хреново распараллеливаются? Evgeny_CD(227 знак., 18.02.2012 23:50)
- Видимо стоит изначально решать задачу в ключе, допускающем или векторизацию, или мапредьюс. Которые, в свою очередь, хорошо распараллеливаются на соответствующих архитектурах. Д.ARMоед(303 знак., 19.02.2012 17:37 - 17:49)
- +1 в части TDP: 5W на 256 ядер при 400 Мгц тактовой каждого - это сильно! - Evgeny_CD(19.02.2012 19:15)
- По причине ламерства в предметной области мой вопрос состоял в том, можно ли любую задачу AI разложить на то, что векторизуется и мапредьюсится? Или тем есть нечто, принципиально не распараллеливаемое? - Evgeny_CD(19.02.2012 19:12)
- (a+b)*c-d тут нечего распараллелить, если операнды - скалярные значения. Д.ARMоед(261 знак., 19.02.2012 20:58 - 21:17)
- Ну так поставить 2 скобки - и уже можно параллелить :) (a+b)*(c-d) Такое вообще хороший MAC блок за такт сделает, наверное :) Вообще статья интересная. Там грамотно сказано, что ключевое направление - диалоговая работа по распараллеливанию кода. Evgeny_CD(230 знак., 19.02.2012 22:31)
- Если человек понимает смысл залачи - уже хорошо. Д.ARMоед(621 знак., 19.02.2012 23:02)
- Ну так поставить 2 скобки - и уже можно параллелить :) (a+b)*(c-d) Такое вообще хороший MAC блок за такт сделает, наверное :) Вообще статья интересная. Там грамотно сказано, что ключевое направление - диалоговая работа по распараллеливанию кода. Evgeny_CD(230 знак., 19.02.2012 22:31)
- MapReduce -> --> даже я отчасти понял, что это такое. - Evgeny_CD(19.02.2012 19:13, ссылка, ссылка)
- (a+b)*c-d тут нечего распараллелить, если операнды - скалярные значения. Д.ARMоед(261 знак., 19.02.2012 20:58 - 21:17)
- А зачем вам посторонний суперкомпьютер? Это же вещь индивидуальная, сразу под две разноплановых задачи не подойдет. pin(225 знак., 19.02.2012 12:47)
- Видимо стоит изначально решать задачу в ключе, допускающем или векторизацию, или мапредьюс. Которые, в свою очередь, хорошо распараллеливаются на соответствующих архитектурах. Д.ARMоед(303 знак., 19.02.2012 17:37 - 17:49)
- В первой ссылке народ показал, что некий набор алгоритмов AI распараллеливается почти идеально на набор от 2 до 64 ядер. Но вопрос - все ли это алгоритмы, и есть ли широко используемые на практике алгоритмы AI, которые хреново распараллеливаются? Evgeny_CD(227 знак., 18.02.2012 23:50)
- Обратная сторона медали -> Д.ARMоед(150 знак., 18.02.2012 10:53, ссылка)
- У них там действительно мутно все декларировано. И POSIX, и какой-то непонятный язык "С с плюшками". Суть Вы описали верно - падение скорости при увеличении доступного процессору размера памяти с произвольным доступом. Решение тоже понятное - Evgeny_CD(123 знак., 16.02.2012 17:50)
- С педивикией фиг поспоришь :) Д.ARMоед(763 знак., 16.02.2012 17:38 - 17:46)
- Т.е. суть в способе написания программы и способе трансляции в код для проциков. А в чем в аппаратуре должны бытьотличия? - Evgeny_CD(16.02.2012 16:37)
- И в чем разница на аппаратном уровне? Разница на уровне программы, и всего-то. Т.е. имея массив процессоров надо размножить одну и ту же программу на кучку процов. Чтобы каждый обрабатывал свой набор данных. И будет всполне себе вектор. Evgeny_CD(142 знак., 16.02.2012 16:34)