...делать нужно так, как нужно. А как ненужно - делать не нужно (С) Винни-Пух :)
-
- Не хочу с вами спорить, поскольку в CUDA и OpenCL я не вникала, но причина, по которой я сделала ставку на процессор, такова - сама элементарная операция умножения с накоплением занимает всего один такт процессорного времени, тогда как остальное Ксения(393 знак., 15.10.2016 21:33 - 21:36)
- здрасте-приехали. Насколько мне известно, для GPGPU вычислений используется локальная память видеокарты (весьма быстрая, кстати). т.е. Adept(1634 знак., 15.10.2016 22:37 - 22:53)
- Когда данные хранятся в памяти видеокарты, то тогда и компилятор нужен для видеопроцессора, чтобы писать для него программу, выполняемую ТАМ. Ксения(1177 знак., 16.10.2016 10:47)
- анализ матрицы нельзя свести к параллельному алгоритму? - Mahagam(16.10.2016 11:36)
- Это не важно, а важным является вопрос о том, кто оценивает результаты предыдущего шага и решает, что делать на следующем шаге. Если это решает видеокарта, то и сам программный алгоритм должен быть в нее вложен, и тогда задача выливается в Ксения(533 знак., 16.10.2016 12:13)
- то что вы называете "программированием видеокарты" - по большей части сводится к написанию слэдующих вещей: Mahagam(961 знак., 16.10.2016 13:28)
- Это не важно, а важным является вопрос о том, кто оценивает результаты предыдущего шага и решает, что делать на следующем шаге. Если это решает видеокарта, то и сам программный алгоритм должен быть в нее вложен, и тогда задача выливается в Ксения(533 знак., 16.10.2016 12:13)
- анализ матрицы нельзя свести к параллельному алгоритму? - Mahagam(16.10.2016 11:36)
- Когда данные хранятся в памяти видеокарты, то тогда и компилятор нужен для видеопроцессора, чтобы писать для него программу, выполняемую ТАМ. Ксения(1177 знак., 16.10.2016 10:47)
- здрасте-приехали. Насколько мне известно, для GPGPU вычислений используется локальная память видеокарты (весьма быстрая, кстати). т.е. Adept(1634 знак., 15.10.2016 22:37 - 22:53)
- Не хочу с вами спорить, поскольку в CUDA и OpenCL я не вникала, но причина, по которой я сделала ставку на процессор, такова - сама элементарная операция умножения с накоплением занимает всего один такт процессорного времени, тогда как остальное Ксения(393 знак., 15.10.2016 21:33 - 21:36)