...делать нужно так, как нужно. А как ненужно - делать не нужно (С) Винни-Пух :)
- 
	- OpenCL - это софт, меня же интересует железо, способное ускорять вычисления с плавающей точкой. Смысл вашего поста сводится к тому, что кроме видеокарты другой альтернативы нет, тогда как мне охота, чтобы такая альтернатива была. :) - Ксения(15.10.2016 20:07)
			- ну да, софт, но позволяющий вроде без особого шаманства замутить вычисления на видеокартах (даже бюджетного игрового сегмента) и вроде как по скорости арифметики в плавучке оно обгоняет CPU в разы, а в целочисленной, так в десятки раз. При Вашей  Adept(2290 знак., 15.10.2016 21:01 - 21:11, ссылка)
					- Не хочу с вами спорить, поскольку в CUDA и OpenCL я не вникала, но причина, по которой я сделала ставку на процессор, такова - сама элементарная операция умножения с накоплением занимает всего один такт процессорного времени, тогда как остальное  Ксения(393 знак., 15.10.2016 21:33 - 21:36)
							- здрасте-приехали. Насколько мне известно, для GPGPU вычислений используется локальная память видеокарты (весьма быстрая, кстати). т.е.  Adept(1634 знак., 15.10.2016 22:37 - 22:53)
									- Когда данные хранятся в памяти видеокарты, то тогда и компилятор нужен для видеопроцессора, чтобы писать для него программу, выполняемую ТАМ.  Ксения(1177 знак., 16.10.2016 10:47)
											- анализ матрицы нельзя свести к параллельному алгоритму? - Mahagam(16.10.2016 11:36)
													- Это не важно, а важным является вопрос о том, кто оценивает результаты предыдущего шага и решает, что делать на следующем шаге. Если это решает видеокарта, то и сам программный алгоритм должен быть в нее вложен, и тогда задача выливается в  Ксения(533 знак., 16.10.2016 12:13)
															- то что вы называете "программированием видеокарты" - по большей части сводится к написанию слэдующих вещей: Mahagam(961 знак., 16.10.2016 13:28)
 
 
- Это не важно, а важным является вопрос о том, кто оценивает результаты предыдущего шага и решает, что делать на следующем шаге. Если это решает видеокарта, то и сам программный алгоритм должен быть в нее вложен, и тогда задача выливается в  Ксения(533 знак., 16.10.2016 12:13)
															
 
- анализ матрицы нельзя свести к параллельному алгоритму? - Mahagam(16.10.2016 11:36)
													
 
- Когда данные хранятся в памяти видеокарты, то тогда и компилятор нужен для видеопроцессора, чтобы писать для него программу, выполняемую ТАМ.  Ксения(1177 знак., 16.10.2016 10:47)
											
 
- здрасте-приехали. Насколько мне известно, для GPGPU вычислений используется локальная память видеокарты (весьма быстрая, кстати). т.е.  Adept(1634 знак., 15.10.2016 22:37 - 22:53)
									
 
- Не хочу с вами спорить, поскольку в CUDA и OpenCL я не вникала, но причина, по которой я сделала ставку на процессор, такова - сама элементарная операция умножения с накоплением занимает всего один такт процессорного времени, тогда как остальное  Ксения(393 знак., 15.10.2016 21:33 - 21:36)
							
 
- ну да, софт, но позволяющий вроде без особого шаманства замутить вычисления на видеокартах (даже бюджетного игрового сегмента) и вроде как по скорости арифметики в плавучке оно обгоняет CPU в разы, а в целочисленной, так в десятки раз. При Вашей  Adept(2290 знак., 15.10.2016 21:01 - 21:11, ссылка)
					
 
- OpenCL - это софт, меня же интересует железо, способное ускорять вычисления с плавающей точкой. Смысл вашего поста сводится к тому, что кроме видеокарты другой альтернативы нет, тогда как мне охота, чтобы такая альтернатива была. :) - Ксения(15.10.2016 20:07)