Ваше упрямство достойно лучшего применения. Именно на GPU (CUDA, OpenCL) и именно матричные операции и делают нынче все кому это надо. Прежде чем растекаться мысью по древу вам следовало бы поучить матчасть в этом вопросе.
Это моё личное предвзятое мнение. Любое совпадение с реальностью является случайным и непреднамеренным.