Ваше упрямство достойно лучшего применения. Именно на GPU (CUDA, OpenCL) и именно матричные операции и делают нынче все кому это надо. Прежде чем растекаться мысью по древу вам следовало бы поучить матчасть в этом вопросе.
надо придумать объяснение этому мудизму, иначе рехнуться можно