Могу сказать как это было в STR91x. Как раз для дисплея 133*64 и делал на DMA.
Вообщем применение DMA не уменьшило ни на грам нагрузку проца.
Накладные расходы на инициализацию DMA таковы, что посылать несколько байт по DMA невыгодно.
Тогда сделал алгоритм который определяет как посылать - по прерываниям или по DMA.
Но фигня в том, что при использовании оптимизационных техник GUI, как memory device для устранения фликера большие блоки данных передаются сравнительно редко, передаеться только разница.
И от DMA на I2C похоже действительно нет никакого кайфа.