Можно выделить только комментарии, автоматически. Дальше agrep'ом смотреть по словарю и считать метрику, насколько похоже на человеческий язык (сумма расстояний Левенштейна для всех слов комментария где меньше) -- выбирать оптимальный вариант и заменять на него.