Суть прекрасно понятна и она одинакова для многих языков где внедрялась поддержка unicode. Просто python недостаточно зрелый. Другие (Tcl) на эти грабли наступали десятилетие назад или чуть меньше (Perl). И не надо читать всякую чушь в интернетах. Суть проста -- тяжёлое восьмибитное наследство (когда char ещё не wchar_t) во-первых и во-вторых на ТАКИЕ глюки в более приличных аналогах обычно совсем уж болт не забивают и добавляют какие-нибудь костыли (perl и use utf8) чтоб как-то работало. Python не достаточно хорошо поддерживается авторами. Фигли смеяться, тут плакать надо.