Ви використовуєте python 2.x або 3.0?
Якщо ви використовуєте 2.x, спробуйте перетворити рядок регулярних виразів на рядок unicode-escape, із символом 'u'. Оскільки це регулярний вираз, є гарною практикою зробити ваш рядок регулярних виразів необробленим рядком із символом 'r'. Крім того, зайве розміщення всього малюнка в дужках.
re.sub(ur'[\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+', '', ...)
http://docs.python.org/tutorial/introduction.html#unicode-strings
Редагувати:
Також хорошою практикою є використання прапора re.UNICODE / re.U / (? U) для регулярних виразів Unicode, але це впливає лише на псевдоніми класів символів, такі як \ w або \ b, з яких цей шаблон не використовує, і тому не буде постраждати від.
u
таr
префікси. Це досить круто!