Я отримую дані Twitter за допомогою інструменту Python і скидаю їх у форматі JSON на мій диск. Я помітив ненавмисне екранування всього рядка даних для твіту, укладеного в подвійні лапки. Крім того, усі подвійні лапки фактичного форматування JSON обробляються зворотною рискою рискою.
Вони виглядають так:
"{\" created_at \ ": \" пт 08 серпня 11:04:40 +0000 2014 \ ", \" id \ ": 497699913925292032,
Як мені цього уникнути? Вона повинна бути:
{"created_at": "Пт, 8 серпня 11:04:40 +0000 2014" .....
Мій код виведення файлів виглядає так:
with io.open('data'+self.timestamp+'.txt', 'a', encoding='utf-8') as f:
f.write(unicode(json.dumps(data, ensure_ascii=False)))
f.write(unicode('\n'))
Ненавмисне екранування викликає проблеми при читанні у файлі JSON на наступному етапі обробки.