У мене є рядок, який виглядає так:
6Â 918Â 417Â 712
Очевидний спосіб вирізання цієї рядки (як я розумію Python) - це просто сказати, що рядок знаходиться в змінній, що називається s
, ми отримуємо:
s.replace('Â ', '')
Це повинно зробити трюк. Але, звичайно, він скаржиться, що не ASCII-символ '\xc2'
у файлі blabla.py не кодується.
Я ніколи не міг зрозуміти, як перемикатися між різними кодуванням.
Ось код, він дійсно такий самий, як вище, але зараз це в контексті. Файл зберігається у форматі UTF-8 у блокноті та має такий заголовок:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
Код:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
Це не далі s.replace
...
u