TypeError: потрібний об’єкт, подібний до байтів, не "str" ​​у python та CSV


173

TypeError: потрібен об'єкт, подібний до байтів, а не 'str'

отримання вище помилки під час виконання нижче коду python для збереження даних таблиці HTML у файлі Csv. не знаю, як отримати rideup.pls допоможіть мені.

import csv
import requests
from bs4 import BeautifulSoup

url='http://www.mapsofindia.com/districts-india/'
response=requests.get(url)
html=response.content

soup=BeautifulSoup(html,'html.parser')
table=soup.find('table', attrs={'class':'tableizer-table'})
list_of_rows=[]
for row in table.findAll('tr')[1:]:
    list_of_cells=[]
    for cell in row.findAll('td'):
        list_of_cells.append(cell.text)
    list_of_rows.append(list_of_cells)
outfile=open('./immates.csv','wb')
writer=csv.writer(outfile)
writer.writerow(["SNo", "States", "Dist", "Population"])
writer.writerows(list_of_rows)

вище останнього рядка.



привіт - я намагався запустити це на своєму ATOM на MX-Linux - але я повертаю це: „Відкликання (останній останній дзвінок): Файл„ /home/martin/.atom/python/examples/bs_gumtree_pl.py ", рядок 20, в <module> Writer.writerows (list_of_rows) UnicodeEncodeError: 'ascii' кодек не може кодувати символ u '\ xa0' в позиції 0: порядковий не знаходиться в діапазоні (128) [Закінчено в 2.015s] - добре мені цікаво, що продовжується тут !? люблю почути від вас
нуль

Відповіді:


332

Ви використовуєте методологію Python 2 замість Python 3.

Змінити:

outfile=open('./immates.csv','wb')

До:

outfile=open('./immates.csv','w')

і ви отримаєте файл із таким результатом:

SNo,States,Dist,Population
1,Andhra Pradesh,13,49378776
2,Arunachal Pradesh,16,1382611
3,Assam,27,31169272
4,Bihar,38,103804637
5,Chhattisgarh,19,25540196
6,Goa,2,1457723
7,Gujarat,26,60383628
.....

У Python 3 csv приймає вхід у текстовому режимі, тоді як у Python 2 - у двійковому режимі.

Відредаговано, щоб додати

Ось код, який я запустив:

url='http://www.mapsofindia.com/districts-india/'
html = urllib.request.urlopen(url).read()
soup = BeautifulSoup(html)
table=soup.find('table', attrs={'class':'tableizer-table'})
list_of_rows=[]
for row in table.findAll('tr')[1:]:
    list_of_cells=[]
    for cell in row.findAll('td'):
        list_of_cells.append(cell.text)
    list_of_rows.append(list_of_cells)
outfile = open('./immates.csv','w')
writer=csv.writer(outfile)
writer.writerow(['SNo', 'States', 'Dist', 'Population'])
writer.writerows(list_of_rows)

20
Для використання з csvмодулем Python 3 openтакож повинен мати newline=''параметр [ref ]
Марк Толонен

1
Змініть рядок 'wb' на 'w' працює для мене. Велике спасибі
Loc Huynh

Якщо ви використовуєте буфер, дивіться відповідь vinyll !
handras

привіт - я спробував код - і повернув це: `Traceback (останній дзвінок останній): Файл" /home/martin/.atom/python/examples/bs_gumtree_pl.py ", рядок 20, в <module> UnicodeEncodeError : кодек "ascii" не може кодувати символ u '\ xa0' в позиції 0: порядковий не знаходиться в діапазоні (128) [Закінчено в 1.415s] `я не маю клею, що тут відбувається
нуль

21

У мене була така ж проблема з Python3. Мій код записувався io.BytesIO().

Заміна на io.StringIO()вирішені.


трапляється і зі мною струнних
thebeancounter

Одне врахування: io.StringIO()це жадібність пам’яті та може бути головним болем при великих файлах.
Флавіо

1
file = open('parsed_data.txt', 'w')
for link in soup.findAll('a', attrs={'href': re.compile("^http")}): print (link)
soup_link = str(link)
print (soup_link)
file.write(soup_link)
file.flush()
file.close()

У моєму випадку я використовував BeautifulSoup для написання .txt з Python 3.x. Це було те саме питання. Так само, як сказав @tsduteba, змініть "wb" у першому рядку на "w".


Даючи відповідь, бажано дати пояснення щодо того, ЧОМУ ваша відповідь . У чому випадку ця відповідь відрізняється від прийнятої відповіді?
Стівен Рауч

@StephenRauch Дякую за коментарі. Я новачок тут і лише почав вивчати Python кілька тижнів тому. Я спробую дати кращу відповідь у майбутньому.
Ян Лі

Ви можете відредагувати цю публікацію та додати більше деталей. Натисніть кнопку редагування внизу та зліва від публікації.
Стівен Рауч

@StephenRauch Дякую за поради!
Ян Лі


1

Ви відкриваєте файл csv у двійковому режимі, так і має бути 'w'

import csv

# open csv file in write mode with utf-8 encoding
with open('output.csv','w',encoding='utf-8',newline='')as w:
    fieldnames = ["SNo", "States", "Dist", "Population"]
    writer = csv.DictWriter(w, fieldnames=fieldnames)
    # write list of dicts
    writer.writerows(list_of_dicts) #writerow(dict) if write one row at time
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.