Я використовую BeautifulSoup та розбираю деякі HTML.
Я отримую певні дані з кожного HTML (використовую для циклу) і додаю ці дані до певного списку.
Проблема полягає в тому, що деякі HTML-файли мають різний формат (і в них немає даних, які я хочу в них) .
Отже, я намагався використовувати обробку винятків і додавати значення null
списку (я повинен це зробити, оскільки послідовність даних важлива.)
Наприклад, у мене є такий код, як:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
а деякі з посилань не мають жодного <dd class='title'>
, тому я хочу додати рядок null
до списку.
З'являється помилка:
list index out of range.
Що я намагався - це додати такі рядки:
if not dlist[1]:
newlist.append('null')
continue
Але це не виходить. Він все ще показує помилку:
list index out of range.
Що мені робити з цього приводу? Чи варто використовувати обробку виключень? чи є простіший спосіб?
Будь-які пропозиції? Будь-яка допомога була б справді чудовою!
None
явно чистіше, ОП хоче'null'
.