чому я не міг завантажити зображення з Google із python?


9

Код допоміг мені завантажити купу зображень з google. Раніше вона працювала кілька днів тому, і тепер раптом код зламається.

Код:

# importing google_images_download module 
from google_images_download import google_images_download  

# creating object 
response = google_images_download.googleimagesdownload()  

search_queries = ['Apple', 'Orange', 'Grapes', 'water melon'] 


def downloadimages(query): 
    # keywords is the search query 
    # format is the image file format 
    # limit is the number of images to be downloaded 
    # print urs is to print the image file url 
    # size is the image size which can 
    # be specified manually ("large, medium, icon") 
    # aspect ratio denotes the height width ratio 
    # of images to download. ("tall, square, wide, panoramic") 
    arguments = {"keywords": query, 
                 "format": "jpg", 
                 "limit":4, 
                 "print_urls":True, 
                 "size": "medium", 
                 "aspect_ratio": "panoramic"} 
    try: 
        response.download(arguments) 

    # Handling File NotFound Error     
    except FileNotFoundError:  
        arguments = {"keywords": query, 
                     "format": "jpg", 
                     "limit":4, 
                     "print_urls":True,  
                     "size": "medium"} 

        # Providing arguments for the searched query 
        try: 
            # Downloading the photos based 
            # on the given arguments 
            response.download(arguments)  
        except: 
            pass

# Driver Code 
for query in search_queries: 
    downloadimages(query)  
    print()

Вихідний журнал:

Номер предмета: 1 -> Назва предмета = Apple Оцінка ... Початок завантаження ...

На жаль, усі 4 не вдалося завантажити, оскільки деякі зображення не можна завантажити. 0 - це все, що ми отримали для цього фільтра пошуку!

Помилки: 0

Номер предмета: 1 -> Назва предмета = Оранжевий Оцінювання ... Початок завантаження ...

На жаль, усі 4 не вдалося завантажити, оскільки деякі зображення не можна завантажити. 0 - це все, що ми отримали для цього фільтра пошуку!

Помилки: 0

Номер предмета: 1 -> Назва предмета = Оцінка винограду ... Початок завантаження ...

На жаль, усі 4 не вдалося завантажити, оскільки деякі зображення не можна завантажити. 0 - це все, що ми отримали для цього фільтра пошуку!

Помилки: 0

Номер предмета: 1 -> Назва предмета = кавун Оцінка ... Початок завантаження ...

На жаль, усі 4 не вдалося завантажити, оскільки деякі зображення не можна завантажити. 0 - це все, що ми отримали для цього фільтра пошуку!

Помилки: 0

Це фактично створює папку, але в ній немає зображень.


1
Я не розумію, чому ця публікація отримала 2 антипатії?
Сай Крішнадас

1
У мене також така ж проблема. Це чудово працює за кілька днів до цього.
Аміт

Відповіді:



0

Я думаю, Google міняє DOM. Клас елементів = "rg_meta notranslate" більше не існує. Він змінено на class = "rg_i ..."


def get_soup(url,header):
    return BeautifulSoup(urllib2.urlopen(urllib2.Request(url,headers=header)),'html.parser')    

def main(args):
    query = "typical face"
    query = query.split()
    query = '+'.join(query)
    url = "https://www.google.co.in/search?q="+query+"&source=lnms&tbm=isch"
    headers = {}
    headers['User-Agent'] = "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"
    soup = get_soup(url, headers)
    for a in soup.find_all("img", {"class": "rg_i"}):
        wget.download(a.attrs["data-iurl"], a.attrs["data-iid"])


if __name__ == '__main__':
    from sys import argv
    try:
        main(argv)
    except KeyboardInterrupt:
        pass
    sys.exit()

Отже, як їх змінити?
Сай Кришнадас

0

Дійсно, випуск з’явився не так давно, вже є маса подібних номерів Github:

На жаль, офіційного рішення немає, поки що ви можете скористатися тимчасовим рішенням, яке було запропоновано під час обговорень.


-1

Причина цього не працює в тому, що Google змінив спосіб їхнього виконання, і тепер вам потрібна api_key, включена в рядок пошуку. В результаті таких пакунків, як-от google-images-завантаження, більше не працює, навіть якщо ви використовуєте версію 2.8.0, оскільки вони не мають заповнювача, щоб вставити рядок api_key, який потрібно зареєструвати в Google, щоб отримати 2500 безкоштовних завантажень на день.

Якщо ви готові платити 50 доларів на місяць або більше за доступ до сервісу з serpapi.com , один із способів зробити це - скористатися пакетом pip google-search-resultsта надати api_key як частину параметрів запитів.

params = {
           "engine" : "google",
           ...
           "api_key" : "secret_api_key" 
}

де ви самі надаєте ключ API, а потім телефонуєте:

client = GoogleSearchResults(params)
results = client.get_dict()

Це повертає рядок JSON із посиланням на всі URL-адреси зображення, а потім ви просто завантажуєте їх безпосередньо.


Де я можу отримати ключ API?
Сай Кришнадас
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.