Якість геокодування: Nominatim vs. PostGIS Geocoder vs. Geocoder :: US 2.0


14

Іноді мені потрібно геокодувати >> 500 000 американських вулиць (відсутні функції та перехрестя). Я хотів би створити локальну службу геокодування для обробки цих масових геокодів.

У минулому я локально використовував локальний Geocoder :: США 2.0 . Початковий бенчмаркінг дає розумну точність щодо геокодованих адрес Google, особливо коли я не покладаюсь на аналізатор Ruby і я чітко передаю елементи адреси геокодеру.

Я також багато читав про GeoCoder PostGIS . Оскільки мої дані вже є у PostGIS, це звучить привабливо, але я не створив їх локально, щоб випробувати їх.

Також хтось рекомендував спробувати Номінатім місцево. Я не знаю багато про це, за винятком того, що це не тигр (наскільки я можу сказати), і мені цікаво, чи отримаю більш надійні результати.

Моє запитання до тих, хто має досвід роботи з вищезазначеними рішеннями: як порівнює точність трьох? Зокрема, що забезпечує найбільш послідовно надійні геокоди для адрес вулиць у США? Я не надто переймаюся швидкістю або складністю налаштування.

Відповіді:


14

У мене не було можливості перевірити геокодери США Nominatim та Geocoder. Я розумію, що Geocoder і Nominatim не можуть працювати безпосередньо в базі даних, що для мене є великим недоліком, оскільки це ускладнює їх використання в таких речей, як тригери або для пакетного оновлення безпосередньо в базі даних.

Геокодер PostGIS, являючи собою чистий набір PostGIS / postgresql функцій plpgsql, повністю працює в базі даних. Я б очікував, що результати геокодера США та PostGIS будуть аналогічні, і те, що я перевірив, використовуючи веб-речі, вони є. Google трохи кращий, оскільки вони використовують переваги імен.

Я думаю, що Номінатум, оскільки він використовує дані OSM, використовує дані тигра опосередковано, оскільки імпорт ОСМ для США значною мірою надходить з TIGER, а користувачі внесли виправлення. Я не впевнений, на який зараз урожай (рік) Tiger OSM. Відіграючи з веб-інтерфейсами в Інтернеті, він також використовує топоніми та має цікавий поворот у тому, що дозволяє задати рівень масштабування геокодування, що дозволяє прискорити геокодування шляхом встановлення необхідної точності масштабування.

Повне розкриття інформації - я багато працював над PostGIS Geocoder і написав онлайн-посібник для цього. Я скажу вам про помилку, над якою я працюю, - це те, що я думаю, що точка точки, яку вона інтерполює, знаходиться на неправильній стороні вулиці. Я працюю над тим, щоб це виправити. Якщо ви могли б менше піклуватися про те, який бік вулиці (або принаймні іноді), це може бути для вас проблемою.

Мабуть, варто тестувати онлайн-версії, порівнюючи деякі результати адрес: наприклад, nominatim ви можете протестувати тут: http://open.mapquestapi.com/nominatim/v1/search.php

Для моїх випадків використання я виявив, що нечітка перевірка номінату є не такою хорошою, як у PostGIS Geocoder. Наприклад, моя адреса вуличної суєти (поштова адреса) - 1 Девоншир Плейс, Бостон, MA. PostGIS повертає відповідь, близький, наскільки я пам’ятаю, Google повертає відповідь, але я не можу змусити Номінатіма повернути відповідь. Якщо чесно, навіть бостонські записи про посилки не мають поняття, де це, і потрапляє до списку про посилки як Вашингтон-стріт. PostGIS може знайти його, оскільки він робить різні рівні перевірки та перехресть перехресних вулиць тощо. Я перевіряв інші випадки, коли я навмисно набираю поштовий індекс неправильно чи щось таке, а PostGIS повертається з точним набором варіантів. Google теж робить.


Коментар Additonal: Можливо, варто тестувати онлайн-версії, порівнюючи деякі результати адрес: наприклад, nominatim ви можете протестувати тут: open.mapquestapi.com/nominatim/v1/search.php
LR1234567

Дякуємо за відповідь! Я буду робити тестування протягом наступного тижня або близько того, але я був вражений кодером PostGIS Tiger поки що.
danpelota

Зрозуміло, що забороняється
danpelota

tigergeocoder.com, використовуючи дані TIGER 2013, готовий запустити власний екземпляр сервера в хмарі Amazon EC2 та геокодувати 1 000 000+ на день. Як ви вже згадували, PostGIS також завантажив Zillow Neighborhoods і повертає коди FIPS для адресних частин. API REST схожий на Google, але власний сервер, квоти не потрібні.
Біба

Номінатім працює швидко і має тенденцію бути точнішим у 2019 році, попередньо нові дані про тигра. Він не оцінює райони, і вгадування адреси просто краще.
Ендрю Скотт Еванс

-1

Технічно ви можете складати бази даних Tiger і OSM в один гігантський сервер і створювати їх всередині Nominatum OSM. Тигр можна імпортувати легко, і він доповнює сервер OSM.

Хто б, якість даних, які ви отримаєте, не буде на даху. OSM бракує точності для адрес вулиць у США. У деяких випадках я бачив це далеко за 90 миль від початкової цілі.

База даних Тигра також не є точною через алгоритм інтерполяції, призначений для того, щоб передбачити розташування номерів вулиць. Загалом вони змістять фактичну ціль від 300 футів до декількох миль.

Я думаю, що вам потрібно оцінити час та розміщення ресурсів, якщо будувати власний геокодер проти використання комерційного. З комерційним ви отримаєте місця на даху і нічого не турбуєтесь. Ціни на 500 000 доларів становитимуть від 600 до 800 доларів у різних постачальників.


2
Яка відповідь стосується вашої компанії? Схоже, ви включаєте підпис із посиланням на ваш веб-сайт, маючи на увазі, в цьому випадку, непотрібну відмову, і тому я його редагую. У будь-якому випадку, будь ласка, не включайте посилання в будь-яку відмову від відповідальності.
PolyGeo
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.