Хороші ресурси на алгоритмах геокодування


19

Чи знаєте ви якісь хороші ресурси щодо алгоритмів геокодування?

Мене особливо цікавлять розбір запитів адрес, включаючи відповідність і зважування частин запиту, обробку помилок із написанням помилок та варіацій, а також детальну інформацію про фізичне зберігання даних (наприклад, схеми прямих запитів реляційних баз даних, підходи до індексації даних тощо). .

Я вивчив деякі документи про геокодування ArcGIS 10, але вони трохи торкаються фактичних деталей реалізації. Детальна документація інших високоякісних виробничих реалізацій також може бути корисною. Чим технічніше, тим краще. Папери теоретичного алгоритму також чудові.

Спасибі.

Відповіді:


14

Від тексту до географічних координат: поточний стан геокодування

Даніель У. Голдберг, Джон П. Вілсон та Крейг А. Ноблок Анотація: У цій статті представлено опис сучасного досвіду в практиці геокодування за допомогою міждисциплінарного історичного огляду існуючої літератури. Ми досліджуємо розвивається концепцію геокодування та основні компоненти процесу. Обговорюються часто зустрічаються джерела помилок та невизначеності, а також існуючі заходи, які використовуються для їх кількісної оцінки. Представлено вивчення загальних підводних каменів та постійних проблем у процесі геокодування та описано традиційні методи їх подолання.

10.1.1.119.714.pdf

PDF (сторінка 34 і далі) http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.119.714&rep=rep1&type=pdf


Я вважаю, що у вас неправильне посилання, citeseerx.ist.psu.edu/viewdoc/…
Енді Ш

@thanks 10.1.1.119.714.pdf - це правильний оновлений пост - інша умова іменування була б кращою.
Mapperz

6

Документ, на який посилається Mapperz, дуже хороший і містить багато цитат, які, мабуть, будуть цікаві, але я не думаю, що вони дуже добре працюють із описом відповідності рядків та його значення для процесу геокодування. Вони коротко згадують Soundex , але Soundex - це не єдиний варіант і навіть не найкращий варіант для адрес IMO. Вони перерахували досить багато цитат, які стосуються цієї теми, тож ці документи будуть цікаві для вас.

Цей потік на сайті обміну статистикою розповідає про нечітке зіставлення двох наборів рядків, і всі ті самі методи застосовуються при збігу адрес. Особливо я думаю, що використання відстаней редагування має більше сенсу, ніж Soundex, особливо з деталями адреси, які не мають аналога Soundex. Розрахувати відстань Левенштейна між двома струнами не так вже й складно, і їх безліч прикладів, що плавають по Інтернету ( ось один у Python).

Я щойно провів минулу годину, намагаючись знайти, як ESRI реалізує свою орфографічну чутливість та різні показники кандидатів та матчів. Я не знайшов нічого, крім простих описів (найкращі з тих, що я знайшов у цьому PDF та 9.3 розділі довідки в Інтернеті ). Тож якщо хтось може вказати мені на більш детальну документацію, я би вдячний, як і ОП.



3

Список розсилки GEOREFERENCING, наданий JISC Великобританії https://www.jiscmail.ac.uk/cgi-bin/webadmin?A0=GEOREFERENCING

Мій блог (розділ геокодування) містить випадкові публікації про геокодування та роздільну здатність топоніму (його неструктурований двоюрідний брат): http://bit.ly/lQ0Sjs


Також: OpenStreetMap GEOCODING списки розсилки списки.openstreetmap.org/listinfo/geocoding
Jochen L.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.