Створення веб-сервісу геокодування / газетів?


14

Я хотів би написати веб-службу геокодування для генеалогії на Java. Оскільки це генеалогія, мені не потрібно опускатися до рівня вулиці. Мені потрібно лише спуститися в повіт.

Переглядаючи генеалогічні дані, неправильно написані імена є дуже поширеними. Люди також використовують багато нестандартних скорочень. Наприклад, округ Балтимор може виглядати так:

  1. Балтімор
  2. Округ Балтимор
  3. Baltimore Co
  4. Балтімор Cty

Відповіді:


10

Я не думаю, що це питання явно географічне, тому що вас цікавлять лише імена, тому ви, можливо, захочете задати його у Stack Overflow . Ви можете відповісти на своє запитання двома відомостями: штатом та виправленою назвою графства. Для виконання виправлень, ви, ймовірно, захочете використовувати відстань Левенштейна ( приклад та реалізація java ), щоб відповідати нечітких даних коригуваним значенням.


+1 Це, мабуть, правда. Левенштайн виглядає як гарне місце для початку, і схоже, що Постгрес навіть це підтримує. Спасибі.
Джей Аскрен

Я думаю, що поєднання відстані Левенштейна з даними Geonames ( geonames.org ) може допомогти мені. Спасибі.
Джей Аскрен

5

Службі геокодування потрібні дані географічної геометрії, асоційований газетер (для обробки альтернатив імен та імен) та користувальницький інтерфейс (для опосередкування пошуку). Для зворотного геокодера вам потрібно буде додати валідатор топології. Для Java відкритим кодом JTS Topology Suite був би природним вибором: http://www.vividsolutions.com/jts/jtshome.htm

Геометрії округів для Сполучених Штатів можна знайти за переписом: http://www.census.gov/geo/www/cob/co2000.html

Щоб розпочати роботу на газеті, Рада з географічних назв США має базу даних: http://geonames.usgs.gov/

Створення міцної бази даних та алгоритми плетіння, які переносять приблизні результати пошуку, є важкою частиною.


Алгоритми - це те, що я шукаю.
Джей Аскрен

Запитів щодо алгоритмів семантичної подібності може бути більше респондентів на головному сайті stackoverflow.
glennon


1

У Google є приємний API для геокодування , якщо ви можете дотримуватися їх умов надання послуг. Основну демонстрацію можна знайти тут .

Використання їх сервісу обмежується деякими обмеженнями, але результат - інтуїтивно зрозумілий, швидкий, точний та знайомий більшості користувачів. Це дозволить вам зосередитись на розробці генеалогічної частини вашої служби.


Мені б дуже хотілося приймати все в будинку, а не залежати від зовнішньої верхівки.
Джей Аскрен

Ви шукаєте ліцензований БД геокодування з відкритим кодом?
Адам Матан
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.