Я працюю в туристичній індустрії архітектором програмного забезпечення / проектом, який керує саме тим проектом, який ви описуєте - у нашому регіоні ми працюємо безпосередньо з постачальниками, але для вихідних ми підключаємося до кількох агрегаторів.
Щоб відповісти на ваше запитання ... деякі дані у вас є, деякі ви отримуєте різними способами, а деякі вам доводиться катувати і крутити, поки вони не зізнаються.
Який ваш кут?
Запитання, які ви повинні задати, такі ... Ви хочете продавати рекламу, як на байдарках, або робити скорочення, як Expedia? Ви шукаєте чи продаєте туристичні послуги? Ви націлюєтесь на нішу (наприклад, просто авіаперевезення) або все (проживання, авіакомпанії, прокат автомобілів, додаткові послуги, такі як транспорт / екскурсії / конференції тощо)? Ви націлюєтесь на регіон (США чи частину США) або світ? Наскільки глибоко ти заглиблюєшся - ти просто показуєш кілька сайтів на одному екрані, або ти об’єднуєш різні послуги разом і динамічно їх упаковуєш?
Отримання даних
Якщо ви збираєтеся використовувати бізнес-модель Kayak, технічно вам не потрібен дозвіл сайту ... але багато сайтів мають партнерські програми з IFrames або іншими простими способами спрямувати клієнта на свій сайт. Позитивом є те, що вам не доведеться мати справу з платежами / скаргами та самими мандрівниками. Що стосується мінусів ... якщо ви хочете самостійно порівняти ціни і представити користувачеві найдешевший варіант, вам доведеться інтегрувати на більш глибокому рівні, а це означає API та веб-скрапінг.
Що стосується вишкрібання павутини ... уникайте цього. Це відстій. Дійсно. Тільки не роби цього. Повірте мені на це. Наприклад, деякі речі, такі як лоукостери, яких ви не можете отримати без вискоблювання веб-сторінок. Бюджетні авіакомпанії живуть із послуг із доданою вартістю. Якщо користувач не бачить свій веб-сайт, він не продає зайвих речей і нічого не заробляє. Тому у них немає афілійованих осіб, вони не пропонують API і майже постійно змінюють макет свого сайту. Однак є компанії, які заробляють на життя, витираючи веб-сайти lowcoster та обертаючи їх у приємні API. Якщо ви можете собі їх дозволити, ви можете дати своїм користувачам порівняння витрат на дешеві рейси, і це величезно.
З іншого боку, існують "звичайні" оператори, які пропонують API. Дістатися до авіакомпаній не така велика проблема, оскільки всі вони об’єднані в рамках IATA ; в основному, ви купуєте в IATA, і IATA розподіляє гроші перевізникам. Однак ви, мабуть, не хочете підключатися безпосередньо до мережі оператора. У них сьогодні є веб-сервіси та SOAP, але повірте мені, коли я кажу, що існують протоколи SOAP, які є просто шалено тонкими обгортками навколо текстової підказки, за допомогою яких ви можете взаємодіяти з мейнфреймом за протоколом у стилі 80-х (подумайте про Unix запит, де вам виставляється рахунок за команду; і для виконання одного пошуку потрібно близько 20 команд). Ось чому ви, мабуть, хочете підключитися до когось трохи нижчого за харчовим ланцюгом, з кращим API.
Таким чином, авіакомпанії знаходяться в обох крайностях кривої Гаусса; з одного боку - окремі постачальники, а з іншого - централізовані системи, де ви впроваджуєте один API, і ви можете літати в будь-яку точку світу. Проживання та решта товарів для подорожей між ними. Є кілька великих гравців, які об'єднують готелі, і маса невеликих постачальників з великою кількістю агрегаторів, які охоплюють лише частину спектру. Наприклад, ви можете взяти в оренду маяк, і це навіть не так дорого - але ви не зможете порівняти ціни на різні маяки в одному місці.
Якщо ви любите бізнес-модель на байдарках, ви, мабуть, закінчите скрабувати веб-сайти. Якщо ви хочете інтегрувати різні провайдери, ви часто будете працювати з API, деякі з яких досить непогані, а більшість з них терпимі. Я не працював з RSS, але немає великої різниці між RSS та веб-скрапінгом. Є також четвертий варіант, про який не згадується у відповіді Джефа ... той, де ви отримуєте свої дані щоночі, наприклад .CSV-файли через FTP та подібні.
Життя відстій (міні-рант)
І тоді є складність. Чим більше цінності ви хочете додати, тим більше складності вам доведеться обробляти. Чи можете ви шукати помешкання, де можна розмістити домашніх тварин? Хостел, який знаходиться менш ніж за 5 км від центру міста? Чи поєднуєте ви рейси, і чи можете ви гарантувати, що у мандрівника буде достатньо часу, щоб дістатися з одного аеропорту до іншого ... чи можете ви продати транспорт заздалегідь? Відомий віолончеліст не хоче розлучатися зі своєю дорогоцінною віолончеллю 18 століття; ти можеш продати йому інше місце для віолончелі (так, не вигадуючи цього)?
Хочете порівняти ціни? Звичайно, вартість 30 євро за ніч. Але ви можете або отримати одне двоспальне на 30, і одне одномісне на 20, або ви можете отримати одне додаткове ліжко на двоспальне та отримати знижку 70% для третьої особи. Але тільки якщо це дитина до 12 років; наші додаткові ліжка не для дорослих. І ви не отримаєте ціну за додаткове ліжко в результатах пошуку - лише тоді, коли розрахуєте остаточну ціну.
І навіть не давайте мені починати з динамічної упаковки. Хочете продати житло + оренда автомобіля? Нема проблем; інтегруйтеся з двома різними постачальниками, і ви йдете ... вручну оновлюючи список місць у місті (від постачальника автомобілів, що займаються прокатом автомобілів) відповідно до готелів (від постачальника послуг розміщення, який надає вам лише місто для кожного готелю). Звичайно, за умови, що ви вже зіставили перелік міст із двох, оскільки не існує міжнародного стандарту кодів міст.
На відміну від багатьох інших галузей, що мають багато продуктів, туристична галузь має багато дуже складних продуктів. Amazon це легко; продавати книги і продавати картоплю - це те саме; Ви навіть можете відправити їх в одній коробці. Вони легко поєднуються і не збираються з багатьох деталей. :)
PS Посилання на цікаву недавню тему новин Hacker з деякою внутрішньою інформацією щодо польотів . Нещодавно PPS натрапив на великий, хоч і досить старий допис у блозі про протокол NDC IATA з оглядом того, як пов'язана туристична індустрія, та уроком історії, як це сталося .