Вартість авіаперевезень - Який аналіз слід використовувати для виявлення конкурентної поведінки та цінових співвідношень?


12

Я хочу дослідити поведінку авіакомпаній щодо встановлення цін - зокрема, як авіакомпанії реагують на ціни конкурентів.

Як я б сказав, мої знання про більш складний аналіз досить обмежені, я робив здебільшого всі основні методи, щоб зібрати загальний вигляд даних. Сюди входять прості графіки, які вже допомагають виявити подібні зразки. Я також використовую SAS Enterprise 9.4.

Однак я шукаю підхід на основі більшої кількості.

Набір даних

Набір (само) зібраних даних, який я використовую, містить близько 54 000 тарифів. Усі тарифи збиралися протягом 60-денного часового вікна, щодня (щовечора о 00:00).Спосіб збору

Отже, кожна вартість проїзду протягом цього часового вікна відбувається в разів залежно від наявності тарифу, а також дати вильоту рейсу, коли він проходить до дати збору тарифу. (Ви не можете збирати вартість проїзду на рейс, коли дата відправлення рейсу минула)н

Неформатоване, що в основному виглядає так: (підроблені дані)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

"DaysBeforeDeparture" обчислюється через деЯ=с-c

  • I & інтервал (дні до відправлення)
  • s та дата проїзду (виліт рейсу)
  • c & дата сплати тарифу

Ось приклад згрупованих даних, встановлених I (DaysBeforeDep.) (Підроблені дані!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

Що я придумав поки що

Дивлячись на лінійні графіки, я вже можу оцінити, що кілька рядків матимуть високий коефіцієнт кореляції. Отже, я спробував спочатку використати кореляційний аналіз на згрупованих даних. Але це правильний шлях? В основному я намагаюсь зараз корелювати середні показники, а не окремі ціни? Чи є інший спосіб?

Я не впевнений, яка регресивна модель підходить сюди, оскільки ціни не рухаються в будь-якій лінійній формі і здаються нелінійними. Чи потрібно мені пристосувати модель до кожного цінового розвитку авіакомпанії

PS: Це довга текстова стінка. Якщо мені потрібно щось уточнити, дайте мені знати. Я новачок у цьому підрозділі.

Хтось підказку? :-)

Відповіді:


9

Слово попередження колишнього аналітика з управління доходами авіакомпанії: при такому підході ви можете гавкати неправильне дерево. Вибачте за стіну тексту, що випливає, але ці дані набагато складніші і галасливіші, ніж можуть здатися на перший погляд, тому хотіли дати короткий опис того, як це генерується; попереджений є передпліччя.

Вартість авіаквитків до них є двома компонентами: усі фактичні тарифи (у комплекті з правилами тарифів і що у вас є), які авіакомпанія має за певним маршрутом, більшість з яких публікується Видавничою компанією тарифів на авіалінії (кілька спеціалізованих - ні, але це виняток, а не правило) і фактичне управління запасами, що здійснюються авіакомпанією щодня.

Вартість проїзду може бути подана в ATPCO чотири рази на день, через встановлені інтервали, і коли авіакомпанії роблять це, вони зазвичай складаються із суміші доповнень, вилучень та модифікацій існуючих тарифів. Коли авіакомпанія ініціює цінову дію (якщо припустити, що їх конкуренти не намагаються зробити власні кроки тут), їм зазвичай доводиться чекати до наступного оновлення, щоб побачити, чи переслідують / відповідуть їх конкуренти. Зворотне стосується, коли конкурент ініціює цінову дію, оскільки авіакомпанія повинна зачекати до наступного оновлення, перш ніж вони зможуть відповісти.

Зараз це все добре і добре стосовно цін на проїзд, але проблема полягає в тому, що це все публікується в ATPCO, вартість проїзду - це найкраща інформація для публічної інформації ... всі ваші конкуренти мають бачити, що ви маєте Ви потрапили у свій арсенал, тому спроби притуплення не є нечуваними, наприклад, опублікування тарифів, які ніколи фактично не будуть присвоєні інвентарю, перераховуючи всі тарифи як день відправлення тощо.

Багато в чому секретний соус зводиться до фактичного розподілу запасів, тобто скільки місць на кожен рейс ви будете готові продати за певний тариф, і ця інформація не є загальнодоступною. Ви можете отримати деякі огляди, обробивши інформацію в Інтернеті, але можливі поєднання часу / дати відправлення та правил проїзду досить численні і можуть швидко перерости понад вашу здатність легко відстежувати.

Зазвичай авіакомпанія буде готова продати жменю сидінь за дуже низький тариф, і люди, які забирають їх, повинні забронювати досить далеко заздалегідь, щоб правила проїзду їх не заблокували, або інші мандрівники просто побили їх на удар. Авіакомпанія буде готова продати ще кілька місць для вищого тарифу тощо, тощо. Вони будуть дуже раді продати всі місця за найвищий тариф, який вони опублікували, але це, як правило, неможливо.

Те, що ви бачите, коли вартість проїзду стає вище, чим ближче до дня відправлення, це просто природний процес, коли дешеві місця забронюються далі, а решта інвентаря поступово дорожчає. Звичайно, тут є деякі застереження. Процесом управління сучасною машиною активно керується, а втручання людини є досить поширеним явищем, оскільки команда RM, як правило, прагне досягти своїх цілей доходу та максимізувати дохід за кожен рейс. Таким чином, рейси, які швидко заповнюються, можуть бути "жорсткішими", закривши низькі тарифи. Рейси, які бронюються повільно, можуть бути "розслаблені", виділивши більше місць для нижчих тарифів.

Між авіакомпаніями в цьому районі існує постійна взаємодія та конкуренція, але ви не дуже схожі на реальну динаміку лише за рахунок скорочення тарифів. Не зрозумійте мене неправильно, у нас були такі інструменти в нашому розпорядженні, і, незважаючи на їх обмеження, вони були досить цінними, але вони були лише одним джерелом даних, який підходив до процесу прийняття рішень. Вам знадобиться доступ до сотень, якщо не тисяч оперативних рішень, що приймаються командами RM щодня, а також інформації про стан світу, яку вони бачать у той час. Якщо ви не можете знайти партнера авіакомпанії, з яким би могли отримати ці дані, можливо, вам доведеться розглянути альтернативні джерела даних.

Я рекомендую ознайомитись з отриманням доступу до даних про тарифи O&D з Офіційного посібника авіакомпаній (або одного з їхніх конкурентів) і спробувати використовувати їх для свого аналізу. Це на основі вибірки (близько 10% усіх проданих квитків) і агрегується на більш високому рівні, ніж це було б ідеально, тому необхідний ретельний вибір маршруту (я б рекомендував щось із великою кількістю авіакомпаній, які летять без зупинки кілька разів на день, великий літальний апарат), але, можливо, ви зможете отримати кращу картину того, що було реально продано (середній тариф) та скільки продано (коефіцієнт навантаження), а лише те, що продається в даний момент часу. Використовуючи цю інформацію, ви, можливо, зможете принаймні вивчити результати цінової стратегії авіакомпаній та зробити свої висновки звідти.


Дякуємо за ваше ретельне пояснення. Я згоден з вами, що такий аналіз, що базується лише на цінах, досить обмежений. Це також включає, зокрема, правила проїзду (повернення квитків, мінімальне перебування тощо). Деякі з цих обмежень можна подолати, збираючи завжди однакові тарифи, щоб зробити порівнянними. Однак важлива інформація - як ви вже згадували, не вистачає кількості наявних місць (може бути! = Місць в літаку) та фактичної кількості проданих квитків.
s1x

Доступ до таких даних дуже обмежений і, якщо - застарілий (наприклад, Банк даних 1B від US DOT). Деякі дослідження, такі як Кларк Р. та Вінсент Н. (2012) Ціноутворююча ціна [...], пов'язана з ємністю, включають такі дані та пропонують набагато кращі результати. Я знаю про обмеження (сподіваюсь ;-)), і як ви згадали, оскільки існує набагато більше інформації, яка впливає на ціни. Тим не менш, спостерігаючи за конкретним ринком, ви можете відчути, що відбувається. Ви можете бачити, чи є конкурентна поведінка та різні стратегії ціноутворення. Однак ви ніколи не зможете знайти причину.
s1x

1
@ s1x - Я погоджуюсь, і хотілося б, щоб у мене була вагома альтернатива запропонувати, але, як ви самі дізналися, детальні дані про доходи є найбільш ревно захищеною таємницею будь-якої авіакомпанії. Просто хотілося переконатися, що ви знаєте про це і що входить у процес генерації даних. Крім того, мені подобається те, що ви намагаєтесь зробити, і я думаю, що інша відповідь - це крок у правильному напрямку, з технічної точки зору. Якщо я можу запропонувати, ви також можете поглянути на використання перехресної кореляції між вашими різними ТС під час дослідження даних, оскільки це часто цінно для розпізнавання шаблонів між зв'язаними ТС.
хабу

4

Окрім дослідницького аналізу даних (EDA), як описового, так і наочного, я б спробував використати аналіз часових рядів як більш всебічний і складний аналіз. Зокрема, я б провів регресійний аналіз часових рядів . Аналіз часових рядів - це величезна науково-практична область, тому, якщо ви не знайомі з основами, я пропоную почати із вищезгаданої статті Вікіпедії, поступово шукаючи більш конкретні теми та читаючи відповідні статті, документи та книги.

Оскільки аналіз часових рядів є дуже популярним підходом, його підтримують більшість комерційних наукових даних із відкритим кодом та закритим кодом та статистичними середовищами (програмним забезпеченням) , такими як R , Python , SAS , SPSS та багато інших. Якщо ви хочете використовувати R для цього, перевірте мої відповіді щодо загального аналізу часових рядів, а також щодо класифікації та кластеризації часових рядів . Я сподіваюся, що це корисно.


Дякую за вашу відповідь @Aleksandr Blekh - дуже вдячний. Я благаю прямо в це. Можливо, дурне питання, але будь ласка, виправте мене тут, якщо я тут помиляюся: аналіз кореляції, використовуючи одну авіакомпанію як змінну для співвіднесення. Результати поки переконливі, як стверджують деякі авіакомпанії. ті, у кого були угоди про спільне використання кодів, мали схожі ціни. Чи будуть такі високі кореляції, наприклад: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 Я припускаю, що такі результати вказують на подібні цінові моделі. Що б я дізнався, використовуючи регресійний аналіз?
s1x

@ s1x: Вас дуже вітають (не соромтеся піднести / прийняти, якщо ви цінуєте відповідь і коли, звичайно, отримаєте достатню репутацію для цього). Тепер, до вашого питання. Як я вже сказав, аналіз ТС є більш досконалим та всеосяжним. Зокрема, регресія ТС пояснює так звану авторегресію та інші складності ТС. Отже, моя пропозиція використовувати аналіз регресії TS замість більш простого традиційного. Крім того, завжди слід починати з EDA, незалежно від того, який аналіз даних ви плануєте виконати (насправді EDA часто змінюватиме ваші плани).
Олександр Блех
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.