Який алгоритм машинного навчання можна використовувати для прогнозування фондового ринку?


15

Як варіант, передбачити валютні ринки. Я знаю, що це може стати досить складним, тому в якості вступу я шукаю простий алгоритм прогнозування, який має певну точність.

(Це для магістерського університетського проекту, який триває чотири місяці)

Я читав, що багатошарова нейронна мережа може бути корисною. Будь-які думки з цього приводу? Крім того, семантичний аналіз соціальних медіа може дати розуміння поведінки ринку, яка впливає на фондовий ринок. Однак на даний момент семантичний аналіз трохи виходить за рамки проекту.


15
Моє, але з очевидних причин я все це тримаю на собі!
babelproofreader

7
Якщо вірити гіпотезі ефективного ринку, неможливо послідовно досягти вищої середньої ринкової дохідності (без інсайдерських знань), яка вбудовується у поточні ставки / ціни. Дуже багато людей не погоджуються з цим, але майже всі погоджуються, що це правда для випадкового інвестора. Іншими словами, 3-лінійна модель, заснована на rand (), напевно, майже така ж хороша, як і типовий інвестор: P
rm999

5
Навряд чи хтось буде готовий поділитися алгоритмом, який має якусь позапробну точність. Крім, мабуть, деяких опублікованих наукових робіт, де аномалія невелика і не покриває транзакційних витрат.
NPE

2
Для академічної роботи може бути доцільніше моделювати ціни, а не намагатися передбачити. Прогнозування, ймовірно, виявиться невдалим, але моделювання могло б хоча б дати деяке розуміння того, як реально діють справи, а теоретично може бути поширене на прогнозування.
highBandWidth

2
@wayne Я не думаю, що це переоцінка, це дозволити передбачувачам, які не можна використовувати для прогнозування, наприклад, змінних, які виникають під час / після руху акцій - якщо ви виявите, що акції яблук і мікрософт мають співвідношення, цей факт не можна використовувати прогнозувати запас msft, але може бути дуже інформативним.
rm999

Відповіді:


17

Як зазначається babelproofreader , ті, які мають успішний алгоритм, мають тенденцію до цього дуже секретно. Таким чином, навряд чи будь-який широкодоступний алгоритм буде дуже корисним поза коробкою, якщо ви не зробите з ним щось розумне (в цей момент він перестає бути широкодоступним, оскільки ви додаєте до нього).

З огляду на це, дізнатися про авторегресивні інтегровані ковзні середні (ARIMA) моделі може бути корисним початком для прогнозування даних часових рядів. Не очікуйте, що краще, ніж випадкові результати.


5
+1: Скільки разів я читав або був на уроці і чув людей, які вважають, що якщо у них достатньо складний алгоритм, вони можуть розбагатіти на фондових / електроенергетичних / товарних ринках. Ви намагаєтесь пояснити накладність тощо, але безрезультатно. Начебто я знаю, що не є інсайдером, успішне програмне забезпечення для торгівлі акціями залежало від плати за транзакції, арбітражу та високої швидкості. Найсучаснішим моментом тепер є використання прорізів в автоматизованих правилах торгівлі та швидкісне подання пропозицій / зняття торгів для присмоктування інших автоматизованих торговців.
Уейн

1
Інша проблема полягає в тому, де кілька людей закінчують один і той же алгоритм, оскільки вони навчалися за точно однаковими даними, а потім здійснювали обсяг продажів / покупок. Чи очікується, що будь-який алгоритм має довгострокову точність?
Мішель

@Wayne існують стратегії зменшення перевитрати, хоча їх важко реалізувати за даними часових рядів.
Зак

1
@Zach: так, є способи покарання за надмірне оздоблення, але саме над цим ставленням я замислююся: люди, які зробили якусь основну (можливо, помилкову) криву, що вписується в Excel, і вважають, що вони могли заробити гроші своїм секретним соусом , але те, що їм дійсно потрібно, - це один із тих передових, складних алгоритмів, якими професор просто не поділиться з класом. Цей алгоритм міг би відповідати даним, як рукавичка, а потім передбачити набагато краще, ніж усі інші спекулянти, які використовують електронні таблиці Excel ... але професор продовжує думати про перевиконання та обмеження даних. Зітхнути.
Уейн

12

Я думаю, що для ваших цілей вам слід вибрати алгоритм машинного навчання, який вам цікавий, і спробувати його.

Що стосується ефективної теорії ринку, ринки не є ефективними в будь-якому часовому масштабі. Крім того, деяких людей (і в наукових закладах, і в реальному житті) мотивує інтелектуальний виклик, а не просто збагачення, і вони публікують цікаві результати (і я вважаю невдалий результат цікавим). Але пригощайте все, що читаєте, щіпкою солі; якщо результати справді хороші, можливо, їх науковий метод не є.

Робота даних з R може бути для вас корисною книгою; це дорого, тому спробуйте знайти його у своїй університетській бібліотеці. Розділ 2 охоплює саме те, що ви хочете зробити, і він отримує найкращі результати за допомогою нейронної сітки. Але попередити, що він отримує погані результати, і витрачає багато процесорного часу, щоб отримати їх. Огляди Amazon зазначають, що книга коштує на 20 доларів більше, тому що в цій главі згадується слово фінанси ; під час його читання у мене склалося враження, що видавець підштовхнув його до написання. Він зробив домашнє завдання, прочитав документи, ознайомився з правильними списками розсилки, але його серце не було в цьому. Я отримав від цього кілька корисних знань, але не буду бити ринок :-)


@Darren - Мені подобається твій стиль.
rolando2

1
Проектну версію (май травня 2003 р.) Data Mining with R можна знайти тут . (У мене немає книги, тому я не можу сказати, який розрив між двома версіями.)
chl

@chi Спасибі! Я швидко поглянув, і лише два з чотирьох розділів там. Але більша відмінність полягає в тому, що розділ " Прогнозування повернення фондового ринку " сильно відрізняється. Не згадуйте xts або Quantmod і замість цього використовуйте пакет ts, а також використовуйте acf та пакет MARS для прогнозів. Це майже як бонусна глава, і я збираюся встигнути її правильно прочитати. Він все ще використовує нейронні мережі, але не порівнює їх з SVM, як у виданій книзі.
Даррен Кук

10

На мій погляд, будь-який сильний ШІ, що працює на заводі, який міг би виконати всі наступні дії, може легко дати статистично значимий прогноз:

  • Збирайте та розумійте чутки

  • Отримайте доступ та інтерпретуйте всі державні знання

  • Робіть це в кожній відповідній країні

  • Робіть відповідні прогнози щодо:

    • Метеорологічні умови

    • Терористична діяльність

    • Думки та почуття окремих людей

    • Все інше, що впливає на торгівлю

Статистичний аналіз - це найменша стурбованість.


4

Ви можете спробувати функції auto.arima та ets в R. Можливо, ви також матимете певний успіх із пакетом rugarch , але для автоматизованого вибору параметрів немає існуючих функцій. Можливо, ви могли б отримати параметри для середньої моделі auto.arima, а потім передати їх rugarchі додати garch(1,1)?

Там є всілякі блоги, які претендують на певний успіх у цьому. Ось система, що використовує модель arima (а пізніше модель garch) та систему, що використовує модель SVM . Ви знайдете багато корисної інформації про торгівлю FOSS , особливо якщо ви почнете читати блоги на його блозі.

Яку б модель ви не використовували, не забудьте пересвідчитись та орієнтувати! Я був би дуже здивований, якби ви знайшли модель аріма, етс або навіть гарш, яка могла б змусити перемогти наївну модель поза зразком. Приклади перехресної перевірки часових рядів можна знайти тут і тут . Майте на увазі, що те, що ВИСТІТЬ хочете прогнозувати - це прибутки, а не ціни.


2

Я знаю один підхід машинного навчання, який зараз використовується принаймні одним хедж-фондом. numer.ai використовує сукупність наданих користувачем алгоритмів машинного навчання для керування діями фонду.

Іншими словами: Хедж-фонд забезпечує відкритий доступ до зашифрованої версії даних про пару сотень інвестиційних транспортних засобів, швидше за все, акцій. Тисячі науковців з подібними даними навчають всілякі алгоритми машинного навчання проти цих даних і завантажують результати на табло. Найвищі бомбардири отримують невелику суму грошей залежно від точності їх результатів та того, як довго їх доступний онлайн.

Найкращі прогнози нібито зроблені ансамблями алгоритмів.

Отже, у вас є багато вчених, які пропонують підготовлені здогадки, деякі з яких самі є ансамблями здогадок, а хедж-фонд використовує ансамбль усіх наданих здогадок для спрямування своїх інвестицій.

Результати цього досить цікавого хедж-фонду навчили мене дві речі:

  1. Ансамблі часто розглядають як хороший спосіб прогнозування на фондовому ринку.
  2. Хороші прогнози вимагають більше ансамблів, ніж я готовий будувати сам ...

Якщо ви хочете поїхати, відвідайте: https://numer.ai/ Ні, я не пов’язаний з ними, я, швидше за все, не провів своїх днів в Інтернеті, якби я був підключений до хедж-фонду, в якому працюють тисячі людей , але платити лише ті, які дають вимірювані результати :)

У спільноті numer.ai є форум, де вони обговорюють свій підхід, щоб ви могли навчатися у інших, хто намагається зробити те саме.

Особисто я думаю, що будь-хто з хорошим алгоритмом збирається тримати це дуже, дуже таємно.


1

Спробуйте скористатися нейронними мережами типу GMDH. Я знаю, що деякі успішні комерційні пакети для прогнозування фондового ринку використовують його, але згадують про це лише в глибині документації. Коротше кажучи, це багатошарова ітеративна нейронна мережа, тож ви на правильному шляху.


0

Я думаю, що моделі прихованих марків популярні на фондовому ринку. Найголовніше, що потрібно пам’ятати, - це те, що ви хочете алгоритм, який зберігає часовий аспект ваших даних.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.