Наступний уривок - це інтерв'ю із стабільно успішним менеджером хедж-фондів Джаффрі Вудріфом ( майстер 2012 року) Швагера ( Wizzards Market Wizzards) (травень 2012 року):
На питання: "Які найстрашніші помилки люди роблять при обробці даних?":
Дуже багато людей вважають, що це нормально, оскільки вони використовують взіркові дані для тренінгу, а позамобільні дані для тестування. Потім вони сортують моделі, грунтуючись на тому, як вони працювали на даних проб, і вибирають найкращі для тестування на вибіркових даних. Тенденція людини полягає у тому, щоб брати моделі, які продовжують добре працювати з вибірковими даними, і вибирати ті моделі для торгівлі. Цей тип процесу просто перетворює позабіржові дані в частину навчальних даних, оскільки він вибирає моделі, які найкраще підходили за період поза вибіркою. Це одна з найпоширеніших помилок, яку роблять люди, і одна з причин того, що пошук даних, як правило, застосовується, дає жахливі результати.
Інтерв'юер запитує: "Що ти повинен робити замість цього?":
Ви можете шукати шаблони, коли в середньому всі моделі, що не є зразками, продовжують працювати добре. Ви знаєте, що у вас все добре, якщо середній показник для моделей, що не є вибіркою, становить значний відсоток від показника в вибірці. Взагалі кажучи, ви дійсно кудись потрапляєте, якщо результати поза вибіркою становлять понад 50 відсотків від вибірки. Бізнес-модель QIM ніколи б не працювала, якби SAS та IBM будували чудове програмне забезпечення для прогнозування.
Мої запитання
Чи це має сенс? Що він означає? Чи є у вас підказки - чи, можливо, навіть назва запропонованого методу та деякі посилання? Або цей хлопець знайшов святий грааль, якого ніхто більше не розуміє? Він навіть каже в цьому інтерв'ю, що його метод може потенційно революціонувати науку ...