Чому RANSAC не використовується найбільш широко в статистиці?


26

Виходячи з області комп’ютерного зору, я часто використовував метод RANSAC (Random Sample Consensus) для пристосування моделей до даних з великою кількістю видатків.

Однак я ніколи не бачив, щоб його використовували статистики, і я завжди мав враження, що це не вважається "статистично обгрунтованим" методом. Чому це так? Він є випадковим за своєю природою, що ускладнює аналіз, але це також методи завантаження.

Або просто справа академічних силосів не розмовляє між собою?


1
Мені цікаво одне про методи комп’ютерного зору порівняно зі статистичними методами: продуктивність у першому - обов'язкова. Можливо, є компроміс між продуктивністю та "правильністю", а комп’ютерний зір та статистика мають різні ваги для цих змінних.
Лукас Рейс

Відповіді:


10

Я думаю, що ключовим тут є викидання значної частини даних у RANSAC.

У більшості статистичних застосувань деякі розподіли можуть мати важкі хвости, і тому невелика кількість вибірок може перекручувати статистичну оцінку. Надійні оцінювачі вирішують це шляхом зважування даних по-різному. RANSAC, з іншого боку, не робить спроб розмістити людей, що споживаються, він створений для випадків, коли точки даних справді не належать, а не просто розповсюджуються не нормально.


1
Чудова відповідь. Я бачив RANSAC, який найбільш часто використовується в CV для оцінки гомографій. Це найбільш широко використовується, коли ми знаємо, що деякі відповідні вимірювання є надзвичайно недостовірними. Крім того, продуктивність у реальному часі та інші міркування зробили цю техніку досить популярною, оскільки її можна легко паралелізувати.
Лука

7

Для нас це лише один із прикладів сильної регресії - я вважаю, що її використовують і статистики, але, можливо, не настільки широкі, тому що мають кілька більш відомих альтернатив.


1
Чи можете ви навести приклади альтернатив? Я хотів би розглянути це.
Bossykena

5
Найбільш відомим і найпростішим є середня-медіанна регресія, добре відома з розумних калькуляторів (зітхання!). Зверніться також до Wikipedia en.wikipedia.org/wiki/Robust_regression і, можливо, перегляд надійних

Чи існують альтернативи RANSAC, які дають не тільки неупереджений регрес, а й точки даних, з яких оцінена модель? Спасибі
Валеріо

2

Це дуже схоже на тестування, яке часто використовується.


3
RANSAC дуже різний - при розфасовці всі зразки враховуються певним чином. RANSAC застосовується у випадках, коли до 50% даних мають бути повністю викинуті.
nbubis

1

Ви викидаєте дані за допомогою RANSAC, можливо, не виправдовуючи їх, але ґрунтуючись на збільшенні придатності моделі. Викидання даних для збільшення вмісту зазвичай уникає, оскільки ви можете втратити важливі дані. Зняти сторонніх людей без виправдання завжди проблематично.

Це, звичайно, можна виправдати. Наприклад, якщо вам відомі, дані повинні слідувати заданій схемі, але також є відхилення в даних від шаблону через помилку в вимірюваннях.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.