Мені було цікаво, чи є спосіб сказати ймовірність того, що щось вийде з ладу (продукт), якщо ми маємо 100 000 продуктів на місцях за 1 рік і без відмов? Яка ймовірність того, що один із наступних 10000 проданих продуктів провалиться?
Мені було цікаво, чи є спосіб сказати ймовірність того, що щось вийде з ладу (продукт), якщо ми маємо 100 000 продуктів на місцях за 1 рік і без відмов? Яка ймовірність того, що один із наступних 10000 проданих продуктів провалиться?
Відповіді:
Ймовірність того, що продукт вийде з ладу, безумовно, є функцією часу та використання. Ми не маємо жодних даних про використання, і лише за один рік не виникає збоїв (вітаємо!). Таким чином, цей аспект (званий функцією виживання ) не може бути оцінений з ваших даних.
Однак ви можете думати про невдачі протягом одного року як випливає з біноміального розподілу . У вас все ще немає збоїв, але це зараз загальна проблема. Просте рішення - використовувати правило 3 , яке точно з великим (яке, безумовно, є). В Зокрема, ви можете отримати верхню межу одностороння 95% довірчий інтервал (тобто нижня межа дорівнює 0 ) на істинної ймовірності відмови в протягом одного року 3 / N . У вашому випадку ви на 95% впевнені, що показник менше 0,00003 .
Ви також запитали, як обчислити ймовірність того, що одне чи більше наступних 10 к виходять з ладу. Швидкий і простий (хоч і крайній) спосіб розширити вищевказаний аналіз - просто використовувати верхню межу як основну ймовірність і використовувати відповідний біноміальний CDF, щоб отримати ймовірність того, що не буде збоїв. Використовуючи код, ми могли б зробити:, що дає шанс побачити один або кілька збоїв у наступних 10-ти к. Використовуючи верхню межу, це не є оптимальною точковою оцінкою ймовірності виникнення хоча б одного збою, скоріше можна сказати, що малоймовірно, що ймовірність відмови ≥ 1 перевищує ≈ 26 %R
1-pbinom(0, size=10000, prob=0.00003)
0.2591851
(визнаючи, що це дещо "ручно-хвилясте" обрамлення). Інша можливість - використовувати пропозицію @ amoeba про оцінку за правилом правонаступництва Лапласа . Правило правонаступництва зазначає, що передбачувана ймовірність відмови становить , де F - кількість відмов. В цьому випадку, р = 9,9998 × 10 - 06 , а розрахунок для прогнозованої ймовірності 1 + невдач в наступному 10.000 , отримуючи , або1-pbinom(0, size=10000, prob=9.9998e-06)
0.09516122
.
Можна взяти байєсівський підхід. позначають ймовірність відмови і вважають це випадковою змінною. Апріорі, перш ніж побачити результати експериментів, ви можете повірити, що Θ ∼ U ( 0 , 1 ) . Якщо ви довіряєте інженерам, щоб зробити цей продукт надійним, можливо, ви можете взяти Θ ∼ U ( 0 , 0,1 ) або так. Це залежить від вас. Тоді ви можете використовувати теорему Байєса для обчислення заднього розподілу θ . Позначимо А подія , яке ви спостережувану ( п експерименти з нульовими невдач).
Все просто:Θрівномірно, томуp(θ)- деяка константа. Оскільки ви проводитеnекспериментів,p(A|θ)- це лише ймовірністьвідмовуnвипробуваннях Бернулі з ймовірністю відмовиθ.
Коли у вас ви золото: ви можете обчислити ймовірність будь-якої події B шляхом інтеграції: P ( B ) = ∫ p ( B | θ ) p ( θ | A ) d θ
Нижче я працюю над детальним рішенням, дотримуючись вищезазначеного підходу. Я візьму кілька стандартних ярликів.
Нехай попереднім буде . Тоді: p ( θ | A ) ∝ p ( A | θ ) ⋅ 1 = ( 1 - θ ) n . Константа нормалізації p ( A ) = ∫ p ( A | θ ) p ( θ ) d θ є B ( 1 , n
Позначимо ймовірність без збоїв в продукції в наступному році на B . Ймовірність принаймні одного збою становить 1 - P ( B ) . Тоді 1 - P ( B ) = 1 - ∫ ( 1 - θ ) m ( 1 - θ ) n
що становить приблизно , використовуючи n = 100 , 000 , m = 10 , 000 . Не дуже вражає? Я взяв рівномірний розподіл щодо ймовірності відмови. Можливо, у вас краще попередня віра у ваших інженерів.
Замість того, щоб обчислити ймовірність, чому б не передбачити, скільки продуктів може вийти з ладу?
Порівняльні формули можуть бути використані для обчислення, коли
Верхня межа передбачення (УПЛ) для числа невдач в цих останніх квитків, , визначається найменша ( в залежності від ) , для яких .
UPL слід інтерпретувати з точки зору ризику використання , який оцінюється до того, як спостерігається або або Іншими словами, припустимо, це минуло рік тому, і вас просять порекомендувати процедуру для прогнозування кількості відмов у наступних продуктах після того, як були помічені перші . Ваш клієнт запитує
Який шанс, що ваша процедура буде передбачати ? Я не маю на увазі в майбутньому, коли у вас буде більше даних; Я маю на увазі саме зараз, тому що я повинен приймати рішення прямо зараз, і єдині шанси, які мені будуть доступні, - це ті, які можна обчислити в цей момент ".
Ваша відповідь може бути,
Зараз шанс не перевищує , але якщо ви плануєте використовувати менший прогноз, шанс перевищить .
Для , , і ми можемо обчислити це
Таким чином, спостерігаючи ,
Для впевненості до (тобто, коли ), передбачте, що в найближчих продуктах максимум збій .
Для впевненості до (тобто, коли ), передбачте, що в наступних продуктах є максимум відмови .
І т.д.
Коли і навіщо застосовуватиметься такий підхід? Припустимо, ваша компанія виготовляє безліч різноманітних продуктів. Після спостереження за виконання кожного з них в поле, він любить проводити гарантії, такі , як «Не буде виконана без вартості заміни будь-якого збою в протягом одного року.» Маючи ліміти прогнозування кількості відмов, ви можете контролювати загальні витрати на надання гарантій. Оскільки ви виробляєте багато продуктів і очікуєте, що невдачі ставатимуть через випадкові поза вашим контролем обставини, досвід кожного продукту буде незалежним. Має сенс контролювати свій ризик у довгостроковій перспективі. Час від часу вам, можливо, доведеться платити більше претензій, ніж очікувалося, але більшу частину часу ви будете платити менше. Якщо оплата більше, ніж оголошено, може бути згубною, ви встановите, що буде надзвичайно малим (і ви, ймовірно, будете використовувати і більш складну модель відмови!). В іншому випадку, якщо витрати незначні, ви можете жити з низькою впевненістю (висока ). Ці розрахунки показують, як збалансувати довіру та ризики.
Зауважте, що нам не потрібно обчислювати повну процедуру . Ми чекаємо, поки спостерігається , а потім просто проводимо обчислення для цього конкретного (тут, ), як показано вище. В принципі, однак, ми могли б провести розрахунки для всіх можливих значень на самому початку.
Байєсівський підхід (описаний в інших відповідях) привабливий і буде добре працювати, якщо результати не сильно залежать від попереднього. На жаль, коли рівень відмов настільки низький, що спостерігається дуже мало (або немає відмов), результати чутливі до вибору попереднього.
Далі йде байєсівська відповідь "З 10 000 нових продуктів, скільки очікується, що вони вийдуть з ладу, якщо всі колишні 100 000 вироблених не вийшли з ладу?", Але ви повинні врахувати чутливість до різних пріорів.
Припустимо, що є умовно незалежними та однаково розподіленими, заданими , таким чином, що , і використовувати сполучник попереднього , з .
Для ми маємо
Для нас є в якому ми використовували . Θ∣X1=0,…,Xm=0∼Beta(a,m+b)
Підключивши свої номери, з рівномірним попереднім ( ), ви очікуєте, що рівень відмов очікується близько , тоді як попередній тип Джеффрі ( ) дає вам коефіцієнт відмов близько .
Це прогнозне очікування не виглядає як хороший підсумок, оскільки прогнозний розподіл сильно перекошений. Ми можемо піти далі і обчислити прогнозний розподіл. Оскільки кондиціонування так, як ми робили до того, як у нас для .
Я закінчу його згодом, обчислюючи інтервал прогнозування .
Використовуючи підхід до проблеми сходу сонця Лапласа , ми отримуємо ймовірність того, що продукт вийде з ладу протягом року . Далі, ймовірність того, що нових продуктів не вийде з ладу протягом року, становить Отже, ймовірність того, що принаймні один продукт з вийде з ладу в наступному році, становить Для значення . У випадку Уубера , насправді досить високий.
Звичайно, вам слід постійно оновлювати свої дані, поки продається більше товарів, з часом одна вийде з ладу.
На це питання було надано кілька хороших відповідей, але останнім часом у мене був шанс переглянути кілька ресурсів на цю тему, і тому я вирішив поділитися результатами.
Існує кілька можливих оцінювачів даних про нульові збої. Позначимо як кількість відмов, а як розмір вибірки. Максимальна оцінка ймовірності відмови з урахуванням цих даних є
Така оцінка досить незадовільна, оскільки той факт, що ми не спостерігали збоїв у нашому зразку, навряд чи підтверджує, що вони взагалі неможливі. Невідомі знання свідчать про те, що існує певна ймовірність виходу з ладу, навіть якщо їх не спостерігали (поки що). Наявність апріорних знань приводить нас до використання байєсівських методів, розглянутих Бейлі (1997), Razzaghi (2002), Basu et al (1996), Ludbrook and Lew (2009).
Серед простих оцінювачів "верхньої межі", що передбачає (Bailey, 1997)
що оцінювач P для нульового відмови не буде логічним для отримання ймовірності, що перевищує ту, яку передбачив максимальний вірогідність оцінки у випадку відмови, розумна верхня межа
визначено як
можна згадати. Як переглянули Ludbrook and Lew (2009), іншими можливостями є "правило трійки" (див. Тут , Wikipedia , або Eypasch et al, 1995)
або інші варіанти:
"правило 3,7" Ньюкомба та Альтмана (або 3,6):
"нове правило чотирьох":
але, як дійшли висновку Ludbrook and Lew (2009), "правило трійки" є "поруч із марним", а "правило 3.6" (і 3.7) "мають серйозні обмеження - вони є грубо неточними, якщо початковий розмір вибірки менше 50" і вони не рекомендують методи (3) - (6), пропонуючи скоріше використовувати правильні байєсові оцінки (див. нижче).
Серед байєсівських оцінювачів можна відзначити кілька різних. Перший такий оцінювач, запропонований Бейлі (1997)
для оцінки медіани за рівномірним попереднім
або для оцінки середнього за таким попереднім
ще один підхід, що передбачає експоненціальну схему відмов з постійною швидкістю відмов (розподіли Пуассона)
якщо ми використовуємо бета-версію з параметрами і ми можемо використовувати формулу (див. Razzaghi, 2002):
що при призводить до рівномірного попереднього (9). Якщо припустити, що Джеффріс дорівнює це призводить до
Як правило, рекомендуються байєсові формули (7) - (12). Basu et al (1996) рекомендує (11) з попередньою інформацією, коли є деякі апріорні знання. Оскільки не існує жодного найкращого методу, я б запропонував переглянути літературу перед вашим аналізом, особливо коли є невеликим.
Бейлі, RT (1997). Оцінка за даними нульових відмов. Аналіз ризиків, 17 , 375-380.
Razzaghi, M. (2002). Про оцінку вірогідності біноміального успіху з нульовим виникненням у вибірці. Журнал сучасних прикладних статистичних методів, 1 (2), 41.
Ludbrook, J., & Lew, MJ (2009). Оцінка ризику рідкісних ускладнень: чи достатньо «хорошого правила трьох» ?. Журнал хірургії ANZ, 79 (7–8), 565-570.
Eypasch, E., Lefering, R., Kum, CK, and Troidl, H. (1995). Ймовірність побічних подій, які ще не відбулися: статистичне нагадування. BMJ 311 (7005): 619–620.
Basu, AP, Gaylor, DW, & Chen, JJ (1996). Оцінка ймовірності появи пухлини для рідкісного раку з нульовим явищем у вибірці. Нормативна токсикологія та фармакологія, 23 (2), 139-144.
Вам справді потрібно повернутися до дизайнерів вашої продукції. Це фундаментальна інженерна проблема, а не спостережна статистична. Вони матимуть уявлення про ймовірність виходу з ладу кожного компонента, а з цього - чисту ймовірність відмови всього складеного продукту. Вони можуть надати вам очікувану кількість відмов протягом усього терміну експлуатації продукту.
Цивільний інженер проектує міст, який має тривалість проекту 120 років. Кожен компонент мосту має незначний шанс виходу з ладу. Кожне завантаження має незначний шанс перевищення. Щоб зробити міст економічним для будівництва, повний обвал відбудеться лише раз у 2400 років, що набагато довше, ніж мост буде підтримуватися. Не дивно, що міст не провалюється ні в 1, ні в 2-й рік у 120-му році. Тобто це не зруйнується, говорить вам дуже мало. Різні шанси на невдачу з часом можуть оцінити лише оригінальні дизайнери.
Це схоже на проблему, з якою я стикався, коли ми впровадили новий виробничий процес для усунення несправностей у виробництві.
Нова система не дала збоїв, тому люди задавали те саме питання: як ми прогнозуємо рівень відмов? У вашому випадку, оскільки ви встановили період, протягом якого збій може статися без побоювання, коли збій трапиться протягом цього періоду, тимчасові наслідки були усунені. І це просто випадок того, що щось не вдалося чи ні. За умови, що передбачено моєю відповіддю.
Інтуїтивно, мабуть, нам потрібен хоча б один збій, щоб можна було обчислити рівень відмови. Однак це припущення має в собі неявну помилку. Ми ніколи не будемо розраховувати рівень відмов. Це тому, що ми маємо справу зі зразком. Таким чином, ми можемо лише оцінити діапазон ймовірних показників відмов. Спосіб зробити це - знайти розподіл за коефіцієнтом відмов. Розподіл, який виконує роботу в цьому випадку, є бета-розподілом, де параметри: α = n + 1 і β = N - n + 1
Примітка: N - розмір вибірки і n - кількість відмов (у вашому випадку 0)
Для вашого сценарію розподіл показника відмов показано нижче. .
Потім ви б подали цей розподіл у відповідну біноміальну формулу ймовірності, щоб отримати розподіл на ймовірність відмови однієї одиниці (це можна зробити аналітично або за допомогою Монте-Карло). Я підозрюю, що цифри будуть дуже низькими.
Зауважте, що цей процес застосовний незалежно від кількості відмов у вашому кулаку.