Почнемо з побудови даних і поглянемо на них. Це дуже обмежений обсяг даних, тому це буде дещо ad hoc з великою кількістю припущень.
rotten <- c(0,1,1,0,0,0,1,1,1,1,0,0,0)
rotten <- as.factor(rotten)
mass <- c(139.08,
91.48,
74.23,
129.8,
169.22,
123.43,
104.93,
103.27,
169.01,
83.29,
157.57,
117.72,
128.63)
diam <- c(17.28,
6.57,
7.12,
16.52,
14.58,
6.99,
6.63,
6.75,
15.38,
7.45,
13.06,
6.61,
7.19)
plot(mass,diam,col=rotten,lwd=2)
title("Fruits")
Отже, це дані, червоні крапки - це гнилі плоди:
Ви вірно вважаєте, що існує два види фруктів. Я висловлюю такі припущення:
- Діаметр розбиває плоди на дві групи
- Плоди діаметром більше 10 відносяться до однієї групи, інші до меншої групи.
- У великій фруктовій групі є лише один гнилий плід. Припустимо, що якщо плід є у великій групі, то гниття не впливає на вагу. Це важливо, оскільки у нас є лише одна точка даних у цій групі.
- Якщо плід невеликий плід, то гниття впливає на масу.
- Припустимо, що змінні diam і маса звичайно розподіляються.
Оскільки дано, що сума діаметра - 64,2 см, то, швидше за все, два плоди великі, а чотири - маленькі. Зараз є 3 випадки для ваги. Згнили 2, 3 або 4 маленьких плода (( великий гнилий плід не припускає маси на припущення ). Тож тепер ви можете отримати межі вашої маси, обчисливши ці значення.
Ми можемо емпірично оцінити ймовірність кількості гнилих дрібних плодів. Ми використовуємо ймовірності, щоб зважити свої оцінки маси, залежно від кількості гнилих плодів:
samps <- 100000
stored_vals <- matrix(0,samps,2)
for(i in 1:samps){
numF <- 0 # Number of small rotten
numR <- 0 # Total number of rotten
# Pick 4 small fruits
for(j in 1:4){
if(runif(1) < (5/8)){ # Empirical proportion of small rotten
numF <- numF + 1
numR <- numR + 1
}
}
# Pick 2 large fruits
for(j in 1:2){
if(runif(1) < 1/5){# Empirical proportion of large rotten
numR <- numR + 1
}
}
stored_vals[i,] <- c(numF,numR)
}
# Pick out samples that had 4 rotten
fourRotten <- stored_vals[stored_vals[,2] == 4,1]
hist(fourRotten)
table(fourRotten)
# Proportions
props <- table(fourRotten)/length(fourRotten)
massBig <- mean(mass[diam>10])
massSmRot <- mean(mass[diam<10 & rotten == 1])
massSmOk <- mean(mass[diam<10 & rotten == 0])
weights <- 2*massBig + c(2*massSmOk+2*massSmRot,1*massSmOk+3*massSmRot,4*massSmRot)
Est_Mass <- sum(props*weights)
Давши нам остаточну оцінку 691,5183г . Я думаю, що ви повинні зробити більшість припущень, які я зробив, щоб дійти висновку, але я думаю, що це можливо зробити розумнішим чином. Також я емпірично беру пробу, щоб отримати ймовірність кількості гнилих дрібних плодів, тобто це лінь і це можна зробити "аналітично".