Проблема риболовлі

Припустимо, ви хочете порибалити на сусідньому озері з 8:00 до 20:00. Через перевилов рибу було встановлено закон, який говорить, що ви можете ловити лише одну рибу на день. Коли ви ловите рибу, ви можете вибрати її утримувати (і, таким чином, піти додому з цією рибою), або кинути її назад в озеро і продовжувати ловити рибу (але ризикуєте пізніше поселитися з меншою рибою, або зовсім немає риби). Ви хочете зловити якомога більшу рибу; конкретно, ви хочете збільшити очікувану масу риби, яку ви завезете додому.

Формально ми можемо поставити цю проблему наступним чином: рибу ловлять з певною швидкістю (так, час, необхідний для лову наступної риби, слід за відомим експоненціальним розподілом), а розмір виловленої риби слід за деяким (також відомим) розподілом . Ми хочемо певного процесу прийняття рішень, який, враховуючи поточний час та розмір риби, яку ви тільки що зловили, вирішує, чи потрібно тримати рибу чи кинути її назад.

Тож питання: як слід прийняти це рішення? Чи існує якийсь простий (або складний) спосіб вирішити, коли припинити риболовлю? Я думаю, що проблема еквівалентна визначенню за певний час t, яку очікувану масу риб оптимальний рибалка взяв би додому, якби вони почали в момент t; Оптимальний процес прийняття рішень міг би утримувати рибу тоді і лише тоді, коли риба важча за очікувану масу. Але це здається свого роду самореференційним; ми визначаємо оптимальну стратегію риболовлі з точки зору оптимального рибалки, і я не зовсім впевнений, як діяти.

stochastic-processes optimal-stopping

— b2coutts
джерело

Ознайомтеся з проблемою секретаря у Вікіпедії - конкретно розділі про найкращий вибір 1 / e-law.

— soakley

Я думаю, що ключова відмінність тут полягає в тому, що ми припускаємо, що ми знаємо, як все розподіляється, тоді як головне в цьому рішенні полягає в тому, що він використовує перших заявників 1 / е просто для отримання деяких з цих знань та визначення хорошого порогу. Я думаю, подібна ідея тут не могла б спрацювати. Ви можете собі уявити, як тільки вивести поріг з розподілів, але я не думаю, що це слід фіксувати; Я думаю, що поріг з часом повинен знижуватися, оскільки у вас все менше і менше часу для вилову кращої / будь-якої риби.

— b2coutts

@soakley див. також мою відповідь на відповідь olooney; (очікуване) значення очікування залежить не тільки від того, що ви будете отримувати в майбутньому, але і того, який із цих уловлювань ваша стратегія насправді візьме. Тож я думаю, що і в цьому питанні є дивний аспект самореференції.

— b2coutts

Яку функцію чи значення ми намагаємось оптимізувати? Тобто, як ми зважуємо ризик та прибуток? Чи є сенс придумати метод, який максимально збільшує очікуване значення розміру виловленої риби? Ми просто ловимо один день чи кілька днів, а в останньому випадку, як співвідносяться дні?

— Секст

Ми знаємо, що розподіл ... це стосується лише типу розподілу, чи він також включає параметри розподілу?

— Секст

Нехай $\lambda$ позначає швидкість процесу Пуассона і нехай $S(x)=1-F(x)$ де $F(x)$ - функція кумулятивного розподілу розподілу риби за розміром.

$t=0$ $g(t)$ $t\le 0$ $(t,0)$ $g(0)=0$ $x$ $t$ $g(t)$

$g(t)$ $(t-dt,t)$ $X>g(t)$

λ d t S (g (t)),

$\lambda dt S(g(t)),$

g (t)

$g(t)$

E (X | X > g (t)) = g (t) + \frac{1}{S (g (t))} \int_{g (t)}^{\infty} S (x) d x .

$E(X|X>g(t))=g(t)+\frac1{S(g(t))}\int_{g(t)}^\infty S(x)dx.$

$(t-dt,0)$

g (t - d t) = [λ d t S (g (t))] [g (t) + \frac{1}{S (g (t))} \int_{g (t)}^{\infty} S (x) d x] + [1 - λ d t S (g (t)] g (t) .

$g(t-dt) =[\lambda dt S(g(t))][g(t)+\frac1{S(g(t))}\int_{g(t)}^\infty S(x)dx] + [1-\lambda dt S(g(t)] g(t).$

$g(t)$

\begin{matrix} (1) & \frac{d g}{d t} = - λ \int_{g (t)}^{\infty} S (x) d x . \end{matrix}

$\frac{dg}{dt}=-\lambda \int_{g(t)}^\infty S(x) dx. \tag{1}$

g (t)

$g(t)$

λ

$\lambda$

\int_{0}^{\infty} S (x) d x

$\int_0^\infty S(x)dx$

$X\sim \exp(\alpha)$ $S(x)=e^{-\alpha x}$

\frac{d g}{d t} = - \frac{λ}{α} e^{- α g (t)}

$\frac{dg}{dt}=-\frac\lambda\alpha e^{-\alpha g(t)}$

g (t) = \frac{1}{α} \ln (1 - λ t),

$g(t) = \frac1\alpha\ln(1-\lambda t),$

t \leq 0

$t\le 0$

α = λ = 1

$\alpha=\lambda=1$

g (- 12)

$g(-12)$

g <- function(t,lambda, rate) {
  1/rate*log(1-lambda*t)
}
catch <- function(daylength=12, lambda=1, rfn=runif, gfn=g, ...) {
  n <- rpois(1,daylength*lambda)
  starttime <- -daylength
  arrivaltimes <- sort(runif(n,starttime,0))
  X <- rfn(n,...)
  j <- match(TRUE, X > gfn(arrivaltimes,lambda,...))
  if (is.na(j))
    0
  else
    X[j]
}
nsim <- 1e+5
catches <- rep(0,nsim)
for (i in 1:nsim)
  catches[i] <- catch(gfn=g,rfn=rexp,rate=1,lambda=1)
> mean(catches)
[1] 2.55802
> g(-12,1,1)
[1] 2.564949

$X \sim U(0,1)$

g (t) = 1 - \frac{1}{1 - λ t / 2}

$g(t) = 1 - \frac1{1-\lambda t/2}$

g (t)

$g(t)$

t \to - \infty

$t\rightarrow -\infty$

— Джарле Туфто
джерело

g (t)

$g(t)$

(t, 0)

$(t,0)$

g (t)

$g(t)$

(t, 0)

$(t,0)$

t

$t$

g (t)

$g(t)$

g^{'} (t) = 1 - \frac{e^{λ t} - 1}{λ t}

$g'(t)=1-\frac{e^{\lambda t}-1}{\lambda t}$

g^{'} (t)

$g'(t)$