Припустимо, ви хочете порибалити на сусідньому озері з 8:00 до 20:00. Через перевилов рибу було встановлено закон, який говорить, що ви можете ловити лише одну рибу на день. Коли ви ловите рибу, ви можете вибрати її утримувати (і, таким чином, піти додому з цією рибою), або кинути її назад в озеро і продовжувати ловити рибу (але ризикуєте пізніше поселитися з меншою рибою, або зовсім немає риби). Ви хочете зловити якомога більшу рибу; конкретно, ви хочете збільшити очікувану масу риби, яку ви завезете додому.
Формально ми можемо поставити цю проблему наступним чином: рибу ловлять з певною швидкістю (так, час, необхідний для лову наступної риби, слід за відомим експоненціальним розподілом), а розмір виловленої риби слід за деяким (також відомим) розподілом . Ми хочемо певного процесу прийняття рішень, який, враховуючи поточний час та розмір риби, яку ви тільки що зловили, вирішує, чи потрібно тримати рибу чи кинути її назад.
Тож питання: як слід прийняти це рішення? Чи існує якийсь простий (або складний) спосіб вирішити, коли припинити риболовлю? Я думаю, що проблема еквівалентна визначенню за певний час t, яку очікувану масу риб оптимальний рибалка взяв би додому, якби вони почали в момент t; Оптимальний процес прийняття рішень міг би утримувати рибу тоді і лише тоді, коли риба важча за очікувану масу. Але це здається свого роду самореференційним; ми визначаємо оптимальну стратегію риболовлі з точки зору оптимального рибалки, і я не зовсім впевнений, як діяти.