Кодова змінна у функції nlm ()


9

У R є функція nlm (), яка здійснює мінімізацію функції f за допомогою алгоритму Ньютона-Рафсона. Зокрема, ця функція виводить значення змінного коду, визначеного таким чином:

кодуйте ціле число, вказуючи, чому процес оптимізації припинився.

1: відносний градієнт близький до нуля, ітераційний струм, ймовірно, є рішенням.

2: послідовні ітерації в межах толерантності, поточний ітерат, ймовірно, рішення.

3: останній глобальний крок не зміг знайти крапку, нижчу за оцінку. Будь-яка оцінка є приблизним локальним мінімумом функції, або steptol занадто малий.

4: перевищено межу ітерації.

5: максимальний крок розміру кроку перевищував п'ять разів поспіль. Або функція, не обмежена внизу, стає асимптотичною до кінцевого значення зверху в деякому напрямку, або stepmax занадто малий.

Чи може хтось пояснити мені (можливо, використовуючи просту ілюстрацію з функцією лише однієї змінної), що відповідає ситуаціям 1-5?

Наприклад, ситуація 1 може відповідати наступній картинці:

введіть тут опис зображення

Заздалегідь спасибі!

Відповіді:


8

Ці ситуації розуміються більш чітко, маючи на увазі, що таке мінімізація чи максимізація, і як працює оптимізація.

Припустимо, у нас є функція f який має місцевий мінімум у х0. Методи оптимізації намагаються побудувати послідовністьхi який сходить до х0. Завжди показано, що теоретично побудована послідовність сходиться до точки локального мінімуму для деякого класу функційf.

Отримати наступного кандидата в ітерації iможе бути тривалим процесом, тому зазвичай всі алгоритми обмежують кількість ітерацій. Це відповідає ситуації 4 .

Потім для кожного х близько до х0 ми це маємо f(х)>f(х0). Так що якщоf(хi)>f(хi-1)це ознака того, що ми досягли мінімуму. Це відповідає ситуації 3

Тепер якщо функція f має похідну при х0 то обов’язково f(х0)=0. Метод Ньютона-Рафсона обчислює градієнт на кожному кроці, так що якщоf(хi)0, хiймовірно, це рішення, яке відповідає ситуації 1 .

Кожна збіжна послідовність реальних векторів є послідовністю Коші, і навпаки, приблизно означає, що якщо хi близький до х0, тоді хi близький до хi+1 і навпаки, де i- це номер ітерації. Так що якщо|хi-хi-1|<εі ми це знаємо теоретично хi сходиться до х0, тоді ми повинні бути близькими до мінімальної точки. Це відповідає ситуації 2 .

Послідовності конвергування мають властивість вони скорочуватися, тобто, якщо ми близькі до конвергенції, всі інші елементи послідовності містяться на невеликій площі. Отже, якщо послідовність, яка теоретично повинна зближуватися, починає робити великі кроки, це є свідченням того, що конвергенції, ймовірно, немає. Це відповідає ситуації 5

Примітка Суворі математичні визначення були навмисно викинуті.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.