Інтуїтивно зрозумілий / неформальний доказ для подвійності LP?


19

Що може бути хорошим неофіційним / інтуїтивним доказом для того, щоб "вдарити до дому" про подвійність LP? Як найкраще показати, що мінімізована цільова функція дійсно є мінімумом з інтуїтивним способом розуміння пов'язаного?

Те, як мене навчали «Подвійності», призвело лише до одного розуміння, яке, я впевнений, поділяє багато людей, яких я знаю: Для кожної відповідної проблеми мінімізації існує еквівалентна проблема максимізації, яку можна отримати шляхом інвертування обмежень нерівності. Період. Цей "висновок" подвійності - це те, що, здається, тримається, але не "чому це так" (тобто як / чому існує обмеження на оптимальне рішення).

Чи є спосіб гри з нерівностями просто "показати" нижню / верхню межу оптимуму, що може бути мотивацією для доказу?

Я переглянув книгу Чватала, а також декілька інших, але не знайшов нічого, що могло б зрозуміти абсолютним нобі на LP. Найближче до мене було з книги Вазірані про алгоритми, де він говорить про «множення нерівностей на деякі магічні числа, які показують межу» - я не впевнений, як відтворити ефект для довільного LP.


5
У цій відповіді math.SE я переглядаю покроковий приклад того, звідки походить дуал - і чому - для проблеми, яка має більшість різних можливостей, які можуть виникнути з LP. Можливо, це може допомогти?
Майк Співі

2
Не впевнений, чому ви вважаєте, що аргумент Вазірані не працює для загального LP. Особисто мені найкраще подобається це пояснення.
Суреш Венкат

1
Ви питаєте про слабку подвійність чи про сильну подвійність?
Цуйосі Іто

7
Ви можете отримати геометричну інтуїцію, візуалізуючи (у 2d, скажімо), що означає приймати лінійну комбінацію обмежень. Наприклад, намалюйте обмеження і в площині. Лінійні комбінації цих обмежень дають вам для будь-якого . Намалюйте це, щоб побачити це. Як правило, лінійна комбінація обмежень дає вам опорні напівпростори багатогранників. А тепер запитайте, чому одного із таких опорних проміжків завжди достатньо, щоб самому задати вартість? Якщо ви це бачите, це сильна подвійність. y 1 a x + b y a + b a , b 0х1у1ах+буа+ба,б0
Ніл Янг

@MikeSpivey - Я хочу, щоб ваш коментар був відповіддю :)
Кандидат наук

Відповіді:


19

За бажанням ОП, ось відповідь math.SE, на яку я посилаюсь у своєму коментарі вище.


Можливо, варто поговорити, звідки походить дуал на прикладі проблеми. Це займе певний час, але, сподіваємось, дуал не здасться настільки загадковим, коли ми закінчимо.

Припустимо, з первісною проблемою є наступне.

Пriмал={макс    5х1-6х2   с.т.    2х1-х2=1              х1+3х29    х10}

Тепер, припустимо, ми хочемо використати обмеження примату як спосіб знайти верхню межу оптимального значення прима. Якщо помножити перше обмеження на , друге обмеження на , і скласти їх разом, отримаємо для лівої сторони та для правого боку. Оскільки перше обмеження - це рівність, а друге - нерівність, то це означає Але оскільки , то також вірно, що , і так Отже, є верхньою межею щодо оптимального значення первинної задачі.1 9 ( 2 x 1 - x 2 ) + 1 ( x 1 + 3 x 2 ) 9 ( 1 ) + 1 ( 9 ) 19 x 1 - 6 x 218. x 10 5 x 119 x 1 5 x 1 - 6 x 219 x 1919(2х1-х2)+1(х1+3х2)9(1)+1(9)
19x16x218.
x105x119x118
5x16x219x16x218.
18

Звичайно, ми можемо зробити і краще, ніж це. Замість того, щоб просто вгадувати і як множники, давайте нехай вони будуть змінними. Таким чином, ми шукаємо множників і щоб змусити1 y 1 y 2 5 x 1 - 6 x 2y 1 ( 2 x 1 - x 2 ) + y 2 ( x 1 + 3 x 2 ) y 1 ( 1 ) + y 2 ( 9 ) .91y1y2

5x16x2y1(2x1x2)+y2(x1+3x2)y1(1)+y2(9).

Тепер, щоб ця пара нерівностей була дотримана, що має бути правдою щодо та ? Візьмемо по черзі дві нерівності.y 2у1у2


Перша нерівність :5х1-6х2у1(2х1-х2)+у2(х1+3х2)

Ми повинні відстежувати коефіцієнти змінних та окремо. По-перше, нам потрібен загальний коефіцієнт праворуч, принаймні, . Отримати точно було б чудово, але оскільки , все, що перевищує , також задовольнило б нерівність для . Математично кажучи, це означає, що нам потрібно .x 2 x 1 5 5 x 10 5 x 1 2 y 1 + y 25х1х2х155х105х12у1+у25

З іншого боку, для забезпечення нерівності для змінної нам потрібен загальний коефіцієнт в правій частині дорівнює . Оскільки може бути позитивним, ми не можемо опуститись нижче ніж , а оскільки може бути негативним, ми не можемо піднятись вище (оскільки від'ємне значення для переверне напрямок нерівності). Отже, для першої нерівності, яка працює для змінної , нам доведеться мати .х2х2-6х2-6х2-6х2х2-у1+3у2=-6


Друга нерівність :у1(2х1-х2)+у2(х1+3х2)у1(1)+у2(9)

Тут ми повинні відслідковувати змінні та окремо. У змінні відбуваються з першого обмеження, що є стримуючим фактором рівності. Не має значення, якщо є позитивним чи негативним, обмеження рівності все ще виконується. Таким чином, не обмежений у знаку. Однак змінна походить від другого обмеження, яке є меншим або рівним обмеженням. Якби ми помножили друге обмеження на від’ємне число, яке переверне його напрямок і змінить його на обмеження, що перевищує або рівне. Щоб дотримуватися нашої мети - верхньої межі первинної мети, ми не можемо цього дозволити. Отже,у1у2у1у1у1у2у2змінна не може бути негативною. Таким чином, у нас повинно бути .у20

Нарешті, ми хочемо зробити праву частину другої нерівності якомога меншою, оскільки ми хочемо максимально жорсткої верхньої межі щодо первинної мети. Таким чином, ми хочемо мінімізувати .у1+9у2


Поклавши всі ці обмеження на та разом, ми виявимо, що проблема використання обмежень прималу для пошуку найкращої верхньої межі оптимальної первинної мети тягне за собою вирішення наступної лінійної програми:у1у2

Мінімізуйте у1+9у2на тему 2у1+у25-у1+3у2=-6у20.

І це подвійне.


Напевно, варто узагальнити наслідки цього аргументу для всіх можливих форм первинного та подвійного. Наступна таблиця взята із с. 214 Введення в експлуатаційні дослідження , 8-е видання, Гільєр та Ліберман. Вони посилаються на це як на метод SOB, де SOB розшифровується як Senzible, Odd або Bizarre, залежно від того, наскільки вірогідним виявиться таке обмеження чи змінне обмеження в проблемі максимізації чи мінімізації.

             Primal Problem                           Dual Problem
             (or Dual Problem)                        (or Primal Problem)

             Maximization                             Minimization

Sensible     <= constraint            paired with     nonnegative variable
Odd          =  constraint            paired with     unconstrained variable
Bizarre      >= constraint            paired with     nonpositive variable

Sensible     nonnegative variable     paired with     >= constraint
Odd          unconstrained variable   paired with     = constraint
Bizarre      nonpositive variable     paired with     <= constraint

7

Розвиваючи відповідь Майка та коментар Вазірані, ви отримуєте дуал, розглядаючи загальну форму доказу оптимальності для вирішення вихідної проблеми. Припустимо, у вас є проблема максимізації, враховуючи деякі лінійні нерівності, і без втрати спільності припустимо, що ви намагаєтеся максимізувати змінну . Давши рішення, в якому , як ми можемо знати, що це оптимально? Один із способів полягає в тому, щоб спробувати встановити обмеження на , взявши лінійні комбінації лінійних нерівностей. Деякі лінійні комбінації дають вам оцінку виду , і ви намагаєтеся отримати кращий (мінімальний) можливо. Слабка подвійність стверджує, щохх=БххССБхвС, що очевидно за визначенням. Сильні держави подвійності , що , коли конечна, то . Це означає, що якщо максимум то є "причина", що ви не можете вийти за межі , що подвоюється як доказ оптимальності.ББ=хвСББ

ffS,Оf(S)(1-1/е)f(О)fff(О)=1f(S)хвf(S)=1-1/е1-1/еf(S)1-1/е

Це залишає відкритим питання про те, чому насправді сильна подвійність. Існує два докази цього факту для лінійного програмування, одне за участю симплексного алгоритму, а інше лекцію Фаркаса. Лема Фаркаса - це, мабуть, "правильний" спосіб зрозуміти ситуацію, зводивши все до якогось інтуїтивного геометричного факту. Однак, зізнаюся, ця інтуїція перевертає мою голову.

У більш загальних ситуаціях (скажімо, напіввизначене програмування) вам потрібно використовувати більш загальні умови Каруша-Куна-Таккера (форма множників Лагранжа), щоб отримати подвійність та умови для сильної подвійності. Це розглядається в текстах про нелінійну або опуклу оптимізацію.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.