Яка функція push / pop інструкцій, що використовуються в регістрах у збірці x86?

Question 1

Читаючи про асемблер, я часто стикаюся з людьми, які пишуть, що вони штовхають певний регістр процесора і вмикають його пізніше, щоб відновити попередній стан.

Як можна натиснути реєстр? Куди його штовхають? Навіщо це потрібно?
Це зводиться до однієї інструкції процесора чи вона більш складна?

Question 2

натискання значення (не обов'язково зберігається в реєстрі) означає запис його в стек.

вискакування означає відновлення того, що знаходиться поверх стека, в реєстрі. Це основні вказівки:

push 0xdeadbeef      ; push a value to the stack
pop eax              ; eax is now 0xdeadbeef

; swap contents of registers
push eax
mov eax, ebx
pop ebx

Question 3

Ось як ви натискаєте реєстр. Я припускаю, що мова йде про x86.

push ebx
push eax

Його штовхають на стек. Значення ESPреєстру зменшується до розміру штовханого значення, оскільки стек зростає вниз у системах x86.

Це потрібно для збереження цінностей. Загальне використання

push eax           ;   preserve the value of eax
call some_method   ;   some method is called which will put return value in eax
mov  edx, eax      ;    move the return value to edx
pop  eax           ;    restore original eax

A push- це одна інструкція в x86, яка робить дві речі внутрішньо.

Зменшити ESPрегістр на розмір штовханого значення.
Зберігайте значення, що надсилається, у поточну адресу ESPреєстру.

Question 4

Куди його штовхають?

esp - 4. Точніше:

esp віднімається від 4
значення підштовхується до esp

pop змінює це.

Система V ABI вказує Linux rspвказувати на розумне розташування стека, коли програма запускається: Що таке стан реєстру за замовчуванням при запуску програми (asm, linux)? яким зазвичай слід користуватися.

Як можна натиснути реєстр?

Приклад мінімального GNU GAS:

.data
    /* .long takes 4 bytes each. */
    val1:
        /* Store bytes 0x 01 00 00 00 here. */
        .long 1
    val2:
        /* 0x 02 00 00 00 */
        .long 2
.text
    /* Make esp point to the address of val2.
     * Unusual, but totally possible. */
    mov $val2, %esp

    /* eax = 3 */
    mov $3, %ea 

    push %eax
    /*
    Outcome:
    - esp == val1
    - val1 == 3
    esp was changed to point to val1,
    and then val1 was modified.
    */

    pop %ebx
    /*
    Outcome:
    - esp == &val2
    - ebx == 3
    Inverses push: ebx gets the value of val1 (first)
    and then esp is increased back to point to val2.
    */

Вищезазначене на GitHub із можливими твердженнями .

Навіщо це потрібно?

Це правда, що ці вказівки можуть бути легко реалізовані через mov, addі sub.

Вони вважають, що вони існують, це те, що ці комбінації інструкцій настільки часті, що Intel вирішила надати їх нам.

Причина, по якій ці комбінації є настільки частими, полягає в тому, що вони полегшують тимчасове збереження та відновлення значень регістрів, щоб вони не перезаписувались.

Щоб зрозуміти проблему, спробуйте скласти трохи коду С вручну.

Основною складністю є рішення, де буде зберігатися кожна змінна.

В ідеалі всі змінні вписувалися б у регістри, що є найшвидшим доступом до пам'яті (в даний час приблизно в 100 разів швидше, ніж оперативної пам'яті).

Але, звичайно, ми можемо мати більше змінних, ніж регістри, спеціально для аргументів вкладених функцій, тому єдиним рішенням є запис в пам’ять.

Ми могли б писати на будь-яку адресу пам’яті, але оскільки локальні змінні та аргументи викликів та повернень функції вписуються в гарний шаблон стека, який запобігає фрагментації пам’яті , це найкращий спосіб вирішити це. Порівняйте це з божевільністю написання розподілювача купи.

Потім ми дозволяємо компіляторам оптимізувати розподіл регістрів для нас, оскільки це NP завершено і є однією з найскладніших частин написання компілятора. Ця проблема називається розподілом регістрів , і вона ізоморфна розфарбуванню графіків .

Коли розподільник компілятора змушений зберігати речі в пам'яті, а не просто регістри, це відоме як розлив .

Це зводиться до однієї інструкції процесора чи вона більш складна?

Все, що ми точно знаємо, це те, що Intel документує a pushта popінструкцію, тому вони є однією інструкцією в цьому сенсі.

Внутрішньо він може бути розширений до декількох мікрокодів, один для модифікації, espа другий для введення-виведення в пам'ять, і триває кілька циклів.

Але також можливо, що сингл pushшвидший, ніж еквівалентна комбінація інших інструкцій, оскільки він є більш конкретним.

Це переважно не (дер) задокументовано:

Пітер Кордес згадує, що методи, описані на веб-сайті http://agner.org/optimize/microarchitecture.pdf, пропонують це зробити pushі popзробити одну єдину мікрооперацію.
Йохан зазначає, що оскільки Pentium M Intel використовує "механізм стека", який зберігає попередньо обчислені значення esp + regsize та esp-regsize, дозволяючи виконувати push і pop в одному загальному. Також згадується за адресою: https://en.wikipedia.org/wiki/Stack_register
Що таке мікрокод Intel?
/security/29730/processor-microcode-manipulation-to-change-opcodes
Скільки циклів процесора потрібно для кожної інструкції з монтажу?

Question 5

Реєстрації виштовхування та вискакування є за кадром еквівалентом цього:

push reg   <= same as =>      sub  $8,%rsp        # subtract 8 from rsp
                              mov  reg,(%rsp)     # store, using rsp as the address

pop  reg    <= same as=>      mov  (%rsp),reg     # load, using rsp as the address
                              add  $8,%rsp        # add 8 to the rsp

Зверніть увагу, що це синтаксис x86-64 At & t.

Використовується як пара, це дозволяє зберегти реєстр у стеку та відновити його пізніше. Є й інші способи використання.

Question 6

Майже всі процесори використовують стек. Стек програм - це техніка LIFO з апаратним підтримкою управління.

Стек - це обсяг програмної (ОЗП) пам'яті, який зазвичай виділяється у верхній частині купи пам'яті процесора і зростає (за вказівкою PUSH вказівник стека зменшується) у протилежному напрямку. Стандартним терміном для вставки в стек є PUSH, а для вилучення з стека - POP .

Керування стеком здійснюється через призначений для стека регістр ЦП, який також називається покажчиком стека, тому, коли процесор виконує POP або PUSH, вказівник стека завантажує / зберігає регістр або константу в пам’яті стека, і вказівник стека автоматично зменшується xor збільшується відповідно до кількості ссунутих слів або завантажений у (із) стека.

За допомогою інструкцій до асемблера ми можемо зберігати для стеку:

Регістри ЦП, а також константи.
Повернути адреси функцій або процедур
Функції / процедури вхідних / вихідних змінних
Локальні змінні функції / процедури.