80186 код машини + DOS, 91 байт
Текстова версія:
hm j j PPjzjzjgaAAA JSJJ RU Sq ReAA JdJJJ RfiJElK JEiS GtI And she said But that s his
Текстова версія, вкладки (код 9) замінена на 9
пробіли, а пробіли (код 32) замінені на *
:
hm9j9j9PPjzjzjgaAAA9JSJJ9RU9Sq9ReAA9JdJJJ9RfiJElK9JEiS*GtI*And*she*said***But*that*s*his***
Hexdump:
68 6D 09 6A 09 6A 09 50 50 6A 7A 6A 7A 6A 67 61
41 41 41 09 4A 53 4A 4A 09 52 55 09 53 71 09 52
65 41 41 09 4A 64 4A 4A 4A 09 52 66 69 4A 45 6C
4B 09 4A 45 69 53 20 47 74 49 20 41 6E 64 20 73
68 65 20 73 61 69 64 20 20 20 42 75 74 20 74 68
61 74 20 73 20 68 69 73 20 20 20
Машинний код з'являється у файлі з розширенням .com
. Коли я запускаю його, він роздруковує потрібне повідомлення, а потім висить (виконує випадкові дані).
Пояснення на високому рівні про те, що це робить:
- Ініціалізує регістри з постійними значеннями
- Заміщує пробіли в повідомленні необхідними спеціальними символами (
,'.$
)
- Виправляє код для створення
int 21
інструкції, яка друкує повідомлення
- Дзвінки DOS
Код складання (можна скласти з tasm
):
my_bp equ 7ah
my_si equ 7ah
my_di equ 67h
my_msg equ 13bh
.model tiny
.code
.startup
.186
org 100h
push 96dh ; ax (ah = 0; al = don't care, but see below)
push 9 ; cx
push 9 ; dx
push ax ; bx = don't care
push ax ; don't care
push my_bp
push my_si
push my_di
popa
inc cx
inc cx
inc cx
or [bp+si+my_msg-my_bp-my_si+12], cx ; ,
dec dx
dec dx
or [bp+si+my_msg-my_bp-my_si+14], dx ; '
or [bp+di+my_msg-my_bp-my_di+23], dx ; '
or [bp+si+my_msg-my_bp-my_si+30], dx ; '
inc cx
inc cx
or [bp+si+my_msg-my_bp-my_si+29], cx ; .
dec dx
dec dx
dec dx
or [bp+si+my_msg-my_bp-my_si+31], dx ; $
; 0x2049 * 0x4b6c = 0x98301cc
; So this sets cx to 1cc (a temporary constant used to patch code)
imul cx, [bp+si+my_msg-my_bp-my_si-2], 4b6ch
; 0x1cc | 0x2049 = 0x21cd (the instruction which calls DOS int 21)
; Here ah = 9 ("print" mode)
or [bp+si+my_msg-my_bp-my_si-2], cx
; At address 101, there is the constant 96d, which was loaded into ax
; 0x96d * 0x7447 = 0x448013b
; So the following sets dx to 13b (adddress of the message)
imul dx, [bp+di+101h-my_bp-my_di], 7447h
int21:
dw 2049h
db 'And she said But that s his '
end
Він використовує popa
інструкцію для появи всіх регістрів, тому що регулярний pop
не може заповнити всі необхідні регістри (наприклад pop di
, заборонений код).
Адреси байтів для виправлення знаходяться в діапазоні 0x100 ... 0x160. На щастя, їх можна представити у вигляді суми в 3 байти з дозволеними значеннями:
- 0x7a в
bp
- 0x7a або 0x67 в
si
абоdi
- Негайне значення
Патчінг байтів у повідомленні працює, здійснюючи логічне значення OR
0x20 (пробіл) та малу константу (4, 7, 12 або 14). Мала константа виходить шляхом ініціалізації cx
та dx
до 9 (символ табуляції) та виконуючи INC
або DEC
за потреби
Для виправлення коду використовується IMUL
інструкція. Я знайшов потрібні 16-бітові константи для множення, використовуючи грубу силу пошуку.
Нарешті, адреса повідомлення (0x13b) отримується шляхом множення. Для економії місця я взяв одну з констант з однієї з інструкцій, яка містить негайне значення 0x96d
. Тут 9
частина вибирає функцію друку DOS, а 6d
частина - вільний параметр. Виявляється, 6d
це єдина можливість, яка може дати 0x13b після множення.
Розбирання кодової частини:
06BA:0100 686D09 PUSH 096D
06BA:0103 6A09 PUSH +09
06BA:0105 6A09 PUSH +09
06BA:0107 50 PUSH AX
06BA:0108 50 PUSH AX
06BA:0109 6A7A PUSH +7A
06BA:010B 6A7A PUSH +7A
06BA:010D 6A67 PUSH +67
06BA:010F 61 POPA
06BA:0110 41 INC CX
06BA:0111 41 INC CX
06BA:0112 41 INC CX
06BA:0113 094A53 OR [BP+SI+53],CX
06BA:0116 4A DEC DX
06BA:0117 4A DEC DX
06BA:0118 095255 OR [BP+SI+55],DX
06BA:011B 095371 OR [BP+DI+71],DX
06BA:011E 095265 OR [BP+SI+65],DX
06BA:0121 41 INC CX
06BA:0122 41 INC CX
06BA:0123 094A64 OR [BP+SI+64],CX
06BA:0126 4A DEC DX
06BA:0127 4A DEC DX
06BA:0128 4A DEC DX
06BA:0129 095266 OR [BP+SI+66],DX
06BA:012C 694A456C4B IMUL CX,[BP+SI+45],4B6C
06BA:0131 094A45 OR [BP+SI+45],CX
06BA:0134 6953204774 IMUL DX,[BP+DI+20],7447
06BA:0139 CD21 INT 21 (after the code patches itself)
Факт забави: Зазвичай я використовував би offset message
замість жорсткого кодування 13bh
, але в цьому випадку, оскільки під час розбору його адреси невідомо, тасм генерує 16-бітове негайне зміщення, витрачаючи 1 байт коду:
06BA:0131 098A4600 OR [BP+SI+0046],CX