[root@server]# awk '!seen[$0]++' out.txt > cleaned
awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error
Aborted
[root@server]#
"" Сервер "" має: 8 Гбайт оперативної пам'яті + 16 Гбайт SWAP, x> 300 ГБ вільного місця, amd64, настільний процесор. Науковий Linux 6.6. Більше нічого не працює на ньому, щоб зробити ЗАВАНТАЖЕННЯ. Awk перериває через кілька секунд .. out.txt становить ~ 1,6 Гб. GNU Awk 3.1.7.
Питання : Як я можу видалити повторювані рядки, зберігаючи порядок рядків? Справа теж важлива, наприклад: "A" і "a" - це два різних рядки, їх потрібно зберегти. Але "a" і "a" - це дублікат, потрібен лише перший.
Відповідь може бути у чому завгодно, якщо awk не для цього хороший .. то perl / sed .. у чому може бути проблема?
[root@server]# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 61945
max locked memory (kbytes, -l) 99999999
max memory size (kbytes, -m) unlimited
open files (-n) 999999
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 99999999
cpu time (seconds, -t) unlimited
max user processes (-u) 61945
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
[root@server]#
Оновлення: Я спробував це на машині RHEL, він не перериває, але я не встиг дочекатися його завершення. Чому SL linux відрізняється від RHEL?
Оновлення: я пробую віртуальні догадки Ubuntu 14 .. поки що це працює! Це не безмежна проблема: mawk 1.3.3
root@asdf-VirtualBox:~# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 51331
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 51331
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
root@asdf-VirtualBox:~#
awk
версії у двох машинах?
out.txt
? Чи працює та сама команда, якщо ви спробуєте її на меншому файлі? Скільки користувачів на машині? Чи було достатньо доступної пам’яті для процесу? Чи є щось особливе у рядку 8547098 вхідного файлу?