Я використовую оболонку AIX 6,1 кшш.
Я хочу використовувати один вкладиш, щоб зробити щось подібне:
cat A_FILE | skip-first-3-bytes-of-the-file
Я хочу пропустити перші 3 байти першого рядка; чи є спосіб це зробити?
Я використовую оболонку AIX 6,1 кшш.
Я хочу використовувати один вкладиш, щоб зробити щось подібне:
cat A_FILE | skip-first-3-bytes-of-the-file
Я хочу пропустити перші 3 байти першого рядка; чи є спосіб це зробити?
Відповіді:
Стара школа - ви можете використовувати dd
:
dd if=A_FILE bs=1 skip=3
Вхідний файл є A_FILE
, розмір блоку - 1 символ (байт), пропустіть перші 3 'блоки' (байти). (З деякими варіантами, dd
такими як GNU dd
, ви можете використовувати bs=1c
тут - і альтернативи, як bs=1k
читати в блоках по 1 кілобайт за інших обставин. На dd
AIX це не підтримує, здається; варіант BSD (macOS Sierra) не підтримує c
але підтримує k
, m
, g
і т.д.)
Є й інші способи досягти того ж результату:
sed '1s/^...//' A_FILE
Це працює, якщо в першому рядку є 3 або більше символів.
tail -c +4 A_FILE
І ви також можете використовувати Perl, Python тощо.
Замість використання cat
ви можете використовувати tail
як таке:
tail -c +4 FILE
Це виведе весь файл, за винятком перших 3 байтів. Зверніться man tail
за додатковою інформацією.
/usr/xpg4/bin/tail
, принаймні, на моїй машині. Хороший рада все-таки!
Мені потрібно було нещодавно зробити щось подібне. Я допомагав у вирішенні проблем із підтримкою на місцях, і мені було потрібно, щоб технік бачив сюжети в реальному часі під час внесення змін. Дані знаходяться у двійковому журналі, який росте протягом дня. У мене є програмне забезпечення, яке може аналізувати та будувати дані з журналів, але наразі це не в режимі реального часу. Що я зробив - це захопити розмір журналу, перш ніж я почав обробляти дані, потім перейшов у цикл, який обробляв би дані, і кожен прохід створював новий файл з байтами файлу, який ще не був оброблений.
#!/usr/bin/env bash
# I named this little script hackjob.sh
# The purpose of this is to process an input file and load the results into
# a database. The file is constantly being update, so this runs in a loop
# and every pass it creates a new temp file with bytes that have not yet been
# processed. It runs about 15 seconds behind real time so it's
# pseudo real time. This will eventually be replaced by a real time
# queue based version, but this does work and surprisingly well actually.
set -x
# Current data in YYYYMMDD fomat
DATE=`date +%Y%m%d`
INPUT_PATH=/path/to/my/data
IFILE1=${INPUT_PATH}/${DATE}_my_input_file.dat
OUTPUT_PATH=/tmp
OFILE1=${OUTPUT_PATH}/${DATE}_my_input_file.dat
# Capture the size of the original file
SIZE1=`ls -l ${IFILE1} | awk '{print $5}'`
# Copy the original file to /tmp
cp ${IFILE1} ${OFILE1}
while :
do
sleep 5
# process_my_data.py ${OFILE1}
rm ${OFILE1}
# Copy IFILE1 to OFILE1 minus skipping the amount of data already processed
dd skip=${SIZE1} bs=1 if=${IFILE1} of=${OFILE1}
# Update the size of the input file
SIZE1=`ls -l ${IFILE1} | awk '{print $5}'`
echo
DATE=`date +%Y%m%d`
done
ls
; Ви думали про використання stat -c'%s' "${IFILE}"
замість цього ls|awk
комбо? Тобто, якщо припустити GNU coreutils ...
Якщо в їхній системі є Python, можна скористатися невеликим сценарієм python, щоб скористатися seek()
функцією, щоб почати читати в n-му байті так:
#!/usr/bin/env python3
import sys
with open(sys.argv[1],'rb') as fd:
fd.seek(int(sys.argv[2]))
for line in fd:
print(line.decode().strip())
І використання буде таким:
$ ./skip_bytes.py input.txt 3
Зауважте, що кількість байтів починається з 0 (таким чином перший байт - це фактично індекс 0), таким чином, вказуючи 3, ми ефективно розміщуємо зчитування, починаючи з 3 + 1 = 4-й байт
dd if=A_FILE bs=1 skip=3
в AIX 6.1