У мене є файл, який виглядає приблизно так:
ID101 G T freq=.5 nonetype ANC=.1 addinfor
ID102 A T freq=.3 ANC=.01 addinfor
ID102 A T freq=.01 type=1 ALT=0.022 ANC=.02 addinfor
Як бачите, кожен рядок має дещо іншу кількість стовпців. Я спеціально хочу колонку 1, колонку 2, колонку 3, колонку 4 і стовпець, який починається зANC=
Бажаний вихід:
ID101 G T freq=.5 ANC=.1
ID102 A T freq=.3 ANC=.01
ID102 A T freq=.01 ANC=.02
Я зазвичай використовую команду awk для розбору файлів:
awk 'BEGIN {OFS = "\t"} {print $1, $2, $3, $4}'
Чи є простий спосіб змінити цю команду для роботи в таких ситуаціях?
Я думаю, що щось подібне може спрацювати:
awk '{for(j=1;j<=NF;j++){if($j~/^ANC=/){print $j}}}'
Однак як я можу редагувати це, щоб також надрукувати перші колонки?
i=5
?