Заміна шаблону відповідності шаблону на sed

14

У мене вихідний код поширюється на кілька файлів.

Він має шаблон, abcdefякий мені потрібно замінити pqrstuvxyz.
Модель може бути Abcdef(Справа вирок), тоді її потрібно замінити Pqrstuvxyz.
Модель може бути AbCdEf(вимкнути випадок), тоді її потрібно замінити PqRsTuVxYz.

Коротше кажучи, мені потрібно відповідати випадку вихідного шаблону та застосувати відповідний шаблон призначення.

Як я можу досягти цього за допомогою sedбудь-якого іншого інструменту?

text-processing sed awk

— користувач1263746
джерело

А якщо це ABcDeF?

— Стефан Шазелас

PQrStUvxyz - я розумію.

— користувач1263746

Тож якщо ABcDeF-> PQrStUvxyz, то точно AbCdEf-> PqRsTuvxyzбуде логічно послідовним. Якщо справа має бути скопійована з одного рядка в інший, що має відбутися, якщо другий рядок заміни довший.

— Graeme

Добре дозволяє підстригти заміну на "pqrstu" заради стислості.

— користувач1263746

9

Портативне рішення з використанням sed:

sed '
:1
/[aA][bB][cC][dD][eE][fF]/!b
s//\
&\
pqrstu\
PQRSTU\
/;:2
s/\n[[:lower:]]\(.*\n\)\(.\)\(.*\n\).\(.*\n\)/\2\
\1\3\4/;s/\n[^[:lower:]]\(.*\n\).\(.*\n\)\(.\)\(.*\n\)/\3\
\1\2\4/;t2
s/\n.*\n//;b1'

З GNU sed це трохи простіше:

search=abcdef replace=pqrstuvwx
sed -r ":1;/$search/I!b;s//\n&&&\n$replace\n/;:2
    s/\n[[:lower:]](.*\n)(.)(.*\n)/\l\2\n\1\3/
    s/\n[^[:lower:]](.*\n)(.)(.*\n)/\u\2\n\1\3/;t2
    s/\n.*\n(.*)\n/\1/g;b1"

Використовуючи &&&вище, ми повторно випадок шаблон рядки для іншої частини заміни, так ABcdefбуде змінений PQrstuVWxі AbCdEfв PqRsTuVwX. Змініть його, щоб &впливати лише на регістр перших 6 символів.

(зауважте, що він може не робити те, що ви хочете, або може зіткнутися з нескінченним циклом, якщо заміна може підлягати заміні (наприклад, при заміні fooна fooабо bcdна abcd)

— Стефан Хазелас
джерело

8

Портативне рішення з використанням awk:

awk -v find=abcdef -v rep=pqrstu '{
  lwr=tolower($0)
  offset=index(lwr, tolower(find))

  if( offset > 0 ) {
    printf "%s", substr($0, 0, offset)
    len=length(find)

    for( i=0; i<len; i++ ) {
      out=substr(rep, i+1, 1)

      if( substr($0, offset+i, 1) == substr(lwr, offset+i, 1) )
        printf "%s", tolower(out)
      else
        printf "%s", toupper(out)
    }

    printf "%s\n", substr($0, offset+len)
  }
}'

Приклад введення:

other abcdef other
other Abcdef other
other AbCdEf other

Приклад виводу:

other pqrstu other
other Pqrstu other
other PqRsTu other

Оновлення

Як зазначено в коментарях, вищезазначене замінить лише перший екземпляр findу кожному рядку. Щоб замінити всі екземпляри:

awk -v find=abcdef -v rep=pqrstu '{
  input=$0
  lwr=tolower(input)
  offset=index(lwr, tolower(find))

  if( offset > 0 ) {
    while( offset > 0 ) {

      printf "%s", substr(input, 0, offset)
      len=length(find)

      for( i=0; i<len; i++ ) {
        out=substr(rep, i+1, 1)

        if( substr(input, offset+i, 1) == substr(lwr, offset+i, 1) )
          printf "%s", tolower(out)
        else
          printf "%s", toupper(out)
      }

      input=substr(input, offset+len)
      lwr=substr(lwr, offset+len)
      offset=index(lwr, tolower(find))
    }

    print input
  }
}'

Приклад введення:

other abcdef other ABCdef other
other Abcdef other abcDEF
other AbCdEf other aBCdEf other

Приклад виводу:

other pqrstu other PQRstu other
other Pqrstu other pqrSTU
other PqRsTu other pQRsTu other

— Graeme
джерело

Зауважте, що обробляє лише один примірник на рядок.

— Stéphane Chazelas

@StephaneChazelas, оновлений для обробки декількох примірників.

— Graeme

6

Ви можете використовувати perl. Прямо з faq - цитування від perldoc perlfaq6:

Як я замінюю регістр на LHS без збереження справи при збереженні справи на RHS?

Ось прекрасне рішення Perlish від Ларрі Рослера. Він використовує властивості розрядного xor на рядках ASCII.

   $_= "this is a TEsT case";

   $old = 'test';
   $new = 'success';

   s{(\Q$old\E)}
   { uc $new | (uc $1 ^ $1) .
           (uc(substr $1, -1) ^ substr $1, -1) x
           (length($new) - length $1)
   }egi;

   print;

І ось це як підпрограма, змодельована за вищезазначеним:

       sub preserve_case($$) {
               my ($old, $new) = @_;
               my $mask = uc $old ^ $old;

               uc $new | $mask .
                       substr($mask, -1) x (length($new) - length($old))
   }

       $string = "this is a TEsT case";
       $string =~ s/(test)/preserve_case($1, "success")/egi;
       print "$string\n";

Це відбитки:

           this is a SUcCESS case

В якості альтернативи, щоб зберегти регістр слова заміни, якщо воно довше оригіналу, ви можете використовувати цей код Джеффа Піняна:

   sub preserve_case {
           my ($from, $to) = @_;
           my ($lf, $lt) = map length, @_;

           if ($lt < $lf) { $from = substr $from, 0, $lt }
           else { $from .= substr $to, $lf }

           return uc $to | ($from ^ uc $from);
           }

Це змінює речення на "це випадок SUcCess".

Просто для того, щоб показати, що програмісти на C можуть писати C будь-якою мовою програмування, якщо ви віддаєте перевагу більш подібному C рішенню, наступний сценарій змушує заміну мати той самий випадок, буква за буквою, як оригінал. (Також трапляється запускати приблизно на 240% повільніше, ніж працює рішення Perlish.) Якщо підміна має більше символів, ніж рядок, що підміняється, для останньої заміни використовується випадок останнього символу.

   # Original by Nathan Torkington, massaged by Jeffrey Friedl
   #
   sub preserve_case($$)
   {
           my ($old, $new) = @_;
           my ($state) = 0; # 0 = no change; 1 = lc; 2 = uc
           my ($i, $oldlen, $newlen, $c) = (0, length($old), length($new));
           my ($len) = $oldlen < $newlen ? $oldlen : $newlen;

           for ($i = 0; $i < $len; $i++) {
                   if ($c = substr($old, $i, 1), $c =~ /[\W\d_]/) {
                           $state = 0;
                   } elsif (lc $c eq $c) {
                           substr($new, $i, 1) = lc(substr($new, $i, 1));
                           $state = 1;
                   } else {
                           substr($new, $i, 1) = uc(substr($new, $i, 1));
                           $state = 2;
                   }
           }
           # finish up with any remaining new (for when new is longer than old)
           if ($newlen > $oldlen) {
                   if ($state == 1) {
                           substr($new, $oldlen) = lc(substr($new, $oldlen));
                   } elsif ($state == 2) {
                           substr($new, $oldlen) = uc(substr($new, $oldlen));
                   }
           }
           return $new;
   }

— devnull
джерело

Зауважте, що він обмежений літерами ASCII.

— Стефан Шазелас

5

Якщо ви обрізаєте заміну pqrstu, спробуйте це:

Вхід:

abcdef
Abcdef
AbCdEf
ABcDeF

Вихід:

$ perl -lpe 's/$_/$_^lc($_)^"pqrstu"/ei' file
pqrstu
Pqrstu
PqRsTu
PQrStU

Якщо ви хочете замінити prstuvxyz, можливо, це:

$ perl -lne '@c=unpack("(A4)*",$_);
    $_ =~ s/$_/$_^lc($_)^"pqrstu"/ei;
    $c[0] =~ s/$c[0]/$c[0]^lc($c[0])^"vxyz"/ei;
    print $_,$c[0]' file
pqrstuvxyz
PqrstuVxyz
PqRsTuVxYz
PQrStUVXyZ

Я не можу знайти жодного правила для картування ABcDeF-> PQrStUvxyz.

— cuonglm
джерело

Зауважте, що він обмежений літерами ASCII.

— Стефан Шазелас

3

Щось подібне робило б те, що ви описали.

sed -i.bak -e "s/abcdef/pqrstuvxyz/g" \
 -e "s/AbCdEf/PqRsTuVxYz/g" \
 -e "s/Abcdef/Pqrstuvxyz/g" files/src

— UnX
джерело