Оптимальне кешування


14

Вам буде надана послідовність запитів на пам'ять та розмір кешу. Ви повинні повернути найменшу кількість можливих пропусків кешу в рамках будь-якої стратегії заміни кешу.

Оптимальною стратегією є алгоритм Беладі , який ви можете використовувати, якщо хочете.


Система кешування працює так: Кеш починає порожнім. Надходять запити на пам'ять. Якщо запит запитує частину даних у кеші, все добре. Якщо ні, то ви маєте пропустити кеш. У цей момент ви можете вставити дані, які були запитуні, у кеш для подальшого використання. Якщо кеш був повний і ви хочете вставити нові дані, ви повинні вилучити дані, які раніше були в кеші. Ви ніколи не можете вставляти дані, які були не просто в кеші.

Ваша мета - знайти мінімально можливу кількість пропусків кешу для заданої послідовності запитів пам'яті та розміру кешу.


Вам буде надано розмір кешу, додатне ціле число та послідовність запитів на пам'ять, що є списком лексем. Ці жетони можуть бути будь-якими типами жетонів, якщо вам подобається щонайменше 256 різних жетонів (байти - це добре, булі - ні). Наприклад, вставки, рядки, списки все добре. За необхідності попросіть роз'яснення.


Тестові приклади:

3
[5, 0, 1, 2, 0, 3, 1, 2, 5, 2]

6

Дивіться у wikipedia інформацію про політику заміни, яка цього домагається.

2
[0, 1, 2, 0, 1, 0, 1]

3

Просто уникайте додавання 2в кеш.

3
[0, 1, 2, 1, 4, 3, 1, 0, 2, 3, 4, 5, 0, 2, 3, 4]

9

Один з способів досягти цього, ніколи не виселяє 0і 2, і виселяти 1якомога швидше після його останнього використання.


Оцінка: Це гольф з кодом. Виграє найменше байт.


Чи можна припустити, що список містить щонайменше 2 лексеми?
Арнольд

@Arnauld Я збираюся сказати "ні", хоча якщо є лише одне рішення, відповідь, звичайно, завжди 1.
isaacg

Відповіді:


4

JavaScript (ES6), 128 байт

Вводиться як " (size)(list).

s=>a=>a.map((x,i)=>c.includes(x)?0:c[e++,[x,...c].map(m=(x,j)=>(k=[...a,x].indexOf(x,i+1))<m||(p=j,m=k)),i<s?i:p-1]=x,e=c=[])&&e

Спробуйте в Інтернеті!

Прокоментував

Це реалізація алгоритму Беладі.

s => a =>                      // s = cache size; a[] = token list
  a.map((x, i) =>              // for each token x at position i in a[]:
    c.includes(x) ?            //   if x is currently stored in the cache:
      0                        //     do nothing
    :                          //   else:
      c[                       //     update the cache:
        e++,                   //       increment the number of errors (cache misses)
        [x, ...c]              //       we want to find which value among x and all current
                               //       cache values will be needed for the longest time in
                               //       the future (or not needed anymore at all)
        .map(m =               //       initialize m to a non-numeric value
                 (x, j) =>     //       for each x at position j in this array:
          ( k = [...a, x]      //         k = position of x in the array made of all values
            .indexOf(x, i + 1) //         of a[] followed by x, starting at i + 1
          ) < m                //         if it's greater than or equal to m, or m is
          || (p = j, m = k)    //         still non-numeric: set p to j and m to k
        ),                     //       end of inner map()
        i < s ?                //       if i is less than the cache size:
          i                    //         just fill the cache by using the next cache slot
        :                      //       else:
          p - 1                //         use the slot that was found above
                               //         special case: if p = 0, x was the best candidate
                               //         and we're going to store it at c[-1], which is
                               //         simply ignored (it will not trigger c.includes(x))
      ] = x,                   //     store x at this position
      e = c = []               //     start with e = [] (coerced to 0) and c = []
  ) && e                       // end of outer map; return e

4

Perl 5 , 193 байт

sub g{
  my($i,$m,$s,@a,%c)=(-1,0,@_);
  for(@a){
    $i++;
    next if $c{$_}++ || ++$m && keys%c <= $s;
    my($x,$d);
    for $k (sort keys %c){  #find which to delete, the one furtherst away
      my $n=0;
      ++$n && /^$k$/ && last for @a[$i+1..$#a];
      ($x,$d)=($n,$k) if $n>$x
    }
    delete $c{$d}
  }
  $m
}

Спробуйте в Інтернеті!

print g(3,  5, 0, 1, 2, 0, 3, 1, 2, 5, 2),"\n";                     # 6
print g(2,  0, 1, 2, 0, 1, 0, 1),"\n";                              # 3
print g(3,  0, 1, 2, 1, 4, 3, 1, 0, 2, 3, 4, 5, 0, 2, 3, 4),"\n";   # 9

193 байти без відступу, нових рядків, пробілів, коментарів:

sub g{my($i,$m,$s,@a,%c)=(-1,0,@_);for(@a){$i++;next if$c{$_}++||++$m&&keys%c<=$s;my($x,$d);for$k(sort keys%c){my$n=0;++$n&&/^$k$/&&last for@a[$i+1..$#a];($x,$d)=($n,$k)if$n>$x}delete$c{$d}}$m}


1

Хаскелл , 82 байти

f n|let(d:t)#c=1-sum[1|elem d c]+minimum[t#take n e|e<-scanr(:)(d:c)c];_#_=0=(#[])

Спробуйте в Інтернеті!

Пояснення

Працює грубою силою: всі стратегії кешування випробувані і найкращий результат повертається.

f n            Define a function f on argument n (cache size) and a list (implicit).
 |let(d:t)#c=  Define binary helper function #.
               Arguments are list with head d (current data) and tail t (remaining data), and list c (cache).
 1-            It returns 1 minus
 sum[1|        1 if
 elem d c]+    d is in the cache, plus
 minimum[      minimum of
 t#            recursive calls to # with list t
 take n e|     and cache being the first n values of e, where
 e<-           e is drawn from
 scanr(:)  c]  the prefixes of c
 (d:c)         with d and c tacked to the end.
 ;_#_=0        If the first list is empty, return 0.
 =(#[])        f then calls # with the list argument and empty cache.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.