Видаліть кілька бітів і порахуйте


26

Розглянемо всі 2^nрізні двійкові рядки довжини nі припустимо n > 2. Ви можете видалити рівно b < n/2біти з кожного бінарного рядка, залишаючи рядки довжини n-b. Кількість відокремлених рядків залежить від того, які біти ви видалите. Якщо припустити, що ваша мета - залишити якомога менше решти різних рядків, ця задача полягає в тому, щоб написати код, щоб обчислити, скільки небагато можна залишити як функцію n.

Приклад n=3і b = 1. Ви можете залишити лише дві струни 11і 00.

Бо n=9і b = 1,2,3,4маємо70,18,6,2

Бо n=8і b = 1,2,3маємо40,10,4

Бо n=7і b = 1,2,3маємо20,6,2

Бо n=6і b = 1,2маємо12,4

Бо n=5і b = 1,2маємо6,2

Це питання було спочатку поставлене мною в 2014 році в іншій формі щодо МО .

Вхід і вихід

Ваш код повинен містити ціле число nі виводити одне ціле число для кожного значення, bпочинаючи з b = 0і збільшуючись.

Оцінка

Ваш бал - найбільший, nза який ваш код заповнюється за все b < n/2за хвилину на моєму ПК із ОС Linux. У разі перерв на краватку, найбільший bваш код отримує для спільних найбільших nвиграшів. У разі розриву краватки за цим критерієм, найшвидший код для найбільших значень nта bприймає рішення. Якщо час перебуває в межах секунди або двох один від одного, перша опублікована відповідь виграє.

Мови та бібліотеки

Ви можете використовувати будь-яку мову бібліотеки, яка вам подобається. Оскільки я маю запустити ваш код, це допоможе, якби він був безкоштовним (як у пиві) та працював у Linux.


Я вважаю, що b > 0додаткова потреба введення? Або просто n=3і b=0просто вивести 2^nв результаті?
Кевін Круїссен

@KevinCruijssen Це має вийти 2^nсправді.
Ануш

Крім того, ви говорите, що введення є одиничним nі одиничним b, але оцінка є найбільшою, nза яку код завершує все b < n/2за хвилину. Чи не було б краще мати один вхід nу такому випадку та вивести всі результати для 0 <= b < n/2? Або ми повинні забезпечити дві програми / функції: один приймає два входи nі b, і один приймає тільки введення nі виведення всіх результатів в діапазоні 0 <= b < n/2?
Kevin Cruijssen

2
Ну, я вже підтримав ваш виклик, тому не можу зробити це знову. :) Хоча я не маю уявлення, як це ефективно обчислити (ефективні алгоритми O - це те, що мені завжди було погано. І один із небагатьох предметів в ІТ-коледжі мені довелося переробляти пару разів), схоже, дуже цікавий виклик. Мені цікаво побачити, які відповіді люди придумують.
Кевін Кройсейсен

2
Чи є робочий приклад? Старше було б почати, як з точки зору коректності, так і для порівняння швидкості.
maxb

Відповіді:


6

Python 2.7 / Gurobi n = 9

Це рішення є дуже простим використанням ILP-вирішувача Gurobi для булевих змішаних цілісних проблем (MIP).

Єдина хитрість - вивести симетрію в доповненнях 1, щоб зменшити вдвічі розмір проблеми.

Використовуючи обмежену "вільну" ліцензію компанії Gurobi LLC, ми обмежуємося 2000 обмеженнями, але вирішення 10 дель 1 - це все-таки поза межами 60-секундного обмеження на моєму ноутбуці.

from gurobipy import *
from itertools import combinations

def mincover(n,d):
    bs = pow(2,n-1-d)
    m = Model()
    m.Params.outputFlag = 0
    b = {}
    for i in range(bs):
      b[i] = m.addVar(vtype=GRB.BINARY, name="b%d" % i)
    m.update()
    for row in range(pow(2,n-1)):
      x = {}
      for i in combinations(range(n), n-d):
        v = 0
        for j in range(n-d):
          if row & pow(2,i[j]):
            v += pow(2,j)
        if v >= bs:
          v = 2*bs-1-v
        x[v] = 1
      m.addConstr(quicksum(b[i] for i in x.keys()) >= 1)
    m.setObjective(quicksum(b[i] for i in range(bs) ), GRB.MINIMIZE)
    m.optimize()
    return int(round(2*m.objVal,0))

for n in range(4,10):
    for d in range((n//2)+1):
        print n, d, mincover(n,d)

ОНОВЛЕННЯ + CORR: 10,2 має оптимальний розмір рішення 31 (див. Наприклад) Gurobi не показує симетричного рішення розміром 30 (проблема повертає нездійсненно) .. [моя спроба показати асиметричну доцільність о 30 залишалася непереконливою після 9.5 годин виконання], наприклад, біт шаблони цілих чисел 0 7 13 14 25 28 35 36 49 56 63 64 95 106 118 128 147 159 170 182 195 196 200 207 225 231 240 243 249 252 255або0 7 13 14 19 25 28 35 36 49 56 63 64 95 106 118 128 159 170 182 195 196 200 207 225 231 240 243 249 252 255


Ви побили "найшвидший рекорд безмежної нагороди"?
користувач202729

Я не бачу тут жодної щедрості, що ви маєте на увазі?
jayprich

@ user202729 Так. Я встановив це занадто низько. Я мав би встановити це на n = 10 :)
Ануш

Власне вирішити це за n = 9 справа непроста. Ось чому ОП використовують наявну бібліотеку (яка повинна бути кращою, ніж рукописне рішення, як у мене).
користувач202729

1
Завдяки @ChristianSievers я бачу, що МО стверджує, що 10,2 має лише асиметричну оптимуму, яку я не можу спростувати і не перевірити. Якщо я видаляю ярлик припущення про симетрію, який працює до n = 9, виявляється, Гуробі все-таки може вирішити до n = 9 в необхідний час.
jayprich

3

C ++, n = 6

Груба сила з невеликими оптимізаціями.

#include<cassert>
#include<iostream>
#include<vector>

// ===========
/** Helper struct to print binary representation.
`std::cout<<bin(str,len)` prints (str:len) == the bitstring 
represented by last (len) bits of (str).
*/
struct bin{
    int str,len;
    bin(int str,int len):str(str),len(len){}
};
std::ostream& operator<<(std::ostream& str,bin a){
    if(a.len)
        return str<<bin(a.str>>1,a.len-1)<<char('0'+(a.str&1));
    else if(a.str)
        return str<<"...";
    else
        return str;
}
// ===========

/// A patten of (len) bits of ones.
int constexpr pat1(int len){
    return (1<<len)-1;
}

// TODO benchmark: make (res) global variable?

/**Append all distinct (subseqs+(sfx:sfxlen)) of (str:len) 
with length (sublen) to (res).
*/
void subseqs_(
    int str,int len,int sublen,
    int sfx,int sfxlen,
    std::vector<int>& res
){
    // std::cout<<"subseqs_ : str = "<<bin(str,len)<<", "
    // "sublen = "<<sublen<<", sfx = "<<bin(sfx,sfxlen)<<'\n';

    assert(len>=0);

    if(sublen==0){ // todo remove some branches can improve perf?
        res.push_back(sfx);
        return;
    }else if(sublen==len){
        res.push_back(str<<sfxlen|sfx);
        return;
    }else if(sublen>len){
        return;
    }

    if(str==0){
        res.push_back(sfx);
        return;
    }

    int nTrail0=0;
    for(int ncut;str&&nTrail0<sublen;

        ++nTrail0,
        ncut=__builtin_ctz(~str)+1, // cut away a bit'0' of str
        // plus some '1' bits
        str>>=ncut,
        len-=ncut
    ){
        ncut=__builtin_ctz(str)+1; // cut away a bit'1' of str
        subseqs_(str>>ncut,len-ncut,sublen-nTrail0-1,
            sfx|1<<(sfxlen+nTrail0),sfxlen+nTrail0+1,
            res
        ); // (sublen+sfxlen) is const. TODO global var?
    }

    if(nTrail0+len>=sublen) // this cannot happen if len<0
        res.push_back(sfx);
}

std::vector<int> subseqs(int str,int len,int sublen){
    assert(sublen<=len);
    std::vector<int> res;
    if(__builtin_popcount(str)*2>len){ // too many '1's, flip [todo benchmark]
        subseqs_(pat1(len)^str,len,sublen,0,0,res);
        int const p1sublen=pat1(sublen);
        for(int& r:res)r^=p1sublen;
    }else{
        subseqs_(str,len,sublen,0,0,res);
    }
    return res;
}

// ==========

/** Append all distinct (supersequences+(sfx:sfxlen)) of (str:len)
with length (suplen) to (res).
Define (a) to be a "supersequence" of (b) iff (b) is a subsequence of (a).
*/
void supseqs_(
    int str,int len,int suplen,
    int sfx,int sfxlen,
    std::vector<int>& res
){
    assert(suplen>=len);

    if(suplen==0){
        res.push_back(sfx);
        return;
    }else if(suplen==len){
        res.push_back(str<<sfxlen|sfx);
        return;
    }

    int nTrail0; // of (str)
    if(str==0){
        res.push_back(sfx);
        // it's possible that the supersequence is '0000..00'
        nTrail0=len;
    }else{
        // str != 0 -> str contains a '1' bit ->
        // supersequence cannot be '0000..00'
        nTrail0=__builtin_ctz(str);
    }
    // todo try `nTrail0=__builtin_ctz(str|1<<len)`, eliminates a branch
    // and conditional statement

    for(int nsupTrail0=0;nsupTrail0<nTrail0;++nsupTrail0){
        // (nsupTrail0+1) last bits of supersequence matches with 
        // nsupTrail0 last bits of str.
        supseqs_(str>>nsupTrail0,len-nsupTrail0,suplen-1-nsupTrail0,
            sfx|1<<(nsupTrail0+sfxlen),sfxlen+nsupTrail0+1,
            res);
    }

    int const strMatch=str?nTrail0+1:len; 
    // either '1000..00' or (in case str is '0000..00') the whole (str)

    for(int nsupTrail0=suplen+strMatch-len;nsupTrail0-->nTrail0;){
        // because (len-strMatch)<=(suplen-1-nsupTrail0),
        // (nsupTrail0<suplen+strMatch-len).

        // (nsupTrail0+1) last bits of supersequence matches with
        // (strMatch) last bits of str.
        supseqs_(str>>strMatch,len-strMatch,suplen-1-nsupTrail0,
            sfx|1<<(nsupTrail0+sfxlen),sfxlen+nsupTrail0+1,
            res);
    }

    // todo try pulling constants out of loops
}

// ==========

int n,b;
std::vector<char> done;
unsigned min_undone=0;

int result;
void backtrack(int nchoice){
    assert(!done[min_undone]);
    ++nchoice;
    std::vector<int> supers_s;
    for(int s:subseqs(min_undone,n,n-b)){
        // obviously (s) is not chosen. Try choosing (s)
        supers_s.clear();
        supseqs_(s,n-b,n,0,0,supers_s);
        for(unsigned i=0;i<supers_s.size();){
            int& x=supers_s[i];
            if(!done[x]){
                done[x]=true;
                ++i;
            }else{
                x=supers_s.back();
                supers_s.pop_back();
            }
        }

        unsigned old_min_undone=min_undone;
        while(true){
            if(min_undone==done.size()){
                // found !!!!
                result=std::min(result,nchoice);
                goto label1;
            }
            if(not done[min_undone])
                break;
            ++min_undone;
        }
        if(nchoice==result){
            // backtrack more will only give worse result
            goto label1;
        }

        // note that nchoice is already incremented
        backtrack(nchoice);

        label1: // undoes the effect of (above)
        for(int x:supers_s)
            done[x]=false;
        min_undone=old_min_undone;
    }
}

int main(){
    std::cin>>n>>b;

    done.resize(1<<n,0);
    result=1<<(n-b); // the actual result must be less than that

    backtrack(0);
    std::cout<<result<<'\n';
}

Запустити локально:

[user202729@archlinux golf]$ g++ -std=c++17 -O2 delbits.cpp -o delbits
[user202729@archlinux golf]$ time for i in $(seq 1 3); do ./delbits <<< "6 $i"; done
12
4
2

real    0m0.567s
user    0m0.562s
sys     0m0.003s
[user202729@archlinux golf]$ time ./delbits <<< '7 1'
^C

real    4m7.928s
user    4m7.388s
sys     0m0.173s
[user202729@archlinux golf]$ time for i in $(seq 2 3); do ./delbits <<< "7 $i"; done
6
2

real    0m0.040s
user    0m0.031s
sys     0m0.009s

1
Переважно заохочувати інших публікувати свій код, якщо він швидший, ніж мій.
користувач202729

Будь ласка? ... (зауважте: Це приклад проблеми з накриттям набору.)
user202729

1
Я над цим працюю. Я просто не можу придумати жодного розумного способу зробити це. Якщо ніхто більше не дасть відповіді, я поставлю свою, яка може зайняти лише n = 4.
mypetlion
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.