Створення збалансованого BST з відсортованого списку цілих чисел


15

Давши унікальний, відсортований список цілих чисел, створіть збалансоване дерево бінарного пошуку, представлене у вигляді масиву без використання рекурсії.

Наприклад:

func( [1,2,3,5,8,13,21] ) => [5,2,13,1,3,8,21]

Перш ніж ми розпочнемо, підказка: ми можемо спростити цю проблему тонною, щоб нам насправді не довелося думати про вхідні цілі числа (або будь-який подібний об’єкт для цього!).

Якщо ми знаємо, що вхідний список вже відсортований, його вміст не має значення. Ми можемо просто подумати про це з точки зору індексів у вихідний масив.

Тоді внутрішнє представлення вхідного масиву стає:

func( [0,1,2,3,4,5,6] ) => [3,1,5,0,2,4,6]

Це означає, а не писати щось, що має справу з порівнянними об'єктами, нам дійсно потрібно лише записати функцію, яка відображається з діапазону [0, n) до отриманого масиву. Після того, як у нас з'явиться новий порядок, ми можемо просто застосувати відображення назад до значень на вході, щоб створити масив повернення.

Дійсні рішення повинні:

  • Прийміть масив із нульовими елементами та поверніть порожній масив.
  • Прийняти цілий масив довжиною n і повернути цілий масив
    • Довжина між n та наступною найвищою потужністю 2 мінус 1. (наприклад, для розміру входу 13 повертайтеся десь між 13 і 15).
    • Масив, який представляє BST, де кореневий вузол знаходиться в положенні 0 і висота дорівнює log (n), де 0 являє собою відсутній вузол (або nullзначення -подобне, якщо дозволяє ваша мова). Порожні вузли, якщо вони є, повинні існувати лише в кінці дерева (наприклад, [2,1,0])

Вхідний цілочисельний масив має такі гарантії:

  • Значення 32-бітових цілих чисел, що перевищують нуль.
  • Цінності унікальні.
  • Значення знаходяться у порядку зростання від нуля позиції.
  • Значення можуть бути рідкими (тобто не примикати один до одного).

Перемагає найкоротший код за кількістю символів ascii, але мені також цікаво побачити елегантні рішення для будь-якої конкретної мови.

Тестові справи

Виходи для простих масивів, що містять 1до nдля різних n. Як описано вище, останнє значення 0необов'язкове.

[]
[1]
[2,1,0]
[2,1,3]
[3,2,4,1,0,0,0]
[4,2,5,1,3,0,0]
[4,2,6,1,3,5,0]
[4,2,6,1,3,5,7]
[5,3,7,2,4,6,8,1,0,0,0,0,0,0,0]
[6,4,8,2,5,7,9,1,3,0,0,0,0,0,0]
[7,4,9,2,6,8,10,1,3,5,0,0,0,0,0]
[8,4,10,2,6,9,11,1,3,5,7,0,0,0,0]
[8,4,11,2,6,10,12,1,3,5,7,9,0,0,0]
[8,4,12,2,6,10,13,1,3,5,7,9,11,0,0]
[8,4,12,2,6,10,14,1,3,5,7,9,11,13,0]
[8,4,12,2,6,10,14,1,3,5,7,9,11,13,15]

Усі питання на цьому веб-сайті, чи головоломка для програмування чи кодовий гольф, повинні мати об'єктивний первинний критерій виграшу, щоб можна було безперечно вирішити, який запис повинен виграти.
Говард

@Howard Спасибі Оновлено визначеними критеріями переможця.
Джейк Уортон

1
Було б дуже корисно мати кілька тестових випадків, які охоплюють складні випадки, а не (як зараз) просто найпростіший.
Пітер Тейлор

Чи є якась причина для виключення рекурсії? Не те, щоб я дивився на рекурсивне рішення, але це здається і штучним, і непотрібним.
dmckee --- кошеня колишнього модератора

1
Чи може хтось пояснити, як список представляє BST?
justinpc

Відповіді:


4

Рубі , 143

s=ARGV.size;r,q=[],[[0,s]];s.times{b,e=q.shift;k=Math::log2(e-b).to_i-1;m=(e-b+2)>(3<<k)?b+(2<<k)-1:e-(1<<k);r<<ARGV[m];q<<[b,m]<<[m+1,e]};p r

Це (слабко) стисла версія наступного коду, яка в основному робить BFS на дереві.

def l(n)
    k = Math::log2(n).to_i-1
    if n+2 > (3<<k) then
        (2<<k)-1
    else
        n-(1<<k) 
    end
end

def bfs(tab)
  result = []
  queue = [[0,tab.size]]
  until queue.empty? do
    b,e = queue.shift
    m = b+l(e-b)
    result << tab[m]
    queue << [b,m] if b < m
    queue << [m+1,e] if m+1 < e
  end
  result
end

p bfs(ARGV)

Крім того, оскільки BFS, а не DFS, вимога нерекурсивного рішення не є істотною, і це ставить деякі мови в невигідне становище.

Редагувати: виправлене рішення, завдяки @PeterTaylor за його коментар!


@PeterTaylor Мав намір поставити 3 зліва від 4, але пробілів немає, тому це неправильно. Дякуємо, що вказали на це!
dtldarek

@PeterTaylor Виправлений за обідом, він повинен працювати зараз.
dtldarek

4

Java , 252

Гаразд, ось моя спроба. Я граю з бітовими операціями, і я придумав цей прямий спосіб обчислення індексу елемента в BST з індексу в початковому масиві.

Стисла версія

public int[]b(int[]a){int i,n=1,t;long x,I,s=a.length,p=s;int[]r=new int[(int)s];while((p>>=1)>0)n++;p=2*s-(1l<<n)+1;for(i=0;i<s;i++){x=(i<p)?(i+1):(p+2*(i-p)+1);t=1;while((x&1<<(t-1))==0)t++;I=(1<<(n-t));I|=((I-1)<<t&x)>>t;r[(int)I-1]=a[i];}return r;}

Нижче випливає довга версія.

public static int[] makeBst(int[] array) {
  long size = array.length;
  int[] bst = new int[array.length];

  int nbits = 0;
  for (int i=0; i<32; i++) 
    if ((size & 1<<i)!=0) nbits=i+1;

  long padding = 2*size - (1l<<nbits) + 1;

  for (int i=0; i<size; i++) {
    long index2n = (i<padding)?(i+1):(padding + 2*(i-padding) + 1);

    int tail=1;
    while ((index2n & 1<<(tail-1))==0) tail++;
    long bstIndex = (1<<(nbits-tail));
    bstIndex = bstIndex | ((bstIndex-1)<<tail & index2n)>>tail;

    bst[(int)(bstIndex-1)] = array[i];
  }
 return bst;
}

Вам потрібна кількість символів, і це в даний час не гольф.
dmckee --- кошеня колишнього модератора

@dmckee Я відредагував публікацію, щоб включити стиснуту версію та кількість символів
mikail sheikh

Гарне шоу. Б'юсь об заклад, що деякі з цих просторів непотрібні. В с, int[] b(int[] a)так само добре виражений, як int[]b(int[]a).
dmckee --- колишнє кошеня модератора

У вас є a.lengthрозподіл масиву. Змініть його на s. Позбудьтесь місця між for (декількома разів. Кожен для циклу створює a int i=0і також int t=0. Створіть за допомогою n( int n=0,i,t;), а потім просто i=0в петлях і t=1всередині. Оголосити внутрішнє long xі long Iз sі просто ініціалізувати у циклі ( long s=a.length,I,x;та x=../ I=..). Ви не повинні простору навколо подвійних і &.
Джейк Уортон

Також I=I|..можна записатиI|=..
Джейк Уортон

3
def fn(input):
    import math
    n = len(input)
    if n == 0:
        return []
    h = int(math.floor(math.log(n, 2)))
    out = []
    last = (2**h) - 2**(h+1) + n

    def num_children(level, sibling, lr):
        if level == 0:
            return 0
        half = 2**(level-1)
        ll_base = sibling * 2**level + lr * (half)
        ll_children = max(0, min(last, ll_base + half - 1) - ll_base + 1)
        return 2**(level-1) - 1 + ll_children

    for level in range(h, -1, -1):
        for sibling in range(0, 2**(h-level)):
            if level == 0 and sibling > last:
                break
            if sibling == 0:
                last_sibling_val = num_children(level, sibling, 0)
            else:
                last_sibling_val += 2 + num_children(level, sibling - 1, 1) \
                    + num_children(level, sibling, 0)
            out.append(input[last_sibling_val])
    return out

2

Не зовсім впевнений, чи точно це відповідає вашим вимогам, коли порожні вузли знаходяться в кінці дерева, і це, звичайно, не виграє жодних призів за стислість, але я думаю, що це правильно, і у нього є тестові випадки :)

public class BstArray {
    public static final int[] EMPTY = new int[] { };
    public static final int[] L1 = new int[] { 1 };
    public static final int[] L2 = new int[] { 1, 2 };
    public static final int[] L3 = new int[] { 1, 2, 3 };
    public static final int[] L4 = new int[] { 1, 2, 3, 5 };
    public static final int[] L5 = new int[] { 1, 2, 3, 5, 8 };
    public static final int[] L6 = new int[] { 1, 2, 3, 5, 8, 13 };
    public static final int[] L7 = new int[] { 1, 2, 3, 5, 8, 13, 21 };
    public static final int[] L8 = new int[] { 1, 2, 3, 5, 8, 13, 21, 35 };
    public static final int[] L9 = new int[] { 1, 2, 3, 5, 8, 13, 21, 35, 56 };
    public static final int[] L10 = new int[] { 1, 2, 3, 5, 8, 13, 21, 35, 56, 91 };

    public static void main(String[] args) {
        for (int[] list : Arrays.asList(EMPTY, L1, L2, L3, L4, L5, L6, L7, L8, L9, L10)) {
            System.out.println(Arrays.toString(list) + " => " + Arrays.toString(bstListFromList(list)));
        }
    }

    private static int[] bstListFromList(int[] orig) {
        int[] bst = new int[nextHighestPowerOfTwo(orig.length + 1) - 1];

        if (orig.length == 0) {
            return bst;
        }

        LinkedList<int[]> queue = new LinkedList<int[]>();
        queue.push(orig);

        int counter = 0;
        while (!queue.isEmpty()) {
            int[] list = queue.pop();
            int len = list.length;

            if (len == 1) {
                bst[counter] = list[0];
            } else if (len == 2) {
                bst[counter] = list[1];
                queue.add(getSubArray(list, 0, 1));
                queue.add(new int[] { 0 });
            } else if (len == 3) {
                bst[counter] = list[1];
                queue.add(getSubArray(list, 0, 1));
                queue.add(getSubArray(list, 2, 1));
            } else {
                int divide = len / 2;
                bst[counter] = list[divide];
                queue.add(getSubArray(list, 0, divide));
                queue.add(getSubArray(list, divide + 1, len - (divide + 1)));
            }
            counter++;
        }

        return bst;
    }

    private static int nextHighestPowerOfTwo(int n) {
        n--;
        n |= n >> 1;
        n |= n >> 2;
        n |= n >> 4;
        n |= n >> 8;
        n |= n >> 16;
        n++;

        return n;
    }

    private static int[] getSubArray(int[] orig, int origStart, int length) {
        int[] list = new int[length];
        System.arraycopy(orig, origStart, list, 0, length);
        return list;
    }
}

2

Гольфскрипт ( 99 89)

~]:b[]:^;{b}{{:|.,.2base,(2\?:&[-)&2/]{}$0=&(2/+:o[=]^\+:^;|o<.!{;}*|o)>.!{;}*}%:b}while^p

В основному прямий порт мого рішення Python працює майже так само.

Напевно, можна трохи покращити більше "гольфізмів", вже вдосконалених на 10 символів з введенням @ petertaylor :)


Я думаю, що це має бути можливим не більше 70 років, хоча я все ще не зовсім закінчив свою відповідь GolfScript. Однак є кілька простих удосконалень. !{;}{}ifможе бути лише !{;}*тому, що !гарантує повернення 0або 1. Ви можете використовувати неалфавітні маркери для змінних, так що якщо ви використовуєте ^замість r, |замість x, &замість того , yви можете усунути всі , що порожній простір.
Пітер Тейлор

@PeterTaylor Спасибі, не знав про не буквено-цифрові змінні, все ще дуже новий для golfscript :)
Йоахім Ісакссон

2

Java 192

Індекс карт на вході до індексу у виході

int[]b(int[]o){int s=o.length,p=0,u=s,i=0,y,r[]=new int[s],c[]=new int[s];while((u>>=1)>0)p++;for(int x:o){y=p;u=i;while(u%2>0){y--;u/=2;}r[(1<<y)-1+c[y]++]=x;i+=i>2*s-(1<<p+1)?2:1;}return r;}

Довга версія:

static int[] bfs(int[] o) {
  int rowCount = 32 - Integer.numberOfLeadingZeros(o.length); // log2
  int slotCount = (1<<rowCount) - 1; // pow(2,rowCount) - 1

  // number of empty slots at the end
  int emptySlots = slotCount - o.length;
  // where we start to be affected by these empty slots
  int startSkippingAbove = slotCount - 2 * emptySlots; // = 2 * o.length - slotCount

  int[] result = new int[o.length];
  int[] rowCounters = new int[rowCount]; // for each row, how many slots in that row are taken
  int i = 0; // index of where we would be if this was a complete tree (no trailing empty slots)
  for (int x : o) {
    // the row (depth) a slot is in is determined by the number of trailing 1s
    int rowIndex = rowCount - Integer.numberOfTrailingZeros(~i) - 1;
    int colIndex = rowCounters[rowIndex]++; // count where we are
    int rowStartIndex = (1 << rowIndex) - 1; // where this row starts in the result array

    result[rowStartIndex + colIndex] = x;

    i++;
    // next one has to jump into a slot that came available by not having slotCount values
    if (i > startSkippingAbove) i++;
  }

  return result;
}

2

Вольфрам Математика 11, 175 байт

g[l_]:=(x[a_]:=Floor@Min[i-#/2,#]&@(i=Length[a]+1;2^Ceiling@Log2[i]/2);Join@@Table[Cases[l//.{{}->{},b__List:>(n[Take[b,#-1],b[[#]],Drop[b,#]]&@x[b])},_Integer,{m}],{m,x[l]}])

Функція g[l]приймає як вхід a List(наприклад l={1,2,3,4,...}) і повертає a Listпотрібної форми. Він працює наступним чином:

  • x[a_]:=Floor@Min[i-#/2,#]&@(i=Length[a]+1;2^Ceiling@Log2[i]/2) бере список і знаходить корінь асоційованого BST.
    • i=Length[a]+1 ярлик для довжини списку
    • 2^Ceiling@Log2[i]/2 верхня межа значення кореня
    • Min[i-#/2,#]&@(...)Мінімум з двох аргументів, де #стоїть те, що знаходиться всередині(...)
  • l//.{...} Неодноразово застосовуйте правила заміни, які слідують l
  • {}->{} Нічого не робити (це крайня справа, щоб уникнути нескінченного циклу)
  • b__List:>(n[Take[b,#-1],b[[#]],Drop[b,#]]&@x[b])Розділити Listна{{lesser}, root, {greater}}
  • Cases[...,_Integer,{m}] Візьміть усі цілі числа на рівні (глибина) m
  • Table[...,{m,1,x[l]}]Для всіх mдо x[l](що насправді більше, ніж потрібно).

Це можна перевірити бігом

Table[g[Range[a]], {a, 0, 15}]//MatrixForm

Ця реалізація не включає проміжні нулі.


1

Пітон ( 175) 171)

Досить ущільнений, все ще досить читабельний;

def f(a):
 b=[a]
 while b:
  c,t=((s,2**(len(bin(len(s)))-3))for s in b if s),[]
  for x,y in c:
   o=min(len(x)-y+1,y/2)+(y-1)/2
   yield x[o]
   t+=[x[:o],x[o+1:]]
  b=t

Він повертає результат, тому ви можете або перевести цикл на нього, або (для відображення) надрукувати його як список;

>>> for i in range(1,17): print i-1,list(f(range(1,i)))
 0 []
 1 [1]
 2 [2, 1]
 3 [2, 1, 3]
 4 [3, 2, 4, 1]
 5 [4, 2, 5, 1, 3]
 6 [4, 2, 6, 1, 3, 5]
 7 [4, 2, 6, 1, 3, 5, 7]
 8 [5, 3, 7, 2, 4, 6, 8, 1]
 9 [6, 4, 8, 2, 5, 7, 9, 1, 3]
10 [7, 4, 9, 2, 6, 8, 10, 1, 3, 5]
11 [8, 4, 10, 2, 6, 9, 11, 1, 3, 5, 7]
12 [8, 4, 11, 2, 6, 10, 12, 1, 3, 5, 7, 9]
13 [8, 4, 12, 2, 6, 10, 13, 1, 3, 5, 7, 9, 11]
14 [8, 4, 12, 2, 6, 10, 14, 1, 3, 5, 7, 9, 11, 13]
15 [8, 4, 12, 2, 6, 10, 14, 1, 3, 5, 7, 9, 11, 13, 15]

@dtldarek Його коментар, здається, видалено, але це, здається, зараз пройшло тестові справи.
Йоахім Ісакссон

Я видалив свій коментар, щоб люди не утримувались від відповіді на @ dtldarek через коментар, в якому сказано, що це баггі.
Пітер Тейлор

@PeterTaylor Ну, дякую за вашу увагу ;-)
dtldarek

1

Java

Це рішення прямого розрахунку. Я думаю, що це працює, але він має один прагматично нешкідливий побічний ефект. Масив, який він створює, може бути пошкодженим, але жодним чином не впливатиме на пошуки. Замість створення 0 (нульових) вузлів, він створить недоступні вузли, тобто вузли вже були знайдені раніше в дереві під час пошуку. Він працює, зіставляючи масив індексів регулярної потужності двійкового масиву двійкових пошукових файлів розміром 2 розмірів на масив бінарних дерев пошуку неправильного розміру. Принаймні, я думаю, що це працює.

import java.util.Arrays;

public class SortedArrayToBalanceBinarySearchTreeArray
{
    public static void main(String... args)
    {
        System.out.println(Arrays.toString(binarySearchTree(19)));
    }

    public static int[] binarySearchTree(int m)
    {
        int n = powerOf2Ceiling(m + 1);
        int[] array = new int[n - 1];

        for (int k = 1, index = 1; k < n; k *= 2)
        {
            for (int i = 0; i < k; ++i)
            {
                array[index - 1] = (int) (.5 + ((float) (m)) / (n - 1)
                        * (n / (2 * k) * (1 + 2 * index) - n));
                ++index;
            }
        }

        return array;
    }

    public static int powerOf2Ceiling(int n)
    {
        n--;
        n |= n >> 1;
        n |= n >> 2;
        n |= n >> 4;
        n |= n >> 8;
        n |= n >> 16;
        n++;

        return n;
    }

}

Ось більш скорочена версія (лише функція та назви спарені). У ньому все ще є простір, але я не переживаю за перемогу. Також ця версія фактично займає масив. Інший просто взяв int для найвищого індексу в масиві.

public static int[] b(int m[])
{
    int n = m.length;
    n |= n >> 1;
    n |= n >> 2;
    n |= n >> 4;
    n |= n >> 8;
    n |= n >> 16;
    n++;

    int[] a = new int[n - 1];

    for (int k = 1, j = 1, i; k < n; k *= 2)
    {
        for (i = 0; i < k; ++i)
        {
            a[j - 1] = m[(int) (.5 + ((float) m.length) / (n - 1)
                    * (n / (2 * k) * (1 + 2 * j) - n)) - 1];
            ++j;
        }
    }

    return a;
}

Оскільки це код-гольф , скоротіть свої методи / назви / тощо до якомога коротшого; видаліть увесь пробіл (і непотрібні методи / матеріал) та вставте кількість символів. Інакше у вас все чудово.
Джастін

@Jake Wharton Я дуже хотів би побачити ваше рішення щодо прямого картографування. Я не на 100% впевнений, що шахта працює для дуже великих масивів, оскільки вона спирається на безперервне математичне відображення, значення якого округляються. Звичайно, це працює, але я не знаю, як це довести.
метафіз

1

GolfScript ( 79 77 70 символів)

Оскільки в прикладі запитання використовується функція, я зробив цю функцію. Видалення {}:f;виразу, що залишає вираз, який приймає вклад на стек і залишає BST на стеці, заощадить 5 символів.

{[.;][{{.!!{[.,.)[1]*{(\(@++}@(*1=/()\@~]}*}%.{0=}%\{1>~}%.}do][]*}:f;

Демонстрація в Інтернеті (зауважте: додаток може трохи розігрітися: він вийшов двічі для мене, перш ніж запустити за 3 секунди).

З пробілом для відображення структури:

{
    # Input is an array: wrap it in an array for the working set
    [.;]
    [{
        # Stack: emitted-values working-set
        # where the working-set is essentially an array of subtrees
        # For each subtree in working-set...
        {
            # ...if it's not the empty array...
            .!!{
                # ...gather into an array...
                [
                    # Get the size of the subtree
                    .,
                    # OEIS A006165, offset by 1
                    .)[1]*{(\(@++}@(*1=
                    # Split into [left-subtree-plus-root right-subtree]
                    /
                    # Rearrange to root left-subtree right-subtree
                    # where left-subtree might be [] and right-subtree might not exist at all
                    ()\@~
                ]
            }*
        }%
        # Extract the leading element of each processed subtree: these will join the emitted-values
        .{0=}%
        # Create a new working-set of the 1, or 2 subtrees of each processed subtree
        \{1>~}%
        # Loop while the working-set is non-empty
        .
    }do]
    # Stack: [[emitted values at level 0][emitted values at level 1]...]
    # Flatten by joining with the empty array
    []*
}:f;

1

J , 52 байти

t=:/:(#/:@{.(+:,>:@+:@i.@>:@#)^:(<.@(2&^.)@>:@#`1:))

Функція приймає відсортований список і повертається у порядку двійкового дерева

зауважте, що дерева мають однакову форму, але рівень дна скорочується

  • `1: почніть з 1
  • <.@(2&^.)@>:@# ітерація підлоги log2 (довжина + 1)
  • +: , >:@+:@i.@>:@# цикл: додає подвійний останній вектор з непарними числами 1,3 .. 2 * довжина + 1
  • # /:@{. візьміть лише необхідну кількість предметів і отримайте їх індекси сортування
  • /: застосувати ці індекси сортування до даного вводу

ТІО


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.