Напишіть утиліту стиснення для файлів gzip


11

Завдання цього завдання полягає в наступному:

Напишіть програму, яка зчитує файл розумного розміру (скажімо, <16 Мб) з stdin або з будь-якого іншого місця (як би ви не хотіли, але не повинно бути жорстко закодованим), і поставте стислий вихід на stdout. Вихід повинен бути дійсним стислим файлом gzip, і якщо стиснутий файл проходить через gunzip, він повинен отримати точно той самий файл, що і раніше.

Правила

  • Використовувана мова програмування повинна бути відома до початку цього змагання
  • Оцінка вашої програми - це кількість символів вихідного коду або зібраної програми (що коротше)
  • Вам заборонено використовувати будь-який тип існуючих бібліотек стиснення.
  • Веселіться!

2
Чи дозволено використання вбудованих бібліотек?
hallvabo

@hallvabo: Ні. Забув це. Thx
FUZxxl

2
Мабуть, найкращий спосіб зробити це - просто нанести вкладку маркерами "наступний блок нестиснений" на початку кожного блоку.
Анон.

gzip - мова програмування. Але не Тюрінг повний.
Олександру

1
Це в значній мірі ідентично проблемі з гарматами та блискавками . Чому хтось публікує свої відповіді тут, а не на codegolf.com, це не за межами мене, якщо вони не хочуть вирішити його мовою, не підтримуваною codegolf.com (наприклад, GolfScript).
Кріс Єстер-Янг

Відповіді:


10

C # (534 символи)

using System.IO;using B=System.Byte;class X{static void Main(string[]a){var f=File.ReadAllBytes(a[0]);int l=f.Length,i=0,j;var p=new uint[256];for(uint k=0,r=0;k<256;r=++k){for(j=0;j<8;j++)r=r>>1^(r&1)*0xedb88320;p[k]=r;}uint c=~(uint)0,n=c;using(var o=File.Open(a[0]+".gz",FileMode.Create)){o.Write(new B[]{31,139,8,0,0,0,0,0,4,11},0,10);for(;i<l;i++){o.Write(new B[]{(B)(i<l-1?0:1),1,0,254,255,f[i]},0,6);c=p[(c^f[i])&0xFF]^c>>8;}c^=n;o.Write(new[]{(B)c,(B)(c>>8),(B)(c>>16),(B)(c>>24),(B)l,(B)(l>>8),(B)(l>>16),(B)(l>>24)},0,8);}}}

Набагато легше читати:

using System.IO;
using B = System.Byte;
class X
{
    static void Main(string[] a)
    {
        // Read file contents
        var f = File.ReadAllBytes(a[0]);
        int l = f.Length, i = 0, j;

        // Initialise table for CRC hashsum
        var p = new uint[256];
        for (uint k = 0, r = 0; k < 256; r = ++k)
        {
            for (j = 0; j < 8; j++)
                r = r >> 1 ^ (r & 1) * 0xedb88320;
            p[k] = r;
        }

        uint c = ~(uint) 0, n = c;

        // Write the output file
        using (var o = File.Open(a[0] + ".gz", FileMode.Create))
        {
            // gzip header
            o.Write(new B[] { 31, 139, 8, 0, 0, 0, 0, 0, 4, 11 }, 0, 10);
            for (; i < l; i++)
            {
                // deflate block header plus one byte of payload
                o.Write(new B[] { (B) (i < l - 1 ? 0 : 1), 1, 0, 254, 255, f[i] }, 0, 6);
                // Compute CRC checksum
                c = p[(c ^ f[i]) & 0xFF] ^ c >> 8;
            }
            c ^= n;
            o.Write(new[] {
                // CRC checksum
                (B) c, (B) (c >> 8), (B) (c >> 16), (B) (c >> 24),
                // original file size
                (B) l, (B) (l >> 8), (B) (l >> 16), (B) (l >> 24)
            }, 0, 8);
        }
    }
}

Коментарі:

  • Очікує шлях до файлу як перший аргумент командного рядка.

  • Вихідний файл - це вхідний файл + .gz.

  • Я не використовую жодної бібліотеки для того, щоб робити gzip, deflate чи CRC32. Це все там.

  • Цей "компресор" збільшує розмір файлів у 6 разів. Але він у правильному форматі gzip!

  • Тестували за допомогою GNU gunzip та WinRAR.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.