Як я можу відкрити підмножину великого (35 МБ) .xlsx файлу?


1

У мене Ubuntu 10.04 працює на Dell Optiplex з 4 Гб пам'яті та двома процесорами 3,16 ГГц.

Я отримав електронну таблицю 35 Мб. Він відкрився в Gnumeric через 5 хвилин з помилками, і не відкрився в Open Office (вбили через 20 хв.) Навіть після того, як я дав процес "soffice" першочерговим пріоритетом (niceness = -20).

Який найкращий спосіб працювати з таким файлом? Чи можливо витягнути підмножину з перших сотень рядків, щоб я міг опрацювати сценарій, який мені знадобиться використовувати для розбору всього файлу?

оновлення:

Функція командного рядка ssconvert BigFile.xlsx BigFile.csvвикликала ті самі помилки, що і Gnumeric (не дивно, оскільки Gnumeric використовує ssconvert)

Відповіді:


1

Напевно, але вам знадобиться ручна робота.

Файли xslx - це фактично ZIP-файли з XML-даними. Так просто розпакуйте файл і подивіться всередину. Формат - це не те, що розумний розум легко зрозуміє, але слід відкривати файли аркушів, шукати Rowелементи та знімати все після перших сотень.

Крім того, ви можете спробувати відкрити файл за допомогою POI Apache ; просто дайте Java 1 Гб оперативної пам’яті, і це може працювати.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.