Як розібрати файл Excel у Javascript / HTML5


136

Я вмію читати файл Excel через, FileReaderале він виводить текст, а також дивні символи з ним. Мені потрібно прочитати xlsфайл у строковому порядку, прочитати дані у кожному стовпці та перетворити їх у JSON.

Як читати файл xls рядок за рядком?



1
@JoachimPileborg: це не дає відповіді на запитання. Мені потрібно прочитати файл excel за рядком. Хоча я можу прочитати його за допомогою FileReader (HTML5), але все ще не можу переглядати рядки.
качка

Відповіді:


104

Нижче функція перетворює дані аркуша Excel (формат XLSX) в JSON. ви можете додати обіцянку функції.

<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/jszip.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/xlsx.js"></script>
<script>
var ExcelToJSON = function() {

  this.parseExcel = function(file) {
    var reader = new FileReader();

    reader.onload = function(e) {
      var data = e.target.result;
      var workbook = XLSX.read(data, {
        type: 'binary'
      });

      workbook.SheetNames.forEach(function(sheetName) {
        // Here is your object
        var XL_row_object = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]);
        var json_object = JSON.stringify(XL_row_object);
        console.log(json_object);

      })

    };

    reader.onerror = function(ex) {
      console.log(ex);
    };

    reader.readAsBinaryString(file);
  };
};
</script>

Нижче за постом є код для формату XLS формату Excel до коду JavaScript JSON?


1
це збій для великих файлів Excel в хромі, будь-яке хороше рішення для цього?
Зед

Чи можу я знати, наскільки більший ваш файл?
Перу

6
e.target.result () має бути e.target.result див. developer.mozilla.org/en-US/docs/Web/API/FileReader/onload
користувач227353

3
Для мене мені довелося декларувати jszip.jsсценарій раніше xlsx.js.
Флорін Вордол

1
Як я можу призначити json_object публічній змінній та отримати доступ до неї поза циклом for?
Шардул

109

Старе запитання, але мушу зазначити, що загальне завдання розбору XLS-файлів з JavaScript є стомлюючим і складним, але не неможливим.

У мене базові парсери, реалізовані в чистому JS:

Обидві сторінки є керованими API XLS / XLSX-аналізаторами файлів HTML5 (ви можете перетягнути файл, і він буде роздруковувати дані в клітинках у списку, розділеному комами). Ви також можете генерувати об'єкти JSON (якщо перший рядок - це заголовок).

Тестовий набір http://oss.sheetjs.com/ показує версію, яка використовує XHR для отримання та аналізу файлів.


4
Якщо ви можете додати якийсь зразок коду до відповіді, це зробило б набагато краще (також додайте діалоговий заголовок, якщо ви лідер бібліотек).
acdcjunior


ми можемо пропустити кілька верхніх рядків і стовпців xlsx за допомогою JS-XLSX?
травень

19

Завантажте excel fileсюди, і ви можете отримати дані у JSONформаті у console:

<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/jszip.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/xlsx.js"></script>
<script>
    var ExcelToJSON = function() {

      this.parseExcel = function(file) {
        var reader = new FileReader();

        reader.onload = function(e) {
          var data = e.target.result;
          var workbook = XLSX.read(data, {
            type: 'binary'
          });
          workbook.SheetNames.forEach(function(sheetName) {
            // Here is your object
            var XL_row_object = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]);
            var json_object = JSON.stringify(XL_row_object);
            console.log(JSON.parse(json_object));
            jQuery( '#xlx_json' ).val( json_object );
          })
        };

        reader.onerror = function(ex) {
          console.log(ex);
        };

        reader.readAsBinaryString(file);
      };
  };

  function handleFileSelect(evt) {
    
    var files = evt.target.files; // FileList object
    var xl2json = new ExcelToJSON();
    xl2json.parseExcel(files[0]);
  }


 
</script>

<form enctype="multipart/form-data">
    <input id="upload" type=file  name="files[]">
</form>

    <textarea class="form-control" rows=35 cols=120 id="xlx_json"></textarea>

    <script>
        document.getElementById('upload').addEventListener('change', handleFileSelect, false);

    </script>

Це поєднання наступних Stackoverflowпублікацій:

  1. https://stackoverflow.com/a/37083658/4742733
  2. https://stackoverflow.com/a/39515846/4742733

Щасти...


14

Цей код може допомогти вам
Більшість часу jszip.js не працює, тому включіть xlsx.full.min.js у свій js-код.

Код Html

 <input type="file" id="file" ng-model="csvFile"  
    onchange="angular.element(this).scope().ExcelExport(event)"/>

Javascript

<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/xlsx.js">
</script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/jszip.js">
</script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.10.8/xlsx.full.min.js">
</script>

$scope.ExcelExport= function (event) {


    var input = event.target;
    var reader = new FileReader();
    reader.onload = function(){
        var fileData = reader.result;
        var wb = XLSX.read(fileData, {type : 'binary'});

        wb.SheetNames.forEach(function(sheetName){
        var rowObj =XLSX.utils.sheet_to_row_object_array(wb.Sheets[sheetName]);
        var jsonObj = JSON.stringify(rowObj);
        console.log(jsonObj)
        })
    };
    reader.readAsBinaryString(input.files[0]);
    };

Що про те, якщо я хочу завантажувати зображення також на аркуші excel
Mayur Agarwal

9

Якщо ви хочете найпростіший і найдрібніший спосіб читання файлу * .xlsx у веб-переглядачі, то ця бібліотека може зробити:

https://catamphetamine.github.io/read-excel-file/

<input type="file" id="input" />
import readXlsxFile from 'read-excel-file'

const input = document.getElementById('input')

input.addEventListener('change', () => {
  readXlsxFile(input.files[0]).then((data) => {
    // `data` is an array of rows
    // each row being an array of cells.
  })
})

У наведеному вище прикладі наведені dataнеоброблені рядкові дані. Його можна розібрати на JSON за допомогою суворої схеми, передавши schemaаргумент. Дивіться документи API для прикладу цього.

Документи API: http://npmjs.com/package/read-excel-file


4

Дякую за відповідь вище, я думаю, що сфера (відповідей) завершена, але я хотів би додати "спосіб реагування" для тих, хто використовує реакцію.

Створіть файл, який називається importData.js:

import React, {Component} from 'react';
import XLSX from 'xlsx';
export default class ImportData extends Component{
    constructor(props){
        super(props);
        this.state={
            excelData:{}
        }
    }
    excelToJson(reader){
        var fileData = reader.result;
        var wb = XLSX.read(fileData, {type : 'binary'});
        var data = {};
        wb.SheetNames.forEach(function(sheetName){
             var rowObj =XLSX.utils.sheet_to_row_object_array(wb.Sheets[sheetName]);
             var rowString = JSON.stringify(rowObj);
             data[sheetName] = rowString;
        });
        this.setState({excelData: data});
    }
    loadFileXLSX(event){
        var input = event.target;
        var reader = new FileReader();
        reader.onload = this.excelToJson.bind(this,reader);
        reader.readAsBinaryString(input.files[0]);
    }
    render(){
        return (
            <input type="file" onChange={this.loadFileXLSX.bind(this)}/>
        );
    }
}

Тоді ви можете використовувати компонент у методі візуалізації, наприклад:

import ImportData from './importData.js';
import React, {Component} from 'react';
class ParentComponent extends Component{
    render(){
        return (<importData/>);
    }
}

<ImportData/>встановивши дані у власний стан, ви можете отримати доступ до даних Excel у "батьківському компоненті", дотримуючись цього :


Я думаю, що тег у операторі return повинен бути <ImportData/>замість <importData/>. Я досить новачок у React, але я вважаю, що назви компонентів завжди мають великі літери. У будь-якому випадку, це ім'я, яке використовується при імпорті в прикладі.
rhaben

3

<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/jszip.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/xlsx.js"></script>
<script>
    var ExcelToJSON = function() {

      this.parseExcel = function(file) {
        var reader = new FileReader();

        reader.onload = function(e) {
          var data = e.target.result;
          var workbook = XLSX.read(data, {
            type: 'binary'
          });
          workbook.SheetNames.forEach(function(sheetName) {
            // Here is your object
            var XL_row_object = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]);
            var json_object = JSON.stringify(XL_row_object);
            console.log(JSON.parse(json_object));
            jQuery( '#xlx_json' ).val( json_object );
          })
        };

        reader.onerror = function(ex) {
          console.log(ex);
        };

        reader.readAsBinaryString(file);
      };
  };

  function handleFileSelect(evt) {
    
    var files = evt.target.files; // FileList object
    var xl2json = new ExcelToJSON();
    xl2json.parseExcel(files[0]);
  }


 
</script>

<form enctype="multipart/form-data">
    <input id="upload" type=file  name="files[]">
</form>

    <textarea class="form-control" rows=35 cols=120 id="xlx_json"></textarea>

    <script>
        document.getElementById('upload').addEventListener('change', handleFileSelect, false);

    </script>


0

Якщо вам колись цікаво, як прочитати файл із сервера, цей код може бути корисним.

Обмеження:

  1. Файл повинен бути на сервері (Local / Remote).
  2. Вам доведеться налаштувати заголовки або мати плагін google CORS.

<Head>
    <script src="https://ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js"></script>
    <script lang="javascript" src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.12.4/xlsx.core.min.js"></script>
</head>

<body>
    <script>
    /* set up XMLHttpRequest */


    // replace it with your file path in local server
    var url = "http://localhost/test.xlsx";

    var oReq = new XMLHttpRequest();
    oReq.open("GET", url, true);
    oReq.responseType = "arraybuffer";

    oReq.onload = function(e) {
        var arraybuffer = oReq.response;

        /* convert data to binary string */
        var data = new Uint8Array(arraybuffer);

        var arr = new Array();
        for (var i = 0; i != data.length; ++i) {
            arr[i] = String.fromCharCode(data[i]);
        }

        var bstr = arr.join("");

        var cfb = XLSX.read(bstr, { type: 'binary' });

        cfb.SheetNames.forEach(function(sheetName, index) {

            // Obtain The Current Row As CSV
            var fieldsObjs = XLS.utils.sheet_to_json(cfb.Sheets[sheetName]);

            fieldsObjs.map(function(field) {
                $("#my_file_output").append('<input type="checkbox" value="' + field.Fields + '">' + field.Fields + '<br>');
            });

        });
    }

    oReq.send();
    </script>
</body>
<div id="my_file_output">
</div>

</html>

0

включають xslx.js, xlsx.full.min.js, jszip.js

додати обробник події onchange до вхідного файлу

function showDataExcel(event)
{
            var file = event.target.files[0];
            var reader = new FileReader();
            var excelData = [];
            reader.onload = function (event) {
                var data = event.target.result;
                var workbook = XLSX.read(data, {
                    type: 'binary'
                });

                workbook.SheetNames.forEach(function (sheetName) {
                    // Here is your object
                    var XL_row_object = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]);

                    for (var i = 0; i < XL_row_object.length; i++)
                    {
                        excelData.push(XL_row_object[i]["your column name"]);

                    }

                    var json_object = JSON.stringify(XL_row_object);
                    console.log(json_object);
                    alert(excelData);
                })

            };

            reader.onerror = function (ex) {
                console.log(ex);
            };

            reader.readAsBinaryString(file);

}

-4

XLS - це бінарний фірмовий формат, який використовується Microsoft. Розбір XLS з мовами серверних сторін дуже важкий без використання певної бібліотеки чи Office Interop. Робити це за допомогою javascript - місія неможлива. Завдяки API-файлу HTML5 ви можете прочитати його бінарний вміст, але для того, щоб проаналізувати та інтерпретувати його, вам потрібно зануритися в специфікації формату XLS . Починаючи з Office 2007, Microsoft прийняла формати файлів Open XML ( xslxдля Excel), що є стандартним.


@ducktyped, я не знаю, не бачив жодного коду JavaScript, який читає двійковий файл Excel.
Дарин Димитров

13
Місія неможлива? Я сумніваюся в цьому. Якщо ми можемо запустити ядро ​​Linux в JavaScript на стороні клієнта, тоді має бути можливість проаналізувати двійковий файл Excel. Просто ніхто ще не знав цього.
JP Richardson

Ось документація для цікавих структури ms xls msdn.microsoft.com/en-us/library/office/…
djra

-5

var excel = новий ActiveXObject ("Excel.Application"); var book = excel.Workbooks.Open (your_full_file_name_here.xls); var sheet = book.Sheets.Item (1); значення значення = sheet.Range ("A1");

коли у вас аркуш. Ви можете використовувати функції VBA, як і в Excel.


6
це працює лише з IE "наш дорогий друг". І мені потрібно використовувати HTML5. Мені просто потрібно переглядати фактичний вміст тексту за рядком.
качка
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.