Загалом
pkl
Фактично ваш файл - це серіалізований pickle
файл, що означає, що його було скинуто за допомогою pickle
модуля Python .
Щоб зняти маринування даних, ви можете:
import pickle
with open('serialized.pkl', 'rb') as f:
data = pickle.load(f)
Для набору даних MNIST
Примітка gzip
потрібна лише у випадку стиснення файлу:
import gzip
import pickle
with gzip.open('mnist.pkl.gz', 'rb') as f:
train_set, valid_set, test_set = pickle.load(f)
Де кожен набір можна розділити далі (тобто для навчального набору):
train_x, train_y = train_set
Це були б входи (цифри) та виходи (мітки) ваших наборів.
Якщо ви хочете відобразити цифри:
import matplotlib.cm as cm
import matplotlib.pyplot as plt
plt.imshow(train_x[0].reshape((28, 28)), cmap=cm.Greys_r)
plt.show()
Іншою альтернативою було б переглянути вихідні дані:
http://yann.lecun.com/exdb/mnist/
Але це буде складніше, оскільки вам потрібно буде створити програму для зчитування двійкових даних у цих файлах. Тому я рекомендую вам використовувати Python і завантажувати дані за допомогою pickle
. Як ви бачили, це дуже просто. ;-)