Чи існує вбудований спосіб для read_csv
читання лише перших n
рядків файлу, не знаючи довжини рядків заздалегідь? У мене є великий файл, який потрібно довго читати, і іноді хочу лише використовувати перші, скажімо, 20 рядків, щоб отримати його зразок (і волію не завантажувати повну річ і брати її за голову).
Якби я знав загальну кількість рядків, я міг би зробити щось подібне footer_lines = total_lines - n
і передати це skipfooter
ключовому слову arg. Моє поточне рішення полягає в тому, щоб вручну захопити перші n
рядки за допомогою python і StringIO його для панд:
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
Це не так погано, але чи є більш лаконічний, «пандадичний» (?) Спосіб зробити це за допомогою ключових слів чи щось інше?