Як я можу прочитати файл у форматі .csv (без заголовків) і коли мені потрібно лише підмножину стовпців (скажімо, 4-й та 7-й із загальної кількості 20 стовпців), використовуючи панди? Я, здається, не можу це зробитиusecols
Як я можу прочитати файл у форматі .csv (без заголовків) і коли мені потрібно лише підмножину стовпців (скажімо, 4-й та 7-й із загальної кількості 20 стовпців), використовуючи панди? Я, здається, не можу це зробитиusecols
Відповіді:
Попередні відповіді були хорошими і правильними, але, на мою думку, додатковий names
параметр зробить його ідеальним, і він повинен бути рекомендованим способом, особливо, коли у CSV немає headers
.
usecols
та names
параметриdf = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
або використовувати, header=None
щоб прямо сказати людям, що у csv
заголовків немає (все одно обидва рядки однакові )
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
Так що ви можете отримати свої дані за допомогою
# with `names` parameter
df['colA']
df['colB']
замість
# without `names` parameter
df[0]
df[1]
На основі read_csv , коли names
вони передаються явно, тоді header
вони будуть вести себе як None
замість 0
, тож можна пропустити, header=None
коли вони names
існують.