Як я можу прочитати файл у форматі .csv (без заголовків) і коли мені потрібно лише підмножину стовпців (скажімо, 4-й та 7-й із загальної кількості 20 стовпців), використовуючи панди? Я, здається, не можу це зробитиusecols
Як я можу прочитати файл у форматі .csv (без заголовків) і коли мені потрібно лише підмножину стовпців (скажімо, 4-й та 7-й із загальної кількості 20 стовпців), використовуючи панди? Я, здається, не можу це зробитиusecols
Відповіді:
Попередні відповіді були хорошими і правильними, але, на мою думку, додатковий namesпараметр зробить його ідеальним, і він повинен бути рекомендованим способом, особливо, коли у CSV немає headers.
usecolsта namesпараметриdf = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
або використовувати, header=Noneщоб прямо сказати людям, що у csvзаголовків немає (все одно обидва рядки однакові )
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
Так що ви можете отримати свої дані за допомогою
# with `names` parameter
df['colA']
df['colB']
замість
# without `names` parameter
df[0]
df[1]
На основі read_csv , коли namesвони передаються явно, тоді headerвони будуть вести себе як Noneзамість 0, тож можна пропустити, header=Noneколи вони namesіснують.