Python, Pandas: запис вмісту DataFrame у текстовий файл


84

У мене є такі панди DataFrame

        X    Y  Z    Value 
0      18   55  1      70   
1      18   55  2      67 
2      18   57  2      75     
3      18   58  1      35  
4      19   54  2      70   

Я хочу записати ці дані у текстовий файл, який виглядає так:

18 55 1 70   
18 55 2 67 
18 57 2 75     
18 58 1 35  
19 54 2 70 

Я пробував щось на зразок

f = open(writePath, 'a')
f.writelines(['\n', str(data['X']), ' ', str(data['Y']), ' ', str(data['Z']), ' ', str(data['Value'])])
f.close()

але це не працює. Як це зробити?

Відповіді:


140

Ви можете просто використовувати np.savetxtатрибут np та отримати до нього доступ .values:

np.savetxt(r'c:\data\np.txt', df.values, fmt='%d')

врожайність:

18 55 1 70
18 55 2 67
18 57 2 75
18 58 1 35
19 54 2 70

або to_csv:

df.to_csv(r'c:\data\pandas.txt', header=None, index=None, sep=' ', mode='a')

Примітка: np.savetxtвам доведеться передати маніпулятор із файлом, який було створено в режимі додавання.


32

Ви можете використовувати pandas.DataFrame.to_csv () , і встановлення як indexі headerв False:

In [97]: print df.to_csv(sep=' ', index=False, header=False)
18 55 1 70
18 55 2 67
18 57 2 75
18 58 1 35
19 54 2 70

pandas.DataFrame.to_csv може писати безпосередньо у файл, щоб отримати додаткову інформацію, зверніться до документів, зв’язаних вище.


це натрапить на багато неприємностей, коли потрібно буде втекти, це не рішення загальної справи Панд!
matanster

13

Пізно на вечірку: Спробуйте це>

base_filename = 'Values.txt'
with open(os.path.join(WorkingFolder, base_filename),'w') as outfile:
    df.to_string(outfile)
#Neatly allocate all columns and rows to a .txt file

2
Це не дає текстовий файл, розділений табуляцією, здається, виводить файл, розділений пробілами. Мені подобається елегантність цього коду, чи є спосіб зробити вкладку виводу розділеною?
AHegde

10

Поточний найкращий спосіб зробити це - використовувати df.to_string():

with open(writePath, 'a') as f:
    f.write(
        df.to_string(header = False, index = False)
    )

Виведе наступне

18 55 1 70   
18 55 2 67 
18 57 2 75     
18 58 1 35  
19 54 2 70 

Цей метод також дозволяє легко вибрати, які стовпці надрукувати з columnsатрибутом, дозволяє зберегти стовпець, мітки індексу, якщо хочете, та має інші атрибути для інтервалу тощо.


1

@AHegde - Щоб отримати вихідний знак, розділений табуляцією, використовуйте роздільник sep = '\ t'.

Для df.to_csv:

df.to_csv(r'c:\data\pandas.txt', header=None, index=None, sep='\t', mode='a')

Для np.savetxt:

np.savetxt(r'c:\data\np.txt', df.values, fmt='%d', delimiter='\t')

1

Спосіб отримання даних Excel у текстовий файл у формі, розділеній табуляцією. Потрібно використовувати Pandas, а також xlrd.

import pandas as pd
import xlrd
import os

Path="C:\downloads"
wb = pd.ExcelFile(Path+"\\input.xlsx", engine=None)
sheet2 = pd.read_excel(wb, sheet_name="Sheet1")
Excel_Filter=sheet2[sheet2['Name']=='Test']
Excel_Filter.to_excel("C:\downloads\\output.xlsx", index=None)
wb2=xlrd.open_workbook(Path+"\\output.xlsx")
df=wb2.sheet_by_name("Sheet1")
x=df.nrows
y=df.ncols

for i in range(0,x):
    for j in range(0,y):
        A=str(df.cell_value(i,j))
        f=open(Path+"\\emails.txt", "a")
        f.write(A+"\t")
        f.close()
    f=open(Path+"\\emails.txt", "a")
    f.write("\n")
    f.close()
os.remove(Path+"\\output.xlsx")
print(Excel_Filter)

Спочатку нам потрібно створити файл xlsx із відфільтрованими даними, а потім перетворити інформацію у текстовий файл.

Залежно від вимог, ми можемо використовувати \ n \ t для циклів і типу даних, які ми хочемо в текстовому файлі.


0

Я використав трохи змінену версію:

with open(file_name, 'w', encoding = 'utf-8') as f:
    for rec_index, rec in df.iterrows():
        f.write(rec['<field>'] + '\n')

Мені довелося записати вміст поля фрейму даних (яке було розмежоване) як текстовий файл.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.