панди python перетворюють індекс в datetime


80

Як перетворити індекс рядків pandas у формат datetime

мій фрейм даних "df" такий

                     value          
2015-09-25 00:46    71.925000
2015-09-25 00:47    71.625000
2015-09-25 00:48    71.333333
2015-09-25 00:49    64.571429
2015-09-25 00:50    72.285714

але індекс має тип рядка, але мені потрібен формат дати та часу, оскільки я отримую помилку

'Index' object has no attribute 'hour'

при використанні

 df['A'] = df.index.hour

6
df.index.to_datetime()або df.index = pandas.to_datetime(df.index)(попередня застаріла).
чемпіон AC

type (df.index [1]) все ще повертає 'str'
Runner Bean

1
Наведені вище дані перетворюються на datetimeвідсутність проблем type(df.index[1]) == pandas.tslib.Timestamp. Чи є у вас неправильні дані в решті фрейму даних?
чемпіон AC

1
Ви також можете вказати формат і помилки kwag. Документування pandas.to_datetimeпояснить інше.
Картік

Відповіді:


109

Це повинно працювати, як очікувалося. Спробуйте запустити наступний приклад.

import pandas as pd
import io

data = """value          
"2015-09-25 00:46"    71.925000
"2015-09-25 00:47"    71.625000
"2015-09-25 00:48"    71.333333
"2015-09-25 00:49"    64.571429
"2015-09-25 00:50"    72.285714"""

df = pd.read_table(io.StringIO(data), delim_whitespace=True)

# Converting the index as date
df.index = pd.to_datetime(df.index)

# Extracting hour & minute
df['A'] = df.index.hour
df['B'] = df.index.minute
df

#                          value  A   B
# 2015-09-25 00:46:00  71.925000  0  46
# 2015-09-25 00:47:00  71.625000  0  47
# 2015-09-25 00:48:00  71.333333  0  48
# 2015-09-25 00:49:00  64.571429  0  49
# 2015-09-25 00:50:00  72.285714  0  50

3

Ви можете явно створитиDatetimeIndex при ініціалізації dataframe. Припускаючи, що ваші дані мають формат рядків

data = [
    ('2015-09-25 00:46', '71.925000'),
    ('2015-09-25 00:47', '71.625000'),
    ('2015-09-25 00:48', '71.333333'),
    ('2015-09-25 00:49', '64.571429'),
    ('2015-09-25 00:50', '72.285714'),
]

index, values = zip(*data)

frame = pd.DataFrame({
    'values': values
}, index=pd.DatetimeIndex(index))

print(frame.index.minute)

FYI для Python3, вам потрібноindex, values = zip(*data.items())
Аддісон Клінке

2

Я просто даю інший варіант для цього питання - вам потрібно використовувати '.dt' у своєму коді:

import pandas as pd

df.index = pd.to_datetime(df.index)

#for get year
df.index.dt.year

#for get month
df.index.dt.month

#for get day
df.index.dt.day

#for get hour
df.index.dt.hour

#for get minute
df.index.dt.minute

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.