Відповіді:
Найпростіший спосіб - це використовувати to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Він також пропонує dayfirst
аргументи за європейські часи (але будьте обережні, це не суворо ).
Ось це в дії:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Ви можете пройти певний формат :
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
DatetimeIndex(df['col']).to_pydatetime()
повинен працювати.
SettingWithCopyWarning
дає достатньо матеріалу
Якщо стовпець вашої дати є рядком формату "2017-01-01", ви можете використовувати панди астип, щоб перетворити його в дату.
df['date'] = df['date'].astype('datetime64[ns]')
або використовуйте datetime64 [D], якщо ви хочете точність дня, а не наносекунд
print(type(df_launath['date'].iloc[0]))
врожайність
<class 'pandas._libs.tslib.Timestamp'>
те саме, що ви використовуєте pandas.to_datetime
Ви можете спробувати його в інших форматах, тоді "% Y-% m-% d", але принаймні це працює.
Якщо ви хочете вказати складні формати, ви можете скористатись такими:
df['date_col'] = pd.to_datetime(df['date_col'], format='%d/%m/%Y')
Більше інформації format
тут:
Якщо у вас в даті є суміш форматів, не забудьте налаштувати infer_datetime_format=True
полегшення життя
df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Джерело: pd.to_datetime
або якщо ви хочете індивідуальний підхід:
def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format doesn't match
pass
return value # let it be if it doesn't match
df['date'] = df['date'].apply(autoconvert_datetime)