Перетворити час Unix на читабельну дату у фреймі даних панд


110

У мене є фрейм даних з часами unix та цінами в ньому. Я хочу перетворити індексний стовпець так, щоб він відображався у читаних людиною датах.

Так, наприклад , у мене є , dateяк 1349633705в колонці , але я хочу, щоб показати , як 10/07/2012(або , по крайней мере 10/07/2012 18:15).

Для деякого контексту, ось код, з яким я працюю, і що я вже спробував:

import json
import urllib2
from datetime import datetime
response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json')
data = json.load(response)   
df = DataFrame(data['values'])
df.columns = ["date","price"]
#convert dates 
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.index = df.date   

Як ви бачите, я використовую df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))тут, що не працює, оскільки я працюю з цілими числами, а не рядками. Я думаю, що мені потрібно використовувати, datetime.date.fromtimestampале я не зовсім впевнений, як це застосувати до цілогоdf.date .

Дякую.

Відповіді:


221

Вони здаються секундами з епохи.

In [20]: df = DataFrame(data['values'])

In [21]: df.columns = ["date","price"]

In [22]: df
Out[22]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 358 entries, 0 to 357
Data columns (total 2 columns):
date     358  non-null values
price    358  non-null values
dtypes: float64(1), int64(1)

In [23]: df.head()
Out[23]: 
         date  price
0  1349720105  12.08
1  1349806505  12.35
2  1349892905  12.15
3  1349979305  12.19
4  1350065705  12.15
In [25]: df['date'] = pd.to_datetime(df['date'],unit='s')

In [26]: df.head()
Out[26]: 
                 date  price
0 2012-10-08 18:15:05  12.08
1 2012-10-09 18:15:05  12.35
2 2012-10-10 18:15:05  12.15
3 2012-10-11 18:15:05  12.19
4 2012-10-12 18:15:05  12.15

In [27]: df.dtypes
Out[27]: 
date     datetime64[ns]
price           float64
dtype: object

1
а в 0.13 ви зможете використовувати date_unit під час read_json: D
Енді Хейден

Чудово! Ваше рішення має ідеальний сенс. Pandas: Перетворення на Timestamps проходить через це досить добре, і тепер я знаю про to_datetime.
WA Carnegie

Просто ще один момент. Це не спрацювало для мене в 0,11, але добре в 0,12+
WA Carnegie

1
Це рішення дає мені OverflowError: Python int too large to convert to C long.
якщо __name__ не вказано

2
Не зважаючи, мав мілісекундну часову позначку, просто повинен був lambda x: x/1000.0, або unit='ms'.
якщо __name__ не вказано

48

Якщо ви спробуєте скористатися:

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],***unit='s'***))

і отримувати помилку:

"pandas.tslib.OutOfBoundsDatetime: не вдається перетворити вхід з одиницею '"

Це означає, що DATE_FIELDзначення не вказано в секундах.

У моєму випадку це було мілі секунди - EPOCH time.

Конверсія працювала, використовуючи нижче:

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],unit='ms')) 

15

Припустимо, що ми імпортували pandas as pdта dfє нашим фреймом даних

pd.to_datetime(df['date'], unit='s')

працює для мене.


0

Крім того, змінивши рядок вищевказаного коду:

# df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.date = df.date.apply(lambda d: datetime.datetime.fromtimestamp(int(d)).strftime('%Y-%m-%d'))

Це також має працювати.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.