з серії pandas doc http://pandas.pydata.org/pandas-docs/stable/dsintro.html
- це одновимірний мічений масив, здатний містити будь-який тип даних. Для читання даних у вигляді серії панда:
import pandas as pd
ds = pd.Series(data, index=index)
DataFrame - це двовимірна структура даних з міткою зі стовпцями потенційно різних типів.
import pandas as pd
df = pd.DataFrame(data, index=index)
В обох наведених вище індекс є списком
наприклад: У мене є файл csv із такими даними:
,country,popuplation,area,capital
BR,Brazil,10210,12015,Brasile
RU,Russia,1025,457,Moscow
IN,India,10458,457787,New Delhi
Щоб прочитати наведені вище дані у вигляді серії та кадру даних:
import pandas as pd
file_data = pd.read_csv("file_path", index_col=0)
d = pd.Series(file_data.country, index=['BR','RU','IN'] or index = file_data.index)
вихід:
>>> d
BR Brazil
RU Russia
IN India
df = pd.DataFrame(file_data.area, index=['BR','RU','IN'] or index = file_data.index )
вихід:
>>> df
area
BR 12015
RU 457
IN 457787