Як перетворити індекс фрейму даних панди в стовпчик?


456

Це здається досить очевидним, але я не можу зрозуміти, як перетворити індекс кадру даних у стовпець?

Наприклад:

df=
        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

До

df=
    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

Відповіді:


764

або:

df['index1'] = df.index

або .reset_index,:

df.reset_index(level=0, inplace=True)

тому, якщо у вас є мультиіндексний кадр з 3 рівнями індексу, наприклад:

>>> df
                       val
tick       tag obs        
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

і ви хочете перетворити 1-й ( tick) і 3-й ( obs) рівні в індексі в стовпці, ви зробите:

>>> df.reset_index(level=['tick', 'obs'])
          tick  obs     val
tag                        
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

4
майте на увазі, що ви повинні робити це n разів для кожного індексу, який ви маєте (наприклад, якщо у вас є два індекси, тоді ви повинні це зробити двічі)
dval

34
За допомогою df.reset_index(level=df.index.names, inplace=True)цього можна перетворити заданий цілий мультиіндекс у стовпці
вентиляція

2
Чи можете ви мати індекс у стовпці, який ви щойно додали до фрейму даних, так що це справжній стовпець ТА індекс?
bretcj7

2
Якщо ви хочете конвертувати весь мультііндексних, просто використовувати df.reset_index(), який переміщує повноту індексу в шпальтах (один стовпець на рівні) і створює індекс INT від 0 до LEN (ДФ) -1
BallpointBen

2
Присвоєння стовпцю, наприклад, df['index1'] = df.indexповертає попередження: "На копії фрагмента з DataFrame намагається встановити значення." Замість цього використовуйте функцію df.assign (), як показано нижче.
Джон Марк

36

Для MultiIndex ви можете витягти його субіндекс, використовуючи

df['si_name'] = R.index.get_level_values('si_name') 

де si_nameназва субіндексу.


26

Для забезпечення більшої ясності розглянемо DataFrame з двома рівнями в своєму індексі (MultiIndex).

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'], 
                                    ['North', 'South']], 
                                   names=['State', 'Direction'])

df = pd.DataFrame(index=index, 
                  data=np.random.randint(0, 10, (6,4)), 
                  columns=list('abcd'))

введіть тут опис зображення

reset_indexМетод викликається з параметрами за замовчуванням, перетворює всі рівні індексів для стовпців і використовує простий , RangeIndexяк новий індекс.

df.reset_index()

введіть тут опис зображення

Використовуйте levelпараметр, щоб контролювати, які рівні індексу перетворюються в стовпці. Якщо можливо, використовуйте ім'я рівня, яке є більш явним. Якщо імен рівнів немає, ви можете звернутися до кожного рівня за його цілим розташуванням, яке починається з 0 зовні. Тут ви можете використовувати скалярне значення або список усіх індексів, які ви хочете скинути.

df.reset_index(level='State') # same as df.reset_index(level=0)

введіть тут опис зображення

У рідкісних випадках, коли ви хочете зберегти індекс і перетворити індекс у стовпець, ви можете зробити наступне:

# for a single level
df.assign(State=df.index.get_level_values('State'))

# for all levels
df.assign(**df.index.to_frame())

15

rename_axis + reset_index

Спочатку ви можете перейменувати свій індекс на потрібну мітку, а потім підняти до серії:

df = df.rename_axis('index1').reset_index()

print(df)

   index1         gi  ptt_loc
0       0  384444683      593
1       1  384444684      594
2       2  384444686      596

Це також працює для MultiIndexфреймів даних:

print(df)
#                        val
# tick       tag obs        
# 2016-02-26 C   2    0.0139
# 2016-02-27 A   2    0.5577
# 2016-02-28 C   6    0.0303

df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()

print(df)

       index1 index2  index3     val
0  2016-02-26      C       2  0.0139
1  2016-02-27      A       2  0.5577
2  2016-02-28      C       6  0.0303

4

Якщо ви хочете скористатися reset_indexметодом, а також зберегти існуючий індекс, вам слід скористатися:

df.reset_index().set_index('index', drop=False)

або змінити його на місці:

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

Наприклад:

print(df)
          gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596

print(df.reset_index())
   index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596

print(df.reset_index().set_index('index', drop=False))
       index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

А якщо ви хочете позбутися мітки індексу, можете зробити:

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
   index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596

2
df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1

    new     gi     ptt
0    0      232    342
1    1      66     56 
2    2      34     662
3    3      43     123

5
Я б запропонував додати кілька дискусій про те, чому ви вважаєте, що ця відповідь краща за існуючі відповіді ...
dmcgrandle

0

Дуже простий спосіб зробити це використовувати метод reset_index (). Для кадру даних df використовуйте код нижче:

df.reset_index(inplace=True)

Таким чином, індекс стане стовпцем, а використовуючи inplace як True, це стане постійною зміною.


1
Чим ця відповідь відрізняється від прийнятої у відповіді?
Аннош
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.