Панди: як замінити значення NaN ( nan
) середніми (середніми), медіанними або іншими статистичними даними одного стовпця
Скажіть, що ваш DataFrame є, df
і у вас є один стовпець, який називається nr_items
. Це: df['nr_items']
Якщо ви хочете , щоб замінити ті NaN
значення вашої колонки df['nr_items']
з середньою частиною колони :
Метод використання .fillna()
:
mean_value=df['nr_items'].mean()
df['nr_item_ave']=df['nr_items'].fillna(mean_value)
Я створив новий df
стовпець, покликаний nr_item_ave
зберігати новий стовпець зі NaN
значеннями, заміненими mean
значенням стовпця.
Ви повинні бути обережними під час використання mean
. Якщо у вас є викиди більш рекомендується використовуватиmedian
df.fillna(df.mean())
поверне новий фрейм даних, тому вам доведеться писати,df=df.fillna(df.mean())
щоб зберегти його.