Панди: як замінити значення NaN ( nan) середніми (середніми), медіанними або іншими статистичними даними одного стовпця
Скажіть, що ваш DataFrame є, dfі у вас є один стовпець, який називається nr_items. Це: df['nr_items']
Якщо ви хочете , щоб замінити ті NaNзначення вашої колонки df['nr_items']з середньою частиною колони :
Метод використання .fillna():
mean_value=df['nr_items'].mean()
df['nr_item_ave']=df['nr_items'].fillna(mean_value)
Я створив новий dfстовпець, покликаний nr_item_aveзберігати новий стовпець зі NaNзначеннями, заміненими meanзначенням стовпця.
Ви повинні бути обережними під час використання mean. Якщо у вас є викиди більш рекомендується використовуватиmedian
df.fillna(df.mean())поверне новий фрейм даних, тому вам доведеться писати,df=df.fillna(df.mean())щоб зберегти його.