Припустимо, у мене є фрейм даних із країнами, який називається:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Я знаю, що існує функція pd.get_dummies для перетворення країн на "гаряче кодування". Однак я хочу замість цього перетворити їх на індекси, які я отримаю cc_index = [1,2,1,3]
замість цього.
Я припускаю, що існує швидший спосіб, ніж використання get_dummies разом із реченням numpy where, як показано нижче:
[np.where(x) for x in df.cc.get_dummies().values]
Це дещо простіше зробити в R, використовуючи 'фактори', тому я сподіваюся, що у панд є щось подібне.
cc_index = [0,1,0,2]
?