Я використовую бібліотеку pandas для читання деяких даних CSV. У моїх даних певні стовпці містять рядки. Рядок "nan"
- це можливе значення, як і порожній рядок. Мені вдалося змусити панд читати "nan" як рядок, але я не можу зрозуміти, як змусити його не читати порожнє значення як NaN. Ось зразки даних та вихідні дані
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
Він правильно читає «нан» , як рядок «нан», але по- як і раніше читає порожні клітинки як NaN. Я спробував перехідним в str
в converters
аргументі read_csv (з converters={'One': str})
), але він все ще читає порожні клітинки як NaN.
Я усвідомлюю, що можу заповнити значення після прочитання за допомогою fillna, але чи справді немає способу сказати пандам, що порожню клітинку в певному стовпці CSV слід читати як порожній рядок замість NaN?
keep_default_na
нижче.