Мої масиви numpy використовують np.nan
для позначення відсутніх значень. Коли я повторюю набір даних, мені потрібно виявити такі відсутні дані та обробляти їх спеціальними способами.
Наївно я використовував numpy.isnan(val)
, що працює добре, якщо val
не входить до підмножини типів, підтримуваних numpy.isnan()
. Наприклад, відсутні дані можуть виникати в рядкових полях, і в такому випадку я отримую:
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
Окрім того, як написати дорогу обгортку, яка наздоганяє виняток та повертається False
, чи є спосіб вирішити це елегантно та ефективно?
pandas.isnull()
начебто працює чудово. Єдиний тип даних, з яким я зараз маю справу з розривами, numpy.isnan()
є рядком і pandas.isnull()
добре обробляє його. Насправді, схоже, добре впорається з будь-яким довільним об’єктом, який я накинув на нього. Чи були якісь конкретні проблеми, які вас хвилювали? В іншому випадку ви можете надіслати свій коментар як повноцінну відповідь, оскільки це здається канонічною відповіддю, принаймні для користувачів панди.
pandas
маєpandas.isnull()
: Я не впевнений, чи відповідає це вашим потребам, тому деякі приклади даних можуть бути хорошими.