Мої масиви numpy використовують np.nanдля позначення відсутніх значень. Коли я повторюю набір даних, мені потрібно виявити такі відсутні дані та обробляти їх спеціальними способами.
Наївно я використовував numpy.isnan(val), що працює добре, якщо valне входить до підмножини типів, підтримуваних numpy.isnan(). Наприклад, відсутні дані можуть виникати в рядкових полях, і в такому випадку я отримую:
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
Окрім того, як написати дорогу обгортку, яка наздоганяє виняток та повертається False, чи є спосіб вирішити це елегантно та ефективно?
pandas.isnull()начебто працює чудово. Єдиний тип даних, з яким я зараз маю справу з розривами, numpy.isnan()є рядком і pandas.isnull()добре обробляє його. Насправді, схоже, добре впорається з будь-яким довільним об’єктом, який я накинув на нього. Чи були якісь конкретні проблеми, які вас хвилювали? В іншому випадку ви можете надіслати свій коментар як повноцінну відповідь, оскільки це здається канонічною відповіддю, принаймні для користувачів панди.
pandasмаєpandas.isnull(): Я не впевнений, чи відповідає це вашим потребам, тому деякі приклади даних можуть бути хорошими.