Вони обидва здаються надзвичайно схожими, і мені цікаво, який пакет буде більш вигідним для аналізу фінансових даних.
Вони обидва здаються надзвичайно схожими, і мені цікаво, який пакет буде більш вигідним для аналізу фінансових даних.
Відповіді:
Панди надають інструменти для маніпулювання даними високого рівня, побудовані поверх NumPy. NumPy сам по собі є досить низьким рівнем інструменту, подібний до MATLAB. з іншого боку, панди надають багату функціональність часових рядів, вирівнювання даних, статистику, сприятливу для NA, груповий метод, методи злиття та з'єднання та безліч інших зручностей. Вона стала дуже популярною в останні роки у фінансових додатках. У моїй наступній книзі я матиму главу, присвячену аналізу фінансових даних з використанням панд.
NA-friendly statistics
, про що йдеться у вашій відповіді.
Numpy потрібні панди (і практично всі цифрові інструменти для Python). Scipy не є строго необхідним для панд, але зазначений як "факультативна залежність". Я б не сказав, що панди є альтернативою Numpy та / або Scipy. Скоріше, це додатковий інструмент, який забезпечує більш обтічний спосіб роботи з числовими та табличними даними в Python. Ви можете використовувати структури даних панди, але вільно користуватися функціями Numpy і Scipy для маніпулювання ними.
Панди пропонують чудовий спосіб маніпулювати таблицями, оскільки ви можете зробити бінінг легким ( бінінг фрейму даних у пандах на Python ) та обчислення статистики. Інша річ, яка відмінно підходить для панд, - це клас Panel, що ви можете приєднати ряд шарів з різними властивостями та комбінувати їх за допомогою функції groupby.