Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

1
Ефективне паралельне застосування функції до згрупованих панд DataFrame
Мені часто потрібно застосовувати функцію до груп дуже великих DataFrame(змішаних типів даних), і я хотів би скористатися перевагами декількох ядер. Я можу створити ітератор з груп і використовувати багатопроцесорний модуль, але це не ефективно, оскільки кожна група та результати функції повинні бути замариновані для обміну повідомленнями між процесами. Чи є …

8
Розсіяні сюжети в Пандах / Піплот: Як побудувати графік за категоріями
Я намагаюся зробити простий графік розкидання в pyplot, використовуючи об'єкт Pandas DataFrame, але хочу ефективний спосіб побудови двох змінних, але мають символи, продиктовані третім стовпцем (ключем). Я пробував різні способи використання df.groupby, але не успішно. Зразок сценарію DF наведено нижче. Це забарвлює маркери відповідно до "key1", але мені подобається бачити …

3
Анотуйте стовпчики зі значеннями на графіках панелей Панд
Я шукав спосіб позначити свої стовпчики у графіку панелі Пандаса округленими числовими значеннями з мого DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Я хотів би отримати щось подібне: Я спробував із цим зразком коду, але всі анотації сконцентровані на галочках x: >>> ax …

2
Збережіть список DataFrames у табличній таблиці Excel
Як я можу експортувати список DataFrames в одну електронну таблицю Excel? Документи для to_excelштату: Примітки. Якщо передавати існуючий об’єкт ExcelWriter, аркуш буде доданий до існуючої книги. Це можна використовувати для збереження різних фреймів даних в одній книзі writer = ExcelWriter('output.xlsx') df1.to_excel(writer, 'sheet1') df2.to_excel(writer, 'sheet2') writer.save() Після цього я подумав, що …



1
Які відмінності між пером та паркетом?
Обидва вони - стовпчасті (дискові) формати зберігання для використання в системах аналізу даних. Обидва вони інтегровані в Apache Arrow ( пакет pyarrow для python) і призначені відповідати Arrow як стовпчастий аналітичний рівень в пам'яті. Чим відрізняються обидва формати? Чи завжди вам слід віддавати перевагу перу під час роботи з пандами, …

3
Перетворіть числові рядки з комами в пандах DataFrame у плаваючі
У мене є DataFrame, який містить числа у вигляді рядків із комами для маркера тисяч. Мені потрібно перетворити їх на плаваючі. a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']] df=pandas.DataFrame(a) Я здогадуюсь, що мені потрібно використовувати locale.atof. Справді df[0].apply(locale.atof) працює, як очікувалося. Я отримую серію поплавців. Але коли я …
89 python  pandas 


1
Багатоіндексне сортування в пандах
У мене є набір даних із багатоіндексними стовпцями у pandas df, які я хотів би відсортувати за значеннями у певному стовпці. Я пробував використовувати sortindex та sortlevel, але не зміг отримати результати, які я шукаю. Мій набір даних виглядає так: Group1 Group2 A B C A B C 1 1 …

3
Панди підсумовуються за групами, але виключають певні стовпці
Який найкращий спосіб зробити групування на фреймі даних Pandas, але виключити деякі стовпці з цієї групи? наприклад, у мене є такий фрейм даних: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 …


2
float64 з пандами to_csv
Я читаю CSV із плаваючими числами, як це: Bob,0.085 Alice,0.005 І імпортуйте в фрейм даних, і запишіть цей фрейм на нове місце df = pd.read_csv(orig) df.to_csv(pandasfile) Тепер це pandasfileмає: Bob,0.085000000000000006 Alice,0.0050000000000000001 Що сталось? може, мені доведеться кидати на інший тип, як float32 чи щось інше? Я використовую pandas 0.9.0 та …
88 python  numpy  pandas 

5
як розділити стовпець кортежів у фреймі даних pandas?
У мене є кадр даних pandas (це лише невеликий фрагмент) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.