Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

14
панди: фільтрують рядки DataFrame з ланцюжком оператора
Більшість операцій в pandasможе бути виконана з допомогою оператора ланцюжка ( groupby, aggregate,apply , і т.д.), але єдиним способом я знайшов для фільтра рядків з допомогою звичайної індексації кронштейна df_filtered = df[df['column'] == value] Це непривабливо, оскільки вимагає призначити dfзмінну, перш ніж мати можливість фільтрувати її значення. Чи є щось …
329 python  pandas  dataframe 


23
Як створити тестові та тренувальні зразки з одного фрейму даних з пандами?
У мене досить великий набір даних у вигляді фрейму даних, і мені було цікаво, як мені вдасться розділити кадр даних на два випадкові вибірки (80% та 20%) для навчання та тестування. Дякую!

7
Параметри read_csv low_memory та dtype
При дзвінку df = pd.read_csv('somefile.csv') Я отримав: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Стовпці (4,5,7,16) мають змішані типи. Вкажіть параметр dtype при імпорті або встановіть low_memory = Неправильно. Чому цей dtypeваріант пов'язаний low_memoryі чому він Falseдопомагає вирішити цю проблему?

11
Як зберігати кадр даних за допомогою Pandas
Зараз я імпортую досить великий CSVяк кадр даних щоразу, коли запускаю сценарій. Чи є хороше рішення для постійного доступу до цього фрейму даних між прогонами, тому мені не доведеться витрачати весь цей час на очікування запуску сценарію?
317 python  pandas  dataframe 


5
панди створюють новий стовпчик на основі значень з інших стовпців / застосовують функцію з декількох стовпців, по рядках
Я хочу , щоб застосувати свою призначену для користувача функцію (вона використовує якщо-інакше сходи) в цих шести колон ( ERI_Hispanic, ERI_AmerInd_AKNatv, ERI_Asian, ERI_Black_Afr.Amer, ERI_HI_PacIsl, ERI_White) в кожному рядку мого dataframe. Я спробував різні методи, ніж інші питання, але все ще не можу знайти правильну відповідь на свою проблему. Критичне значення …
316 python  pandas  numpy  apply 

8
Панда умовне створення стовпця / колонки даних
У мене є кадр даних у відповідності до наведених нижче текстів: Type Set 1 A Z 2 B Z 3 B X 4 C Y Я хочу додати ще один стовпець до фрейму даних (або генерувати серію) тієї ж довжини, що і кадр даних (= рівна кількість записів / рядків), …


6
Видалити рядки з панд DataFrame на основі умовного виразу, що включає len (рядок), що дає KeyError
У мене є пандес DataFrame, і я хочу видалити з нього рядки, де довжина рядка в певному стовпчику перевищує 2. Я очікую, що зможу це зробити (за цією відповіддю ): df[(len(df['column name']) < 2)] але я просто отримую помилку: KeyError: u'no item named False' Що я роблю неправильно? (Примітка. Я …
303 python  pandas 

7
Панди - Отримайте значення першого рядка даного стовпця
Це здається смішним простим питанням ... але я не бачу легкої відповіді, яку я очікував. Отже, як я можу отримати значення в n-му рядку даного стовпця в Pandas? (Мене особливо цікавить перший ряд, але я також зацікавився б більш загальною практикою). Наприклад, скажімо, я хочу вивести значення 1,2 у Btime …
300 python  pandas  indexing  head 

15
Перетворити дікт Python в кадр даних
У мене словник Python такий: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06-29': 391, u'2012-06-30': …
299 python  pandas  dataframe 


12
Перетворення між датою, міткою та датою64
Як перетворити numpy.datetime64об'єкт у datetime.datetime(абоTimestamp )? У наступному коді я створюю об'єкти datetime, timetamp and datetime64. import datetime import numpy as np import pandas as pd dt = datetime.datetime(2012, 5, 1) # A strange way to extract a Timestamp object, there's surely a better way? ts = pd.DatetimeIndex([dt])[0] dt64 = …
291 python  datetime  numpy  pandas 

8
Підрахунок панди (виразний) еквівалент
Я використовую панди як замінник db, оскільки у мене є кілька баз даних (oracle, mssql тощо), і я не в змозі скласти послідовність команд до еквівалента SQL. У мене таблиця завантажена в DataFrame з деякими стовпцями: YEARMONTH, CLIENTCODE, SIZE, .... etc etc У SQL підрахувати кількість різних клієнтів на рік …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.