Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

11
Виберіть за допомогою часткового рядка з панди DataFrame
У мене є DataFrame4 колонки, з яких 2 містять рядкові значення. Мені було цікаво, чи існує спосіб вибору рядків на основі часткового збігу рядків проти певного стовпця? Іншими словами, функція або лямбда-функція, яка б робила щось подібне re.search(pattern, cell_in_question) повернення булевого. Я знайомий із синтаксисом, df[df['A'] == "hello world"]але, схоже, …


7
Отримайте статистику для кожної групи (наприклад, кількість, середнє значення тощо) за допомогою pandas GroupBy?
У мене є кадр даних, dfі я використовую кілька його стовпців для groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Вищенаведеним способом я майже отримую потрібну мені таблицю (кадр даних). Не вистачає додаткового стовпця, який містить кількість рядків у кожній групі. Іншими словами, я маю на увазі, але я також хотів би знати, скільки було використано …

7
Як відфільтрувати рамку даних Pandas, використовуючи "in" і "not in", як у SQL
Як я можу досягти еквівалентів SQL INта NOT IN? У мене є список з необхідними значеннями. Ось сценарій: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Мій сучасний спосіб зробити це такий: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in …

18
UnicodeDecodeError під час читання CSV-файлу в Pandas з Python
Я запускаю програму, яка обробляє 30 000 подібних файлів. Випадкове їх число зупиняється і видає цю помилку ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in …

6
Як уникнути створення Python / Pandas індексу в збереженому CSV?
Я намагаюся зберегти файл csv у папці після внесення змін у файл. Кожен раз, коли я використовую pd.to_csv('C:/Path of file.csv')файл csv, є окремий стовпець індексів. Я хочу уникати друку індексу на csv. Я намагався: pd.read_csv('C:/Path to file to edit.csv', index_col = False) І щоб зберегти файл ... pd.to_csv('C:/Path to save …
407 python  csv  indexing  pandas 

15
Імпортуйте кілька файлів CSV в панди та об'єднайте в один DataFrame
Я хотів би прочитати кілька файлів CSV з каталогу в пандах і об'єднати їх в одну велику DataFrame. Я не зміг це зрозуміти. Ось що я маю досі: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for …

6
Вибір рядів серій / фреймів панд за цілим індексом
Мені цікаво, чому df[2]його не підтримують, df.ix[2]і тоді і те і df[2:3]інше працює. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Я би розраховував df[2]працювати так само, як df[2:3]і відповідати …

15
Побудова панд DataFrame із значень змінних дає "ValueError: Якщо ви використовуєте всі скалярні значення, ви повинні передати індекс"
Це може бути простим питанням, але я не можу зрозуміти, як це зробити. Скажемо, що у мене є дві змінні наступним чином. a = 2 b = 3 Я хочу створити DataFrame з цього: df2 = pd.DataFrame({'A':a,'B':b}) Це створює помилку: ValueError: Якщо ви використовуєте всі скалярні значення, ви повинні пройти …

12
Як застосувати функцію до двох стовпців фрейму даних Pandas
Припустимо, у мене є df який має стовпці 'ID', 'col_1', 'col_2'. І я визначаю функцію: f = lambda x, y : my_function_expression. Тепер я хочу застосувати fдо dfдвох стовпців, 'col_1', 'col_2'щоб обчислити новий стовпець 'col_3', як-от так: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments …
368 python  pandas  dataframe 

6
Істинна цінність серії є неоднозначною. Використовуйте a.empty, a.bool (), a.item (), a.any () або a.all ()
Проблема з фільтруванням мого результату кадрів даних за orумови. Я хочу, щоб мій результат dfвитягнути всю колонкуvar витягнув значення що перевищують 0,25 і нижче -0,25. Ця логіка нижче дає мені неоднозначне значення істини, однак воно працює, коли я розділив цю фільтрацію на дві окремі операції. Що тут відбувається? не знаєте, …

2
Об'єднання панд 101
Як виконати приєднання ( LEFT| RIGHT| FULL) ( INNER| OUTER) з пандами? Як додати NaN для пропущених рядків після об'єднання? Як я можу позбутися NaNs після злиття? Чи можу я злитися на індекс? Перехресне з'єднання з пандами? Як з'єднати кілька DataFrames? merge? join? concat? update? ВООЗ? Що? Чому ?! ... …
362 python  pandas  join  merge 

2
Як зібрати кадр даних
Що таке стрижень? Як зробити шарнір? Це стрижень? Довгий формат до широкого формату? Я бачив безліч питань, які задають питання про зведені таблиці. Навіть якщо вони не знають, що запитують про зведені таблиці, вони зазвичай є. Написати канонічне запитання та відповідь практично неможливо, що охоплює всі аспекти повороту…. ... Але …

11
Як отримати значення з комірки фрейму даних?
Я створив умову, яка витягує рівно один рядок із мого кадру даних: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Тепер я хотів би взяти значення з певного стовпця: val = d2['col_name'] Але в результаті я отримую кадр даних, який містить один рядок і один стовпець ( тобто одну …
345 python  pandas  dataframe 

30
Помилка Pandas Python Помилка токенізації даних
Я намагаюся використовувати панди для маніпулювання файлом .csv, але я отримую цю помилку: pandas.parser.CParserError: помилка в маркуванні даних. C помилка: очікується 2 поля у рядку 3, побачив 12 Я спробував прочитати документи панди, але нічого не знайшов. Мій код простий: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) Як …
343 python  csv  pandas 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.