Програмування pandas

11

Виберіть за допомогою часткового рядка з панди DataFrame

У мене є DataFrame4 колонки, з яких 2 містять рядкові значення. Мені було цікаво, чи існує спосіб вибору рядків на основі часткового збігу рядків проти певного стовпця? Іншими словами, функція або лямбда-функція, яка б робила щось подібне re.search(pattern, cell_in_question) повернення булевого. Я знайомий із синтаксисом, df[df['A'] == "hello world"]але, схоже, …

448 python string pandas dataframe

9

Перемішайте рядки DataFrame

У мене є такі DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame зчитується з файлу CSV. Усі ряди, які …

438 python pandas dataframe permutation shuffle

7

Отримайте статистику для кожної групи (наприклад, кількість, середнє значення тощо) за допомогою pandas GroupBy?

У мене є кадр даних, dfі я використовую кілька його стовпців для groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Вищенаведеним способом я майже отримую потрібну мені таблицю (кадр даних). Не вистачає додаткового стовпця, який містить кількість рядків у кожній групі. Іншими словами, я маю на увазі, але я також хотів би знати, скільки було використано …

438 python pandas dataframe group-by pandas-groupby

7

Як відфільтрувати рамку даних Pandas, використовуючи "in" і "not in", як у SQL

Як я можу досягти еквівалентів SQL INта NOT IN? У мене є список з необхідними значеннями. Ось сценарій: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Мій сучасний спосіб зробити це такий: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in …

432 python pandas dataframe sql-function

18

UnicodeDecodeError під час читання CSV-файлу в Pandas з Python

Я запускаю програму, яка обробляє 30 000 подібних файлів. Випадкове їх число зупиняється і видає цю помилку ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in …

411 python pandas csv dataframe unicode

6

Як уникнути створення Python / Pandas індексу в збереженому CSV?

Я намагаюся зберегти файл csv у папці після внесення змін у файл. Кожен раз, коли я використовую pd.to_csv('C:/Path of file.csv')файл csv, є окремий стовпець індексів. Я хочу уникати друку індексу на csv. Я намагався: pd.read_csv('C:/Path to file to edit.csv', index_col = False) І щоб зберегти файл ... pd.to_csv('C:/Path to save …

407 python csv indexing pandas

15

Імпортуйте кілька файлів CSV в панди та об'єднайте в один DataFrame

Я хотів би прочитати кілька файлів CSV з каталогу в пандах і об'єднати їх в одну велику DataFrame. Я не зміг це зрозуміти. Ось що я маю досі: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for …

403 python pandas csv dataframe concatenation

6

Вибір рядів серій / фреймів панд за цілим індексом

Мені цікаво, чому df[2]його не підтримують, df.ix[2]і тоді і те і df[2:3]інше працює. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Я би розраховував df[2]працювати так само, як df[2:3]і відповідати …

395 python pandas dataframe indexing

15

Побудова панд DataFrame із значень змінних дає "ValueError: Якщо ви використовуєте всі скалярні значення, ви повинні передати індекс"

Це може бути простим питанням, але я не можу зрозуміти, як це зробити. Скажемо, що у мене є дві змінні наступним чином. a = 2 b = 3 Я хочу створити DataFrame з цього: df2 = pd.DataFrame({'A':a,'B':b}) Це створює помилку: ValueError: Якщо ви використовуєте всі скалярні значення, ви повинні пройти …

370 python pandas dataframe scalar

12

Як застосувати функцію до двох стовпців фрейму даних Pandas

Припустимо, у мене є df який має стовпці 'ID', 'col_1', 'col_2'. І я визначаю функцію: f = lambda x, y : my_function_expression. Тепер я хочу застосувати fдо dfдвох стовпців, 'col_1', 'col_2'щоб обчислити новий стовпець 'col_3', як-от так: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments …

368 python pandas dataframe

6

Істинна цінність серії є неоднозначною. Використовуйте a.empty, a.bool (), a.item (), a.any () або a.all ()

Проблема з фільтруванням мого результату кадрів даних за orумови. Я хочу, щоб мій результат dfвитягнути всю колонкуvar витягнув значення що перевищують 0,25 і нижче -0,25. Ця логіка нижче дає мені неоднозначне значення істини, однак воно працює, коли я розділив цю фільтрацію на дві окремі операції. Що тут відбувається? не знаєте, …

366 python pandas dataframe boolean filtering

2

Об'єднання панд 101

Як виконати приєднання ( LEFT| RIGHT| FULL) ( INNER| OUTER) з пандами? Як додати NaN для пропущених рядків після об'єднання? Як я можу позбутися NaNs після злиття? Чи можу я злитися на індекс? Перехресне з'єднання з пандами? Як з'єднати кілька DataFrames? merge? join? concat? update? ВООЗ? Що? Чому ?! ... …

362 python pandas join merge

2

Як зібрати кадр даних

Що таке стрижень? Як зробити шарнір? Це стрижень? Довгий формат до широкого формату? Я бачив безліч питань, які задають питання про зведені таблиці. Навіть якщо вони не знають, що запитують про зведені таблиці, вони зазвичай є. Написати канонічне запитання та відповідь практично неможливо, що охоплює всі аспекти повороту…. ... Але …

360 python pandas group-by pivot pandas-groupby

11

Як отримати значення з комірки фрейму даних?

Я створив умову, яка витягує рівно один рядок із мого кадру даних: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Тепер я хотів би взяти значення з певного стовпця: val = d2['col_name'] Але в результаті я отримую кадр даних, який містить один рядок і один стовпець ( тобто одну …

345 python pandas dataframe

30

Помилка Pandas Python Помилка токенізації даних

Я намагаюся використовувати панди для маніпулювання файлом .csv, але я отримую цю помилку: pandas.parser.CParserError: помилка в маркуванні даних. C помилка: очікується 2 поля у рядку 3, побачив 12 Я спробував прочитати документи панди, але нічого не знайшов. Мій код простий: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) Як …

343 python csv pandas

Запитання з тегом «pandas»