Програмування dataframe

20

Встановіть значення для конкретної комірки в пандах DataFrame, використовуючи індекс

Я створив DataFrame Pandas df = DataFrame(index=['A','B','C'], columns=['x','y']) і отримав це xy A NaN NaN Б NaN NaN C NaN NaN Тоді я хочу присвоїти значення певній комірці, наприклад для рядка "C" та стовпця "x". Я очікував отримати такий результат: xy A NaN NaN Б NaN NaN C 10 NaN …

478 python pandas dataframe

10

Різниця між картою, схемою застосування та методами застосування в Pandas

Чи можете ви сказати мені, коли слід використовувати ці методи векторизації з основними прикладами? Я бачу, що mapце Seriesметод, тоді як решта - це DataFrameметоди. Я розгубився applyта applymapметоди. Чому у нас є два способи застосування функції до DataFrame? Знову ж таки, прості приклади, які ілюструють використання, були б чудовими!

465 python pandas dataframe vectorization

15

Перетворити фрейм даних панди в масив NumPy

Мені цікаво знати, як перетворити кадр даних панди в масив NumPy. кадр даних: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = …

465 python arrays pandas numpy dataframe

5

Створення порожнього пакета даних Pandas, а потім заповнення?

Я починаю з документів Pandas DataFrame тут: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотів би ітеративно заповнити DataFrame значеннями у вигляді підрахунку часових рядів. Таким чином, я хотів би ініціалізувати DataFrame зі стовпцями A, B та рядками часової позначки, усі 0 або всі NaN. Тоді я б додав початкові значення та перейшов до цих …

461 python dataframe pandas

24

Як підрахувати значення NaN у стовпці в пандах DataFrame

У мене є дані, в яких я хочу знайти кількість NaN, так що якщо вона буде меншою за деякий поріг, я скину ці стовпці. Я подивився, але не зміг знайти для цього жодної функції. Є value_counts, але для мене це буде повільно, тому що більшість цінностей є чіткими, і я …

459 python pandas dataframe

12

Як я можу замінити всі значення NaN на нулі у стовпчику фрейму даних панди

У мене є кадр даних, як показано нижче itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 …

457 python pandas dataframe

7

Як перетворити індекс фрейму даних панди в стовпчик?

Це здається досить очевидним, але я не можу зрозуміти, як перетворити індекс кадру даних у стовпець? Наприклад: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 До df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596

456 python pandas dataframe

11

Виберіть за допомогою часткового рядка з панди DataFrame

У мене є DataFrame4 колонки, з яких 2 містять рядкові значення. Мені було цікаво, чи існує спосіб вибору рядків на основі часткового збігу рядків проти певного стовпця? Іншими словами, функція або лямбда-функція, яка б робила щось подібне re.search(pattern, cell_in_question) повернення булевого. Я знайомий із синтаксисом, df[df['A'] == "hello world"]але, схоже, …

448 python string pandas dataframe

9

Перемішайте рядки DataFrame

У мене є такі DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame зчитується з файлу CSV. Усі ряди, які …

438 python pandas dataframe permutation shuffle

7

Отримайте статистику для кожної групи (наприклад, кількість, середнє значення тощо) за допомогою pandas GroupBy?

У мене є кадр даних, dfі я використовую кілька його стовпців для groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Вищенаведеним способом я майже отримую потрібну мені таблицю (кадр даних). Не вистачає додаткового стовпця, який містить кількість рядків у кожній групі. Іншими словами, я маю на увазі, але я також хотів би знати, скільки було використано …

438 python pandas dataframe group-by pandas-groupby

7

Як відфільтрувати рамку даних Pandas, використовуючи "in" і "not in", як у SQL

Як я можу досягти еквівалентів SQL INта NOT IN? У мене є список з необхідними значеннями. Ось сценарій: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Мій сучасний спосіб зробити це такий: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in …

432 python pandas dataframe sql-function

18

UnicodeDecodeError під час читання CSV-файлу в Pandas з Python

Я запускаю програму, яка обробляє 30 000 подібних файлів. Випадкове їх число зупиняється і видає цю помилку ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in …

411 python pandas csv dataframe unicode

15

Імпортуйте кілька файлів CSV в панди та об'єднайте в один DataFrame

Я хотів би прочитати кілька файлів CSV з каталогу в пандах і об'єднати їх в одну велику DataFrame. Я не зміг це зрозуміти. Ось що я маю досі: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for …

403 python pandas csv dataframe concatenation

16

Зміна назв стовпців кадру даних

У мене є кадр даних під назвою "newprice" (див. Нижче), і я хочу змінити назви стовпців у своїй програмі на R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 Насправді це те, що я роблю: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Я не ставлю …

399 r dataframe rename

6

Вибір рядів серій / фреймів панд за цілим індексом

Мені цікаво, чому df[2]його не підтримують, df.ix[2]і тоді і те і df[2:3]інше працює. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Я би розраховував df[2]працювати так само, як df[2:3]і відповідати …

395 python pandas dataframe indexing

Запитання з тегом «dataframe»