Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

20
Встановіть значення для конкретної комірки в пандах DataFrame, використовуючи індекс
Я створив DataFrame Pandas df = DataFrame(index=['A','B','C'], columns=['x','y']) і отримав це xy A NaN NaN Б NaN NaN C NaN NaN Тоді я хочу присвоїти значення певній комірці, наприклад для рядка "C" та стовпця "x". Я очікував отримати такий результат: xy A NaN NaN Б NaN NaN C 10 NaN …
478 python  pandas  dataframe 

10
Різниця між картою, схемою застосування та методами застосування в Pandas
Чи можете ви сказати мені, коли слід використовувати ці методи векторизації з основними прикладами? Я бачу, що mapце Seriesметод, тоді як решта - це DataFrameметоди. Я розгубився applyта applymapметоди. Чому у нас є два способи застосування функції до DataFrame? Знову ж таки, прості приклади, які ілюструють використання, були б чудовими!


5
Створення порожнього пакета даних Pandas, а потім заповнення?
Я починаю з документів Pandas DataFrame тут: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотів би ітеративно заповнити DataFrame значеннями у вигляді підрахунку часових рядів. Таким чином, я хотів би ініціалізувати DataFrame зі стовпцями A, B та рядками часової позначки, усі 0 або всі NaN. Тоді я б додав початкові значення та перейшов до цих …
461 python  dataframe  pandas 

24
Як підрахувати значення NaN у стовпці в пандах DataFrame
У мене є дані, в яких я хочу знайти кількість NaN, так що якщо вона буде меншою за деякий поріг, я скину ці стовпці. Я подивився, але не зміг знайти для цього жодної функції. Є value_counts, але для мене це буде повільно, тому що більшість цінностей є чіткими, і я …
459 python  pandas  dataframe 

12
Як я можу замінити всі значення NaN на нулі у стовпчику фрейму даних панди
У мене є кадр даних, як показано нижче itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 …
457 python  pandas  dataframe 


11
Виберіть за допомогою часткового рядка з панди DataFrame
У мене є DataFrame4 колонки, з яких 2 містять рядкові значення. Мені було цікаво, чи існує спосіб вибору рядків на основі часткового збігу рядків проти певного стовпця? Іншими словами, функція або лямбда-функція, яка б робила щось подібне re.search(pattern, cell_in_question) повернення булевого. Я знайомий із синтаксисом, df[df['A'] == "hello world"]але, схоже, …


7
Отримайте статистику для кожної групи (наприклад, кількість, середнє значення тощо) за допомогою pandas GroupBy?
У мене є кадр даних, dfі я використовую кілька його стовпців для groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Вищенаведеним способом я майже отримую потрібну мені таблицю (кадр даних). Не вистачає додаткового стовпця, який містить кількість рядків у кожній групі. Іншими словами, я маю на увазі, але я також хотів би знати, скільки було використано …

7
Як відфільтрувати рамку даних Pandas, використовуючи "in" і "not in", як у SQL
Як я можу досягти еквівалентів SQL INта NOT IN? У мене є список з необхідними значеннями. Ось сценарій: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Мій сучасний спосіб зробити це такий: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in …

18
UnicodeDecodeError під час читання CSV-файлу в Pandas з Python
Я запускаю програму, яка обробляє 30 000 подібних файлів. Випадкове їх число зупиняється і видає цю помилку ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in …

15
Імпортуйте кілька файлів CSV в панди та об'єднайте в один DataFrame
Я хотів би прочитати кілька файлів CSV з каталогу в пандах і об'єднати їх в одну велику DataFrame. Я не зміг це зрозуміти. Ось що я маю досі: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for …

16
Зміна назв стовпців кадру даних
У мене є кадр даних під назвою "newprice" (див. Нижче), і я хочу змінити назви стовпців у своїй програмі на R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 Насправді це те, що я роблю: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Я не ставлю …
399 r  dataframe  rename 

6
Вибір рядів серій / фреймів панд за цілим індексом
Мені цікаво, чому df[2]його не підтримують, df.ix[2]і тоді і те і df[2:3]інше працює. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Я би розраховував df[2]працювати так само, як df[2:3]і відповідати …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.