Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.


4
Як побудувати два стовпці кадру даних панд за допомогою точок?
У мене є фрейм даних pandas, і я хотів би побудувати значення з одного стовпця порівняно зі значеннями з іншого стовпця. На щастя, існує plotметод, пов’язаний з фреймами даних, який, здається, робить те, що мені потрібно: df.plot(x='col_name_1', y='col_name_2') На жаль, схоже, серед стилів сюжету (перелічених тут після kindпараметра) немає пунктів. …

5
Як я можу зробити заголовки стовпців кадру даних pandas малими?
Я хочу зробити усі заголовки стовпців у моєму фреймі даних pandas малими літерами Приклад Якщо я маю: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Я хотів би змінити XRAT на …

6
Підмножина рядків, що містять значення NA (відсутні) у вибраному стовпці кадру даних
У нас є кадр даних із файлу CSV. Кадр даних DFмає стовпці, що містять спостережувані значення, і стовпець ( VaR2), що містить дату, на яку було проведено вимірювання. Якщо дата не була записана, файл CSV містить значення NAвідсутніх даних. Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 Ми хотіли б …
96 r  csv  dataframe  subset  na 

5
Додати стовпець у фрейм даних зі списку
У мене є фрейм даних із такими стовпцями: A B C 0 4 5 6 7 7 6 5 Можливий діапазон значень в межах від 0 до 7 . Крім того, у мене є список з 8 таких елементів: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list Якщо елемент …


16
Як вибрати рядок з максимальним значенням у кожній групі
У наборі даних з кількома спостереженнями за кожним предметом я хочу взяти підмножину, що містить лише максимальне значення даних для кожного запису. Наприклад, із таким набором даних: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) Суб’єкти 1, 2 та 3 мають найбільше значення pt …
94 r  dataframe  r-faq 

6
Чи є у Pandas спосіб використовувати попереднє значення рядка в dataframe.apply, коли попереднє значення також обчислюється в застосунку?
У мене є такий фрейм даних: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Вимагати: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 …

3
python pandas dataframe стовпці перетворюють у ключ і значення dict
У мене є кадр даних pandas з декількома стовпцями, і я хотів би побудувати дикт із двох стовпців: один як ключі дикту, а інший як значення дикту. Як я можу це зробити? Кадр даних: area count co tp DE Lake 10 7 Forest 20 5 FR Lake 30 2 Forest …

11
Як розгорнути список всередині комірки Dataframe в окремі рядки
Я прагну перетворити клітинку панд, що містить список, у рядки для кожного з цих значень. Отже, візьмімо це: Якщо я хотів би розпакувати та скласти значення у nearest_neighborsстовпці так, щоб кожне значення було рядком у кожному opponentіндексі, як би я найкраще це зробив? Чи існують методи панд, призначені для таких …

6
Перейменування назв стовпців DataFrame у Spark Scala
Я намагаюся перетворити всі заголовки / імена стовпців a DataFrameу Spark-Scala. на даний момент я придумав наступний код, який замінює лише одне ім'я стовпця. for( i <- 0 to origCols.length - 1) { df.withColumnRenamed( df.columns(i), df.columns(i).toLowerCase ); }

6
Неоднозначність у визначенні "осі" масиву даних Pandas / масиву Numpy
Я був дуже заплутаний щодо того, як визначаються осі python, і чи посилаються вони на рядки або стовпці DataFrame. Розглянемо наведений нижче код: >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 …

11
Розбиття кадру даних на кілька кадрів даних
У мене дуже великий кадр даних (близько 1 мільйона рядків) з даними експерименту (60 респондентів). Я хотів би розділити фрейм даних на 60 фреймів (фрейм даних для кожного учасника). У фреймі даних dataіснує змінна з назвою 'name', яка є унікальним кодом для кожного учасника. Я спробував наступне, але нічого не …

6
Перетворити серію панд на DataFrame
У мене є серія Pandas sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] І я хотів би перетворити його на такий DataFrame: index | email | list _____________________________________________ 0 | email1@email.com | …

3
Python: отримайте підрахунок частоти на основі двох стовпців (змінних) у фреймі даних pandas деяких рядків
Привіт, у мене такий фрейм даних. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Я хочу підрахувати частоту того, скільки разів той самий рядок відображається у фреймі даних. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.