Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

5
Додайте ідентифікатор, знайдений у списку, до нового стовпця в рамці даних панди
Скажімо, у мене є такий фрейм даних (стовпець цілих чисел та стовпець із переліком цілих чисел) ... ID Found_IDs 0 12345 [15443, 15533, 3433] 1 15533 [2234, 16608, 12002, 7654] 2 6789 [43322, 876544, 36789] А також окремий список ідентифікаторів ... bad_ids = [15533, 876544, 36789, 11111] Враховуючи це, і …

1
Як скинути нульові значення з динамічного циклу, згенерованого з Python?
У мене є такий кадр даних: ORDER_NO 2401 2504 2600 2020020 2019-12-04 2019-12-10 2019-12-12 2020024 2019-12-25 NaN 2019-12-20 2020034 NaN NaN 2019-12-20 2020020 2019-12-12 2019-12-15 2019-12-18 Я створюю XML з вищевказаного фрейму даних. Я хочу видалити нульове значення, яке заповнюється в XML. Мій код повинен викинути це значення стовпця та …

6
ідентифікуйте та позначте повторювані рядки в r
Я б хотів визначити і позначити повторювані рядки на основі 2 стовпців. Я хотів би зробити унікальний ідентифікатор для кожного дубліката, щоб я знав не лише те, що рядок є дублікатом, але і для якого рядка це дублікат. У мене є кадр даних, який виглядає як нижче, з деякими повторюваними …
11 r  dataframe 

7
Прочитайте файл повторних пар «ключ = значення» в DataFrame
У мене є файл txt з даними в цьому форматі. Перші 3 рядки повторюються знову і знову. name=1 grade=A class=B name=2 grade=D class=A Я хотів би вивести дані у форматі таблиці, наприклад: name | grade | class 1 | A | B 2 | D | A Я намагаюся встановити …

6
об'єднувати фрейми даних на основі декількох стовпців і порогів
У мене є два data.frameS з кількома загальними стовпцями (тут: date, city, ctry, і ( other_)number ). Зараз я хотів би об'єднати їх у вищевказаних стовпцях, але допустити певний рівень різниці: threshold.numbers <- 3 threshold.date <- 5 # in days Якщо різниця між dateзаписами > threshold.date(в днях) або > threshold.numbers …
11 r  dataframe 


6
AttributeError: Об'єкт 'DataFrame' не має атрибута 'ix'
Я отримую вищезгадану помилку, коли намагаюся використовувати атрибут .ix рамки даних панди, щоб витягнути стовпець, наприклад, df.ix [:, 'col_header']. Сценарій працював з сьогоднішнього ранку, але сьогодні вдень я запустив його в новому середовищі Linux зі свіжою установкою Pandas. Хтось ще бачив цю помилку раніше? Я шукав тут і деінде, але …

3
Видаліть лише частину стовпця з фрейму даних pandas
У мене є такий приклад фрейму даних: df = pd.DataFrame(data = {'RecordID' : [1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5], 'DisplayLabel' : ['Source','Test','Value 1','Value 2','Value3','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2'], 'Value' : ['Web','Logic','S','I','Complete','Person','Voice','>20','P','Mail','OCR','A','I','Dictation','Understandable','S','I','Web','Logic','R','S']}) який створює цей кадр даних: +-------+----------+---------------+----------------+ | Index | RecordID | Display Label | Value | +-------+----------+---------------+----------------+ | 0 | …

2
Як знайти найвищі N мінімальних значень у DataFrame, Python-3
У мене нижче Dataframe з полем "Age", потреби знаходять верхній 3 мінімальний вік від DataFrame DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() Хочете двох найкращих віків, тобто 18, 23 у списку, як цього досягти? …

5
Створення нового стовпця умовно на основі попередніх n рядків
У мене встановлений кадр даних наступним чином: df <- data.frame("id" = c(111,111,111,222,222,222,222,333,333,333,333), "Location" = c("A","B","A","A","C","B","A","B","A","A","A"), "Encounter" = c(1,2,3,1,2,3,4,1,2,3,4)) id Location Encounter 1 111 A 1 2 111 B 2 3 111 A 3 4 222 A 1 5 222 C 2 6 222 B 3 7 222 A 4 8 …

1
об'єднайте дві рамки даних і додайте рівень стовпців з іменами
Привіт, я копав методи concat, join та merge для панд і, здається, не можу знайти те, що хочу. Припустимо, у мене є два фрейми даних A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) >>> A Col 1 Col 2 Col 3 0 A A A 1 …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.