Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

1
Де знаходиться документація щодо тегів Pandas 'Freq'? [зачинено]
Зачинено. Це питання не відповідає вимогам щодо переповнення стека . Наразі відповіді не приймаються. Хочете покращити це питання? Оновіть питання, щоб воно було актуальним для переповнення стека. Закрито 2 роки тому . Удосконалюйте це питання Я новачок у Pandas і намагаюся використовувати date_range. Я стикався з усіма добрими речами freq, …

9
Імпортуйте файл CSV як файл pandas DataFrame
Який спосіб Python читати у файлі CSV у pandas DataFrame (який я потім можу використовувати для статистичних операцій, можу мати різного типу стовпці тощо)? Мій файл CSV "value.txt"має такий вміст: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 У R ми б прочитали цей файл, використовуючи: price <- read.csv("value.txt") і …
91 python  pandas  csv  dataframe 

6
вибір з мультиіндексних панд
У мене є мультиіндексний фрейм даних зі стовпцями 'A' та 'B'. Чи є спосіб виділити рядки, фільтруючи один стовпець мультиіндексу без скидання індексу до одного індексу стовпця? Наприклад. # has multi-index (A,B) df #can I do this? I know this doesn't work because the index is multi-index so I need …

5
Замінити всі конкретні значення у фреймі даних
Маючи фрейм даних, як мені зробити заміну всіх певних значень уздовж усіх рядків і стовпців. Скажімо, наприклад, я хочу замінити всі порожні записи на NA'(без введення позицій): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl 100 Очікуваний результат: A B 1 NA …
91 r  dataframe  replace 

5
Побудуйте pandas DataFrame з елементів у вкладеному словнику
Припустимо, у мене є вкладений словник 'user_dict' зі структурою: Рівень 1: UserId (Long Integer) Рівень 2: Категорія (рядок) Рівень 3: різноманітні атрибути (плаваючі, внутрішні та ін.) Наприклад, записом цього словника буде: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} кожен елемент у user_dictмає …

3
Анотуйте стовпчики зі значеннями на графіках панелей Панд
Я шукав спосіб позначити свої стовпчики у графіку панелі Пандаса округленими числовими значеннями з мого DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Я хотів би отримати щось подібне: Я спробував із цим зразком коду, але всі анотації сконцентровані на галочках x: >>> ax …



5
Spark DataFrame groupBy та сортувати за спаданням (pyspark)
Я використовую pyspark (Python 2.7.9 / Spark 1.3.1) і маю фрейм даних GroupObject, який мені потрібно відфільтрувати та відсортувати за спаданням. Спроба досягти цього за допомогою цього шматка коду. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Але він видає таку помилку. sort() got an unexpected keyword argument 'ascending'

5
як розділити стовпець кортежів у фреймі даних pandas?
У мене є кадр даних pandas (це лише невеликий фрагмент) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV …


17
Додайте (вставте) стовпець між двома стовпцями у файлі data.frame
У мене є фрейм даних, який містить стовпці a, b і c. Я хотів би додати новий стовпець d між b і c. Я знаю, що міг би просто додати d в кінці, використовуючи cbind, але як я можу вставити його між двома стовпцями?
87 r  dataframe  insert 

1
Застосувати функцію до кожної комірки в DataFrame
У мене є кадр даних, який може виглядати так: A B C foo bar foo bar bar foo foo bar Я хочу переглянути кожен елемент кожного рядка (або кожен елемент кожного стовпця) і застосувати наступну функцію, щоб отримати наступний DF: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar …

5
Змістити стовпець у фреймі даних панд вгору на одиницю?
У мене є фрейм даних pandas. Я хочу "відставати" від однієї зі своїх колонок. Це означає, наприклад, зміщення всього стовпця 'gdp' вгору на одиницю, а потім видалення всіх надлишкових даних внизу решти рядків, щоб усі стовпці знову мали однакову довжину. df = y gdp cap 0 1 2 5 1 …

3
Розділіть великий фрейм даних на список фреймів даних на основі загального значення в стовпці
У мене є кадр даних з 10 стовпцями, що збирає дії "користувачів", де один із стовпців містить ідентифікатор (не унікальний, ідентифікуючий користувача) (стовпець 10). довжина кадру даних становить близько 750000 рядків. Я намагаюся витягти окремі кадри даних (щоб отримати список або вектор фреймів даних), розділений на стовпець, що містить ідентифікатор …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.