Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.


5
Як замінити текст у стовпці фрейму даних Pandas?
У моєму фреймі даних є стовпець, такий: range "(2,30)" "(50,290)" "(400,1000)" ... і я хочу замінити ,кому на -тире. Зараз я використовую цей метод, але нічого не змінилось. org_info_exc['range'].replace(',', '-', inplace=True) Хто-небудь може допомогти?

8
Очищення значень `Inf` від фрейму даних R
У R у мене є операція, яка створює деякі Infзначення, коли я перетворюю фрейм даних. Я хотів би перетворити ці Infзначення у NAзначення. Код у мене повільний для великих даних, чи є більш швидкий спосіб зробити це? Скажіть, у мене є такий кадр даних: dat <- data.frame(a=c(1, Inf), b=c(Inf, 3), …
101 r  dataframe  data.table 

2
Об'єкт 'DataFrame' не має атрибута 'sort'
Тут я зіткнувся з деякою проблемою, у своєму пакеті python я встановив numpy, але у мене все ще є ця помилка , в об’єкта 'DataFrame' немає атрибута 'sort' Будь-хто може дати мені якусь ідею .. Це мій код: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final …

7
Як змістити стовпець у Pandas DataFrame
Я хотів би перенести стовпець у пандах DataFrame, але мені не вдалося знайти спосіб зробити це з документації, не переписавши весь DF. Хтось знає, як це зробити? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Бажаний вихід: ## x1 …
101 python  pandas  dataframe 

1
Спосіб прочитати кілька перших рядків для кадру даних pandas
Чи існує вбудований спосіб для read_csvчитання лише перших nрядків файлу, не знаючи довжини рядків заздалегідь? У мене є великий файл, який потрібно довго читати, і іноді хочу лише використовувати перші, скажімо, 20 рядків, щоб отримати його зразок (і волію не завантажувати повну річ і брати її за голову). Якби я …
100 python  pandas  csv  dataframe 

10
Фільтрувати стовпець кадру даних Pyspark зі значенням None
Я намагаюся відфільтрувати фрейм даних PySpark, який має Noneзначення рядка: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] і я можу правильно відфільтрувати за допомогою рядкового значення: df[df.dt_mvmt == '2016-03-31'] # some results here але це не вдається: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 Але для кожної категорії точно …


2
Змішувальний стовпець з пандами пітона
У мене є стовпець Data Frame з числовими значеннями: df['percentage'].head() 46.5 44.2 100.0 42.12 Я хочу бачити стовпець як кількість сміття: bins = [0, 1, 5, 10, 25, 50, 100] Як я можу отримати результат у вигляді сміттєвих ящиків з їхніми value counts? [0, 1] bin amount [1, 5] etc …

5
як змінити стовпець Dataframe із типу String на тип Double у pyspark
У мене є фрейм даних із стовпцем як String. Я хотів змінити тип стовпця на Double type у PySpark. Ось такий шлях я зробив: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Просто хотів знати, чи це правильний спосіб це зробити, оскільки під час проходження логістичної регресії я отримую деяку …

5
Замініть None на NaN у фреймі даних pandas
У мене є таблиця x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Я хочу замінити python None пандами NaN. Я намагався: x.replace(to_replace=None, value=np.nan) Але я отримав: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you passed a …

6
Перетворити фрейм даних панд на серії
Я дещо новачок у пандах. У мене є кадр даних pandas, який становить 1 рядок на 23 стовпці. Я хочу перетворити це на серію? Цікаво, який найбільш пітонічний спосіб це зробити? Я пробував, pd.Series(myResults)але це скаржиться ValueError: cannot copy sequence with size 23 to array axis with dimension 1. Це …



7
Вибір панд за міткою іноді повертає Серію, іноді повертає DataFrame
У Pandas, коли я вибираю мітку, яка має лише один запис в індексі, я повертаю серію, але коли я вибираю запис, який має більше одного запису, я отримую кадр даних. Чому так? Чи є спосіб забезпечити, щоб я завжди повертав фрейм даних? In [1]: import pandas as pd In [2]: …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.