Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

5
Як отримати доступ до груп даних панди за допомогою ключа даних
Як я можу отримати доступ до відповідного фрейму даних groupby в об'єкті groupby за допомогою ключа? З наступною групою: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Я можу повторити його, щоб отримати ключі та групи: In [11]: for …

3
Логічні оператори для булевої індексації в Pandas
Я працюю з булевим індексом у Pandas. Питання, чому твердження: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] добре працює тоді a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] виходить із помилкою? Приклад: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one element is …




6
Чи варто використовувати data.frame або матрицю?
Коли слід використовувати a data.frame, а коли краще використовувати a matrix? Обидва зберігають дані у прямокутному форматі, тому іноді це незрозуміло. Чи існують якісь загальні правила, коли потрібно використовувати тип даних?
152 r  matrix  dataframe  r-faq 


8
Чи можуть панди автоматично розпізнавати дати?
Сьогодні я був позитивно здивований тим фактом, що під час читання даних із файлу даних (наприклад) панди здатні розпізнавати типи значень: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Наприклад, це можна перевірити таким чином: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) Зокрема цілі числа, поплавці та рядки були розпізнані правильно. …
151 python  date  types  dataframe  pandas 

3
Панди створюють порожні DataFrame з лише іменами стовпців
У мене є динамічний DataFrame, який працює чудово, але коли немає даних, які потрібно додати до DataFrame, я отримую помилку. І тому мені потрібно рішення створити порожній DataFrame з лише назвами стовпців. Наразі у мене є щось подібне: df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. …
151 python  pandas  dataframe 

10
Найшвидший спосіб замінити NA у великому таблицю даних
У мене є великий data.table , з великою кількістю відсутніх значень, розкиданих по його ~ 200k рядків та 200 стовпців. Я хотів би перекодувати ці значення NA на нулі якомога ефективніше. Я бачу два варіанти: 1: Перетворити в data.frame і використовувати щось на зразок цього 2: Якась класна команда встановлення …

8
Повторіть кожен рядок data.frame кількість разів, вказану в стовпці
df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'), freq = 1:3) Який найпростіший спосіб розширити кожен рядок перші два стовпчики даних data.frame вище, щоб кожен рядок повторювався кількість разів, вказаних у стовпці 'freq'? Іншими словами, перейдіть до цього: df var1 var2 freq 1 a d 1 …
150 r  dataframe  replicate 

12
Заміна порожніх значень (пробіл) на NaN у пандах
Я хочу знайти всі значення у фреймі даних Pandas, які містять пробіл (будь-яку довільну кількість) і замінити ці значення NaN. Будь-які ідеї, як це можна вдосконалити? В основному я хочу перетворити це: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz …
150 python  pandas  dataframe 

11
Видаліть стовпці з фрейму даних, де ВСІ значення є NA
У мене виникли проблеми з кадром даних і не може реально вирішити цю проблему сам: dataframe має довільні властивості, стовпців і кожен рядок являє собою один набір даних . Питання: Як позбутися стовпців, де для ВСІХ рядків значення NA ?
149 r  apply  dataframe 

7
Перетворити назви рядків у перший стовпець
У мене є такий кадр даних: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" Я хочу перетворити назви рядків у перший стовпець. В даний час я використовую щось подібне …
147 r  dataframe  col  rowname 

10
Розщеплення словника / списку всередині стовпця Панди на окремі стовпці
У мене збережені дані в базі даних postgreSQL. Я запитую ці дані за допомогою Python2.7 і перетворюю їх у Pandas DataFrame. Однак останній стовпчик цього фрейму даних містить в собі словник (або список?) Значень. DataFrame виглядає так: [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", "c": "12"} 8810 …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.