Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

14
Як показати ім'я всіх стовпців у фреймі даних pandas?
У мене є фрейм даних, який складається з сотні стовпців, і мені потрібно побачити всі імена стовпців. Що я зробив: In[37]: data_all2.columns Вихід: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) Як показати всі …
127 python  pandas  dataframe  show 

4
Дати часу в пандах read_csv
Я читаю у файлі csv з кількома колонками дати. Мені потрібно встановити типи даних після читання у файлі, але часові дати видаються проблемою. Наприклад: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Коли запуск видає помилку: TypeError: тип даних "datetime" не …

4
Як сформувати стовпчик кортежу з двох стовпців у Пандах
У мене є DataFrame Pandas, і я хочу поєднати стовпці "lat" і "long", щоб сформувати кортеж. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 …

10
Збережіть Dataframe в CSV безпосередньо на s3 Python
У мене є панда DataFrame, яку я хочу завантажити в новий файл CSV. Проблема полягає в тому, що я не хочу зберігати файл локально, перш ніж перенести його в s3. Чи є такий метод, як to_csv для запису фрейму даних в s3 безпосередньо? Я використовую boto3. Ось що я маю …

2
Як створити DataFrame з випадкових цілих чисел за допомогою Pandas?
Я знаю, що якщо я буду використовувати randn, import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) дає мені те, що я шукаю, але з елементами звичайного розподілу. Але що робити, якщо я просто хотів випадкових цілих чисел? randintпрацює, надаючи діапазон, але не масив, як randnце …

12
рядок data.frame до списку
У мене є data.frame, який я хотів би перетворити на список рядками, тобто кожен рядок відповідав би власним елементам списку. Іншими словами, я хотів би список, який є таким довгим, як у data.frame є рядки. Поки я вирішував цю проблему наступним чином, але мені було цікаво, чи є кращий спосіб …
123 list  r  dataframe 

8
Динамічно вибирайте стовпці кадру даних, використовуючи $ та значення символу
У мене є вектор різних назв стовпців, і я хочу мати можливість перебирати петлі над кожним із них, щоб отримати цей стовпець із data.frame. Наприклад, розглянемо набір даних mtcarsі деякі імена змінних, що зберігаються у символьному векторі cols. Коли я намагаюся вибрати змінну з mtcarsвикористанням динамічного підмножини cols, яка є …
122 r  dataframe  r-faq 

3
Знайдіть ім’я стовпця, яке має максимальне значення для кожного рядка
У мене є така DataFrame, як ця: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Тут я хочу запитати, як отримати ім'я стовпця, …
122 python  pandas  dataframe  max 

8
Як додати декілька стовпців до кадру даних панд в одному призначенні?
Я новачок у пандах і намагаюся зрозуміти, як додати декілька стовпців до панд одночасно. Будь-яка допомога тут цінується. В ідеалі я хотів би зробити це одним кроком, а не декількома повторними кроками ... import pandas as pd df = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, 7]} df …
122 python  pandas  dataframe 

7
Як додати рядки до кадру даних R
Я оглянув StackOverflow, але не можу знайти рішення, специфічне для моєї проблеми, яке передбачає додавання рядків до кадру даних R. Я ініціалізую порожній кадр даних з двох стовпців, як описано нижче. df = data.frame(x = numeric(), y = character()) Тоді моя мета - повторити список значень і в кожній ітерації …
121 r  merge  append  dataframe  rows 

3
отримання індексу рядка в застосуванні функції панди
Я намагаюся отримати доступ до індексу рядка у функції, застосованій у цілому DataFrameв Pandas. У мене є щось подібне: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 і я визначу функцію, яка отримує доступ до елементів із заданим рядком def rowFunc(row): …
121 python  pandas  dataframe 

14
Порахуйте кількість рядків у кожній групі
У мене є кадр даних, і я хотів би порахувати кількість рядків у кожній групі. Я регулярно використовую aggregateфункцію для підсумовування даних наступним чином: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Тепер я хотів би порахувати спостереження, але не можу знайти належний аргумент FUN. Інтуїтивно, я …
121 r  dataframe  aggregate  r-faq 

5
Передайте функції стовпця data.frame до функції
Я намагаюся написати функцію, щоб прийняти data.frame ( x) та a columnз неї. Функція виконує деякі обчислення на x і пізніше повертає інший data.frame. Я затримався на методі кращих практик, щоб передати ім’я стовпця функції. Два мінімальні приклади fun1та fun2нижче дають бажаний результат, маючи можливість виконувати операції над x$column, використовуючи …
119 r  dataframe  r-faq 

3
Як перевірити, чи рядок містить одну з підрядів у списку, в пандах?
Чи є якась функція, яка була б еквівалентом комбінації df.isin()та df[col].str.contains()? Наприклад, скажіть, що у мене є серія s = pd.Series(['cat','hat','dog','fog','pet']), і я хочу знайти всі місця, де sє будь-який із них ['og', 'at'], я б хотів отримати все, окрім "домашньої тварини". У мене є рішення, але воно досить неелегантне: …

5
додайте рядковий префікс до кожного значення в стовпці рядків за допомогою Pandas
Я хотів би додати рядок до початку кожного значення у згаданому стовпчику фрейму даних панди (елегантно). Я вже зрозумів, як це зробити, і зараз я використовую: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Здається, це одне пекло неелегантної речі - чи знаєте ви будь-який інший спосіб (який, можливо, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.