Python - Вимір кадру даних


85

Нове у Python.

У R ви можете отримати розмірність матриці, використовуючи dim (...). Яка відповідна функція в Python Pandas для їх кадру даних?


2
Детальний підсумок усіх способів отримати інформацію про розміри на DataFrames та Series див. У цій відповіді нижче
Тед Петру,

Відповіді:



24

Короткий огляд усіх способів отримати інформацію про розміри DataFrame або Series

Існує кілька способів отримати інформацію про атрибути вашого DataFrame або Series.

Створіть зразки DataFrame та серії

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df

     a  b
0  5.0  9
1  2.0  2
2  NaN  4

s = df['a']
s

0    5.0
1    2.0
2    NaN
Name: a, dtype: float64

shape Атрибут

shapeАтрибут повертає два елементи кортеж з числа рядків і числа стовпців в DataFrame. Для серії він повертає кортеж із одного елемента.

df.shape
(3, 2)

s.shape
(3,)

len функція

Щоб отримати кількість рядків DataFrame або отримати довжину ряду, використовуйте lenфункцію. Буде повернено ціле число.

len(df)
3

len(s)
3

size атрибут

Щоб отримати загальну кількість елементів у DataFrame або Series, використовуйте sizeатрибут. Для DataFrames це добуток кількості рядків та кількості стовпців. Для серії це буде еквівалентно lenфункції:

df.size
6

s.size
3

ndim атрибут

ndimАтрибут повертає число вимірювань вашого DataFrame або серії. Це завжди буде 2 для фреймів даних і 1 для серій:

df.ndim
2

s.ndim
1

Хитрий countметод

countМетод може бути використаний , щоб повернути кількість не пропущених значень для кожного стовпця / рядка DataFrame. Це може викликати заплутаність, оскільки більшість людей зазвичай вважають підрахунок просто довжиною кожного рядка, а це не є. При виклику DataFrame повертається серія із іменами стовпців в індексі та кількістю невідсутніх значень як значень.

df.count() # by default, get the count of each column

a    2
b    3
dtype: int64


df.count(axis='columns') # change direction to get count of each row

0    2
1    2
2    1
dtype: int64

Для серії існує лише одна вісь для обчислення, тому вона просто повертає скаляр:

s.count()
2

Використовуйте infoметод для отримання метаданих

infoМетод повертає кількість не пропущених значень і типів даних кожного стовпця

df.info ()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.