Нове у Python.
У R ви можете отримати розмірність матриці, використовуючи dim (...). Яка відповідна функція в Python Pandas для їх кадру даних?
Нове у Python.
У R ви можете отримати розмірність матриці, використовуючи dim (...). Яка відповідна функція в Python Pandas для їх кадру даних?
Відповіді:
Існує кілька способів отримати інформацію про атрибути вашого DataFrame або Series.
Створіть зразки DataFrame та серії
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
shape
Атрибутshape
Атрибут повертає два елементи кортеж з числа рядків і числа стовпців в DataFrame. Для серії він повертає кортеж із одного елемента.
df.shape
(3, 2)
s.shape
(3,)
len
функціяЩоб отримати кількість рядків DataFrame або отримати довжину ряду, використовуйте len
функцію. Буде повернено ціле число.
len(df)
3
len(s)
3
size
атрибутЩоб отримати загальну кількість елементів у DataFrame або Series, використовуйте size
атрибут. Для DataFrames це добуток кількості рядків та кількості стовпців. Для серії це буде еквівалентно len
функції:
df.size
6
s.size
3
ndim
атрибутndim
Атрибут повертає число вимірювань вашого DataFrame або серії. Це завжди буде 2 для фреймів даних і 1 для серій:
df.ndim
2
s.ndim
1
count
методcount
Метод може бути використаний , щоб повернути кількість не пропущених значень для кожного стовпця / рядка DataFrame. Це може викликати заплутаність, оскільки більшість людей зазвичай вважають підрахунок просто довжиною кожного рядка, а це не є. При виклику DataFrame повертається серія із іменами стовпців в індексі та кількістю невідсутніх значень як значень.
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
Для серії існує лише одна вісь для обчислення, тому вона просто повертає скаляр:
s.count()
2
info
метод для отримання метаданихinfo
Метод повертає кількість не пропущених значень і типів даних кожного стовпця
df.info ()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes