Нове у Python.
У R ви можете отримати розмірність матриці, використовуючи dim (...). Яка відповідна функція в Python Pandas для їх кадру даних?
Нове у Python.
У R ви можете отримати розмірність матриці, використовуючи dim (...). Яка відповідна функція в Python Pandas для їх кадру даних?
Відповіді:
Існує кілька способів отримати інформацію про атрибути вашого DataFrame або Series.
Створіть зразки DataFrame та серії
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
shape АтрибутshapeАтрибут повертає два елементи кортеж з числа рядків і числа стовпців в DataFrame. Для серії він повертає кортеж із одного елемента.
df.shape
(3, 2)
s.shape
(3,)
len функціяЩоб отримати кількість рядків DataFrame або отримати довжину ряду, використовуйте lenфункцію. Буде повернено ціле число.
len(df)
3
len(s)
3
size атрибутЩоб отримати загальну кількість елементів у DataFrame або Series, використовуйте sizeатрибут. Для DataFrames це добуток кількості рядків та кількості стовпців. Для серії це буде еквівалентно lenфункції:
df.size
6
s.size
3
ndim атрибутndimАтрибут повертає число вимірювань вашого DataFrame або серії. Це завжди буде 2 для фреймів даних і 1 для серій:
df.ndim
2
s.ndim
1
countметодcountМетод може бути використаний , щоб повернути кількість не пропущених значень для кожного стовпця / рядка DataFrame. Це може викликати заплутаність, оскільки більшість людей зазвичай вважають підрахунок просто довжиною кожного рядка, а це не є. При виклику DataFrame повертається серія із іменами стовпців в індексі та кількістю невідсутніх значень як значень.
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
Для серії існує лише одна вісь для обчислення, тому вона просто повертає скаляр:
s.count()
2
infoметод для отримання метаданихinfoМетод повертає кількість не пропущених значень і типів даних кожного стовпця
df.info ()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes