Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

4
Pandas версія rbind
У R ви можете поєднати два кадри даних, приклеївши стовпці одного до нижньої частини стовпців іншого, використовуючи rbind. Як ви робите в пандах те саме? Це здається химерно важким. Використання додатка призводить до жахливого безладу, включаючи NaN та інші речі з причин, які я не розумію. Я просто намагаюся "зв'язати" …
76 python  r  dataframe  pandas 

3
Обробка змінної кількості стовпців з Pandas - Python
У мене є набір даних, який виглядає так (щонайбільше 5 стовпців - але може бути і менше) 1,2,3 1,2,3,4 1,2,3,4,5 1,2 1,2,3,4 .... Я намагаюся використовувати pandas read_table, щоб прочитати це у 5-стовпчатий фрейм даних. Я хотів би прочитати це без додаткового масажу. Якщо я спробую import pandas as pd …
76 python  pandas 

5
Python Pandas read_csv пропускає рядки, але зберігає заголовок
У мене виникають проблеми з тим, як пропустити n рядків у файлі csv, але зберегти заголовок, який є 1 рядком. Що я хочу зробити, це повторити, але зберегти заголовок з першого рядка. skiprowsробить заголовок першим рядком після пропущених рядків. Який найкращий спосіб зробити це? data = pd.read_csv('test.csv', sep='|', header=0, skiprows=10, …
76 python  csv  pandas 

5
Продуктивність Pandas DataFrame
Pandas - це дійсно чудово, але я справді здивований тим, наскільки неефективно отримувати значення з Pandas.DataFrame. У наступному прикладі іграшок навіть метод DataFrame.iloc більш ніж у 100 разів повільніший за словник. Питання: чи урок тут полягає лише у тому, що словники є кращим способом пошуку цінностей? Так, я розумію, що …

3
Дивна помилка в Pandas і Numpy щодо багатопотокових
Більшість функцій Numpy дозволять замовчувати багатопотоковість. наприклад, я працюю на 8-ядерній робочій станції Intel cpu, якщо запускаю сценарій import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) linux topпокаже 800% використання процесора під час роботи на зразок. Це означає, що numpy автоматично визначає, що моя робоча станція має 8 …
25 python  pandas  numpy 

7
Додайте новий стовпчик до фрейму даних на основі словника
У мене є фрейм даних та словник. Мені потрібно додати новий кадр до фрейму даних і обчислити його значення на основі словника. Машинне навчання, додавання нової функції на основі таблиці: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data = { 'gender' …

7
Перевірте, чи містить стовпчик панди всі елементи зі списку
У мене такий df: frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']}) І список предметів: letters = ['a','c'] Моя мета - отримати всі рядки, frameякі містять принаймні два елементиletters Я придумав таке рішення: for i in letters: subframe = frame[frame['a'].str.contains(i)] Це дає мені те, що я хочу, але це може бути …
20 python  pandas 

5
Коефіцієнт відхилення та повернення для кожної змінної?
У мене є кадр даних, який записує відповіді виборців мов програмування 19717 року через запитання з численним вибором. Перша колонка - це, звичайно, стать респондента, а решта - вибір. Отже, якщо я виберу Python, то моя відповідь буде записана в колонку Python, а не bash, і навпаки. ID Gender Python …


3
Як конвертувати фрейм даних панд в ієрархічний словник
У мене є такий фрейм даних панд: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) Я намагаюся створити ієрархічний словник із значеннями вбудованого словника як списки, який виглядає приблизно так: {200101: {1:[350, 400], 2:[200, 250]}, 200102: {1:[100, 300], 2:[450, 400]}} Як би я це зробив? Найближчі мені користуються цим кодом: df1.set_index('date').groupby(level='date').apply(lambda x: …
16 python  pandas 


5
Запобігання примусу кадрів даних панд під час індексації та вставки рядків
Я працюю з окремими рядками кадрів даних панди, але я стикаюся з питаннями примусу під час індексації та вставки рядків. Панди, схоже, завжди хочуть переходити від змішаного типу int / float до all-float, і я не бачу очевидних контролів щодо цієї поведінки. Наприклад, ось простий кадр даних з aяк intі …


3
Отримайте найближчу відстань за допомогою двох геодефрагментів у пандах
Ось мій перший геодедрам: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) Місто1 City …

4
Обчисліть відсоток аналогічних значень у фреймі даних панди
У мене є один фрейм даних dfз двома стовпцями: Сценарій (з текстом) і Speaker Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 У мене є такий список: L = ['a','b','c'] З наступним кодом: df = …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.