Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.


6
Підрахунок унікальних значень у стовпці у фреймі даних pandas, як у Qlik?
Якщо у мене є така таблиця: df = pd.DataFrame({ 'hID': [101, 102, 103, 101, 102, 104, 105, 101], 'dID': [10, 11, 12, 10, 11, 10, 12, 10], 'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'], 'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C'] }) Я можу зробити count(distinct …

11
FutureWarning: не вдалося порівняти по елементах; повертається скаляр, але в майбутньому буде виконувати поелементне порівняння
Я використовую Pandas 0.19.1на Python 3. Я отримую попередження щодо цих рядків коду. Я намагаюся отримати список, який містить усі номери рядків, де рядок Peterприсутній у стовпці Unnamed: 5. df = pd.read_excel(xls_path) myRows = df[df['Unnamed: 5'] == 'Peter'].index.tolist() Він видає попередження: "\Python36\lib\site-packages\pandas\core\ops.py:792: FutureWarning: elementwise comparison failed; returning scalar, but in …

2
Змішувальний стовпець з пандами пітона
У мене є стовпець Data Frame з числовими значеннями: df['percentage'].head() 46.5 44.2 100.0 42.12 Я хочу бачити стовпець як кількість сміття: bins = [0, 1, 5, 10, 25, 50, 100] Як я можу отримати результат у вигляді сміттєвих ящиків з їхніми value counts? [0, 1] bin amount [1, 5] etc …

12
Як імпортувати дані з mongodb до панд?
У мене є велика кількість даних у колекції в mongodb, яку мені потрібно проаналізувати. Як імпортувати ці дані до панд? Я новачок у пандах та дурнях. РЕДАКТУВАТИ: колекція mongodb містить значення датчика, позначені датою та часом. Значення датчика мають тип даних з поплавком. Зразки даних: { "_cls" : "SensorReport", "_id" …

8
Перетворити для часового поясу панд DateTimeIndex на наївну мітку часу, але в певному часовому поясі
Ви можете використовувати функцію, tz_localizeщоб зробити часовий пояс або часовий пояс DateTimeIndex відомим, але як ви можете зробити навпаки: як ви можете перетворити часовий пояс, відомий часовому поясу, у наївний, зберігаючи свій часовий пояс? Приклад: In [82]: t = pd.date_range(start="2013-05-18 12:00:00", periods=10, freq='s', tz="Europe/Brussels") In [83]: t Out[83]: <class 'pandas.tseries.index.DatetimeIndex'> …
99 python  pandas 

10
GroupBy за допомогою pandas DataFrame і виберіть найбільш поширене значення
У мене є кадр даних із трьома рядковими стовпцями. Я знаю, що єдине значення в 3-му стовпці є дійсним для кожної комбінації перших двох. Для очищення даних мені доводиться групувати за фреймом даних за першими двома стовпцями та вибирати найбільш поширене значення третього стовпця для кожної комбінації. Мій код: import …

5
Замініть None на NaN у фреймі даних pandas
У мене є таблиця x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Я хочу замінити python None пандами NaN. Я намагався: x.replace(to_replace=None, value=np.nan) Але я отримав: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you passed a …

6
Перетворити фрейм даних панд на серії
Я дещо новачок у пандах. У мене є кадр даних pandas, який становить 1 рядок на 23 стовпці. Я хочу перетворити це на серію? Цікаво, який найбільш пітонічний спосіб це зробити? Я пробував, pd.Series(myResults)але це скаржиться ValueError: cannot copy sequence with size 23 to array axis with dimension 1. Це …

6
Пропустити рядки під час папок імпорту CSV
Я намагаюся імпортувати файл .csv за допомогою pandas.read_csv(), однак я не хочу імпортувати 2-й рядок файлу даних (рядок з індексом = 1 для 0-індексації). Я не бачу, як не імпортувати його, оскільки аргументи, що використовуються з командою, здаються неоднозначними: З веб-сайту панди: skiprows : подібний до списку або ціле число …
98 python  csv  pandas 



13
python-панди та бази даних на зразок mysql
Документація для Pandas містить численні приклади найкращих практик роботи з даними, що зберігаються в різних форматах. Однак я не в змозі знайти жодного хорошого прикладу для роботи з такими базами даних, як MySQL, наприклад. Чи може хто-небудь вказати мені на посилання або дати деякі фрагменти коду, як ефективно конвертувати результати …
97 python  pandas 

4
Таблиця частот для однієї змінної
Останнє запитання панди для початківців на день: Як створити таблицю для однієї серії? Наприклад: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } Багато гуглів привело мене до Series.describe () та pandas.crosstabs, але жоден з них не робить зовсім того, що …

6
Як встановити для клітинки NaN у фреймі даних pandas
Я хотів би замінити неправильні значення у стовпці фрейму даних на NaN. mydata = {'x' : [10, 50, 18, 32, 47, 20], 'y' : ['12', '11', 'N/A', '13', '15', 'N/A']} df = pd.DataFrame(mydata) df[df.y == 'N/A']['y'] = np.nan Хоча останній рядок виходить з ладу і видає попередження, оскільки він працює …
97 python  pandas  nan 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.