Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

10
Розщеплення словника / списку всередині стовпця Панди на окремі стовпці
У мене збережені дані в базі даних postgreSQL. Я запитую ці дані за допомогою Python2.7 і перетворюю їх у Pandas DataFrame. Однак останній стовпчик цього фрейму даних містить в собі словник (або список?) Значень. DataFrame виглядає так: [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", "c": "12"} 8810 …

3
Як перевести циклічний згрупований фрейм даних Pandas?
DataFrame: c_os_family_ss c_os_major_is l_customer_id_i 0 Windows 7 90418 1 Windows 7 90418 2 Windows 7 90418 Код: print df for name, group in df.groupby('l_customer_id_i').agg(lambda x: ','.join(x)): print name print group Я намагаюся просто перевести цикл на зведені дані, але я отримую помилку: ValueError: занадто багато значень для розпакування @EdChum, ось …
146 python  pandas 

5
Як розділити дані на 3 групи (поїзд, валідація та тест)?
У мене є фрейм даних панд, і я хочу поділити його на 3 окремих набори. Я знаю, що, використовуючи train_test_split від sklearn.cross_validation, можна розділити дані на два набори (поїзд та тест). Однак я не зміг знайти жодного рішення щодо розділення даних на три набори. Переважно, я хотів би мати індекси …

2
Виберіть рядки в пандах MultiIndex DataFrame
Які найпоширеніші способи вибору панд для вибору / фільтрування рядків фрейму даних, індекс якого є MultiIndex ? Нарізка на основі одного значення / мітки Нарізка на основі декількох міток з одного або декількох рівнів Фільтрування за булевими умовами та виразами Які методи застосовні за яких обставин Припущення про простоту: вхідний …

7
Кадр даних Pandas fillna () лише деякі колонки на місці
Я намагаюся заповнити жодне значення у фреймі даних Pandas 0 не лише для деякого підмножини стовпців. Коли я роблю: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, inplace=True) print df Вихід: a b c 0 1.0 4.0 NaN 1 2.0 5.0 NaN 2 3.0 NaN 7.0 3 NaN …
145 python  pandas  dataframe 

7
Читання файлу Excel в python за допомогою панд
Я намагаюся прочитати файл excel таким чином: newFile = pd.ExcelFile(PATH\FileName.xlsx) ParsedData = pd.io.parsers.ExcelFile.parse(newFile) яка видає помилку, яка говорить про два очікувані аргументи, я не знаю, що таке другий аргумент, а також те, що я намагаюся досягти тут, це перетворити файл Excel у DataFrame, чи я це роблю правильно? чи є …

7
Як знайти, які стовпці містять значення NaN у фреймі даних Pandas
Даний фрейм даних панди, що містить можливі значення NaN, розкидані тут і там: Питання: Як визначити, які стовпці містять значення NaN? Зокрема, чи можу я отримати список назв стовпців, що містять NaN?
144 python  pandas  dataframe  nan 

5
Змінення підмножини рядків у фреймі даних панди
Припустимо, у мене є панди DataFrame з двома стовпцями, A і B. Я хотів би змінити цю DataFrame (або створити копію), щоб B завжди був NaN, коли A дорівнює 0. Як я це досягну? Я спробував наступне df['A'==0]['B'] = np.nan і df['A'==0]['B'].values.fill(np.nan) без успіху.
143 python  pandas 

10
JSON для панд DataFrame
Що я намагаюся зробити, це витягнути дані висоти з API google Maps по шляху, визначеному координатами широти та довготи таким чином: from urllib2 import Request, urlopen import json path1 = '42.974049,-81.205203|42.974298,-81.195755' request=Request('http://maps.googleapis.com/maps/api/elevation/json?locations='+path1+'&sensor=false') response = urlopen(request) elevations = response.read() Це дає мені дані, які виглядають приблизно так: elevations.splitlines() ['{', ' "results" …


8
Перейменуйте індекс DataFrame Pandas
У мене файл CSV без заголовка, з індексом DateTime. Я хочу перейменувати ім’я індексу та стовпця, але з df.rename () перейменовано лише ім'я стовпця. Помилка? Я на версії 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]], index_col=[0] ) In [3]: df.head() Out[3]: 1 0 2002-06-18 0.112000 2002-06-22 0.190333 2002-06-26 0.134000 …
142 python  pandas  dataframe 

6
Панди: Пошук списку аркушів у файлі excel
Нова версія Pandas використовує наступний інтерфейс для завантаження файлів Excel: read_excel('path_to_file.xls', 'Sheet1', index_col=None, na_values=['NA']) але що робити, якщо я не знаю наявних аркушів? Наприклад, я працюю з файлами excel, які наведені нижче Дані 1, Дані 2 ..., Дані N, колонтитул, бар але я не знаю Nапріорі. Чи є якийсь спосіб …
142 python  excel  pandas  openpyxl  xlrd 

6
Шукайте "не містить" в DataFrame в пандах
Я здійснив пошук і не можу зрозуміти, як відфільтрувати кадр даних df["col"].str.contains(word), однак мені цікаво, чи є спосіб зробити зворотне: фільтрувати кадр даних за компліментом цього набору. наприклад: до ефекту !(df["col"].str.contains(word)). Чи можна це зробити DataFrameметодом?
142 python  pandas  contains 

11
Заміна значень стовпців у пандах DataFrame
Я намагаюся замінити значення в одному стовпчику фрейму даних. У стовпці ("жіночий") містяться лише значення "жіночий" та "чоловічий". Я спробував таке: w['female']['female']='1' w['female']['male']='0' Але отримайте точно таку ж копію попередніх результатів. Я б в ідеалі хотів отримати деякий вихід, який нагадує наступний елемент циклу. if w['female'] =='female': w['female'] = '1'; …
141 python  pandas 


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.