Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

15
Побудова панд DataFrame із значень змінних дає "ValueError: Якщо ви використовуєте всі скалярні значення, ви повинні передати індекс"
Це може бути простим питанням, але я не можу зрозуміти, як це зробити. Скажемо, що у мене є дві змінні наступним чином. a = 2 b = 3 Я хочу створити DataFrame з цього: df2 = pd.DataFrame({'A':a,'B':b}) Це створює помилку: ValueError: Якщо ви використовуєте всі скалярні значення, ви повинні пройти …

12
Як застосувати функцію до двох стовпців фрейму даних Pandas
Припустимо, у мене є df який має стовпці 'ID', 'col_1', 'col_2'. І я визначаю функцію: f = lambda x, y : my_function_expression. Тепер я хочу застосувати fдо dfдвох стовпців, 'col_1', 'col_2'щоб обчислити новий стовпець 'col_3', як-от так: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments …
368 python  pandas  dataframe 

6
Істинна цінність серії є неоднозначною. Використовуйте a.empty, a.bool (), a.item (), a.any () або a.all ()
Проблема з фільтруванням мого результату кадрів даних за orумови. Я хочу, щоб мій результат dfвитягнути всю колонкуvar витягнув значення що перевищують 0,25 і нижче -0,25. Ця логіка нижче дає мені неоднозначне значення істини, однак воно працює, коли я розділив цю фільтрацію на дві окремі операції. Що тут відбувається? не знаєте, …

10
Витяг конкретних стовпців з кадру даних
У мене є кадр даних R з 6 стовпцями, і я хочу створити новий кадр даних, у якого є лише три стовпці. Припускаючи , що мій кадр даних df, і я хочу , щоб витягти колони A, Bі Eце єдина команда , яку я можу зрозуміти: data.frame(df$A,df$B,df$E) Чи є більш …
365 r  dataframe  r-faq 

15
Як підсумовувати змінну за групою
У мене кадр даних з двома стовпцями. Перший стовпець містить такі категорії, як "Перший", "Другий", "Третій", а другий стовпець містить числа, які відображають кількість разів, коли я бачив конкретні групи з "Категорії". Наприклад: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 Я …
357 r  dataframe  aggregate  r-faq 


11
Як отримати значення з комірки фрейму даних?
Я створив умову, яка витягує рівно один рядок із мого кадру даних: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Тепер я хотів би взяти значення з певного стовпця: val = d2['col_name'] Але в результаті я отримую кадр даних, який містить один рядок і один стовпець ( тобто одну …
345 python  pandas  dataframe 

9
Перетворити список кадрів даних в один кадр даних
У мене є код, який в одному місці закінчується списком кадрів даних, які я дуже хочу перетворити на один великий кадр даних. Я отримав кілька покажчиків з попереднього питання, яке намагалося зробити щось подібне, але більш складне. Ось приклад того, з чого я починаю (це наочно спрощено для ілюстрації): listOfDataFrames …
336 list  r  dataframe 


14
панди: фільтрують рядки DataFrame з ланцюжком оператора
Більшість операцій в pandasможе бути виконана з допомогою оператора ланцюжка ( groupby, aggregate,apply , і т.д.), але єдиним способом я знайшов для фільтра рядків з допомогою звичайної індексації кронштейна df_filtered = df[df['column'] == value] Це непривабливо, оскільки вимагає призначити dfзмінну, перш ніж мати можливість фільтрувати її значення. Чи є щось …
329 python  pandas  dataframe 


23
Як створити тестові та тренувальні зразки з одного фрейму даних з пандами?
У мене досить великий набір даних у вигляді фрейму даних, і мені було цікаво, як мені вдасться розділити кадр даних на два випадкові вибірки (80% та 20%) для навчання та тестування. Дякую!

7
Параметри read_csv low_memory та dtype
При дзвінку df = pd.read_csv('somefile.csv') Я отримав: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Стовпці (4,5,7,16) мають змішані типи. Вкажіть параметр dtype при імпорті або встановіть low_memory = Неправильно. Чому цей dtypeваріант пов'язаний low_memoryі чому він Falseдопомагає вирішити цю проблему?

11
Як зберігати кадр даних за допомогою Pandas
Зараз я імпортую досить великий CSVяк кадр даних щоразу, коли запускаю сценарій. Чи є хороше рішення для постійного доступу до цього фрейму даних між прогонами, тому мені не доведеться витрачати весь цей час на очікування запуску сценарію?
317 python  pandas  dataframe 

8
Панда умовне створення стовпця / колонки даних
У мене є кадр даних у відповідності до наведених нижче текстів: Type Set 1 A Z 2 B Z 3 B X 4 C Y Я хочу додати ще один стовпець до фрейму даних (або генерувати серію) тієї ж довжини, що і кадр даних (= рівна кількість записів / рядків), …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.