Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

13
Як опустити рядки Pandas DataFrame, значення яких у певному стовпці - NaN
Я маю це DataFrameі хочу лише записи, EPSстовпець яких не NaN: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN ... тобто …
751 python  pandas  dataframe  nan 


7
Написання файлів пандес DataFrame у файл CSV
У мене є фрейм даних у пандах, які я хотів би записати у файл CSV. Я роблю це, використовуючи: df.to_csv('out.csv') І отримання помилки: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Чи є спосіб обійти це легко (тобто в моєму кадрі даних є символи …
714 python  csv  pandas  dataframe 

8
Перетворити список словників у пандус DataFrame
У мене є список таких словників: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] І я хочу перетворити це на DataFrameтакі панди : month points points_h1 time year 0 NaN 50 NaN 5:00 2010 1 february 25 NaN …

10
Досить роздрукувати всю серію Pandas / DataFrame
Я багато працюю з Series та DataFrames на терміналі. За замовчуванням __repr__для Series повертається зменшений зразок із деякими значеннями голови та хвоста, але решта відсутня. Чи є вбудований спосіб красивого друку всієї серії / DataFrame? В ідеалі він підтримував би правильне вирівнювання, можливо, межі між стовпцями, а можливо, навіть кольорове …
650 python  pandas  dataframe 

3
Чим iloc, ix та loc відрізняються?
Чи може хтось пояснити, чим відрізняються ці три методи нарізки? Я бачив документи і бачив ці відповіді , але все ще не можу пояснити, чим три різні. Мені вони здаються значною мірою взаємозамінними, оскільки вони знаходяться на нижчих рівнях нарізки. Наприклад, скажімо, що ми хочемо отримати перші п'ять рядків DataFrame. …

15
Як боротися з SettingWithCopyWarning у Pandas?
Фон Я щойно оновив мої Панди з 0,11 до 0,13,0rc1. Тепер додаток вискакує багато нових попереджень. Один з них, як це: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE Я хочу …

14
Рівень коефіцієнта падіння в заданому кадрі даних
У мене є кадр даних, що містить factor. Коли я створюю підмножину цього фрейму даних за допомогою subsetіншої функції індексації, створюється новий кадр даних. Однак factorзмінна зберігає всі свої початкові рівні, навіть коли / якщо вони не існують у новому фреймі даних. Це спричиняє проблеми під час гранічного графіку або …
543 r  dataframe  r-factor  r-faq 

12
Різниця між дужкою [] і подвійною дужкою [[]] для доступу до елементів списку або фрейму даних
R надає два різні методи доступу до елементів списку або фрейму даних: []і [[]]. Яка різниця між двома, в яких ситуаціях я повинен використовувати одну над іншою?
521 r  list  dataframe  extract  r-faq 

20
Перетворити список у кадр даних
У мене вкладений список даних. Її довжина - 132, і кожен елемент - це список довжиною 20. Чи існує швидкий спосіб перетворити цю структуру в кадр даних, який має 132 рядки та 20 стовпців даних? Ось кілька зразкових даних, з якими можна працювати: l <- replicate( 132, list(sample(letters, 20)), simplify …
513 r  list  dataframe 

11
Швидке читання дуже великих таблиць як кадрів даних
У мене дуже великі таблиці (30 мільйонів рядків), які я хотів би завантажувати, як фрейми даних у Р. read.table()мають багато зручних функцій, але, схоже, є багато логіки в реалізації, яка б уповільнила справи. У моєму випадку, я припускаю, що я знаю типи стовпців достроково, таблиця не містить заголовків стовпців або …
503 r  import  dataframe  r-faq 

9
Перетворення результатів групи Pandas GroupBy із Series у DataFrame
Я починаю з таких вхідних даних df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) Що при друкуванні відображається так: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 …


21
Як перевірити, чи є якесь значення NaN у програмі DataFrame Pandas
У Python Pandas, який найкращий спосіб перевірити, чи має DataFrame одне (або більше) значень NaN? Я знаю про функцію pd.isnan, але це повертає DataFrame булевих символів для кожного елемента. Цей пост прямо тут теж точно не відповідає на моє запитання.
483 python  pandas  dataframe  nan 

16
Створіть порожній фрейм data.frame
Я намагаюся ініціалізувати data.frame без будь-яких рядків. В основному я хочу вказати типи даних для кожного стовпця та назвати їх, але не мати в результаті жодних рядків. Найкраще, що мені вдалося зробити, це щось на кшталт: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] Це створює data.frame з …
480 r  dataframe  r-faq 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.