Які пакети R ви вважаєте найбільш корисними у своїй щоденній роботі?


28

Дублікат потоку: я щойно встановив останню версію R. Які пакунки потрібно отримати?

Які R- пакети ви не уявляли щоденної роботи з даними? Перерахуйте, як загальні, так і конкретні інструменти.

ОНОВЛЕННЯ: Щодо 24.10.10, ggplot2схоже, переможець набрав 7 голосів.

Інші згадані пакети є:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Дякую всім за відповіді!


1
Дуже суб'єктивне запитання: на це запитання не можна відповісти та не підходить для веб-сайту QA.
Egon Willighagen

3
Мабуть, має бути вікі спільноти; Тут є корисне питання, але не має остаточної відповіді.
Шейн

2
@Shane: хороший момент. переїхали. @ Егон: суб'єктивно. але якщо відповіді надходять від знаючих людей, я не проти дози суб'єктивності. Я почав вивчати R зовсім недавно і в мене встановлено пару десятків, щоб досліджувати, проте я помічаю, що є інструменти, які я використовую набагато частіше, незалежно від завдання, що знаходиться під рукою.
radek

Було б цікаво, якби StackExchange міг підтримувати якийсь метод зв’язування публікацій вікі спільноти на сайтах. Оскільки я ставлю на облік, це питання було задано на Stackoverflow, і я також думаю, що Статистичний аналіз може залучати людей, які зазвичай не відвідують ЗП.
Шарпі

@Sharpie: було кілька цікавих публікацій SO, таких як stackoverflow.com/questions/1295955/… або stackoverflow.com/questions/1535021/…, проте вони не зосереджені на пакунках. і я згоден, зв’язок вікі спільноти може бути дуже корисним.
radek

Відповіді:




8

Я використовую пакет xtable . Пакет xtable перетворює таблиці, вироблені R (зокрема, таблиці, що відображають результати anova), у таблиці LaTeX, які будуть включені до статті.



8

ggplot2 - знизити найкращу візуалізацію для Р.

RMySQL / RSQLite / RODBC - для підключення до баз даних

sqldf - маніпулює data.frames за допомогою SQL-запитів

Hmisc / rms - пакети від Frank Harrell, що містять зручні різні функції та приємні функції для регресійного аналізу.

GenABEL - приємний пакет для досліджень, пов'язаних з геномом

Rcmdr - гідний графічний інтерфейс для R, якщо він вам потрібен.

Також перегляньте CRANtastic - це посилання містить список найпопулярніших R-пакетів. Багато хто з перших у списку вже готові


8

data.table - мій улюблений зараз! Дуже сподіваємось на нову версію з більш реалізованим списком бажань.



6

Для мене особисто я використовую три наступні пакунки, усі вони доступні в дивовижному проекті Omega для статистичних обчислень (я не претендую на експерт, але для моїх цілей вони дуже прості у використанні):

  • RCurl : У ньому є безліч варіантів, що дозволяє отримати доступ до веб-сайтів, про те, що функції за замовчуванням у базі R матимуть труднощі з, я думаю, це справедливо сказати. Це R-інтерфейс до бібліотеки libcurl, який має додаткову користь для всієї спільноти за межами R, яка розвиває її. Також доступний на CRAN .

  • XML : Це дуже прощає розбір неправильно сформованого XML / HTML. Це R-інтерфейс до бібліотеки libxml2 і знову має додаткову перевагу для цілого спільноти поза R, розвиваючи його Також доступний у CRAN .

  • RJSONIO : Це дозволяє розібрати текст, повернений з виклику json, та організувати його в структуру списку для подальшого аналізу. Конкурентом цього пакету є rjson, але цей має перевагу бути векторизованим, легко розширюваним через S3 / S4, швидко і масштабується до великих даних.

6

Sweave дозволяє вставляти код R у документ LaTeX. Результати виконання коду та необов'язково вихідний код стають частиною підсумкового документа.

Отже, замість того, щоб, наприклад, вставити зображення, вироблене R, у файл LaTeX, ви можете вставити код R у файл і зберегти все в одному місці.


4
Лише підказка для всіх, хто хоче розпочати дослідження відтворюваної роботи з Р. Я радив би вам ознайомитися з новизною упаковкою knitrзамість Sweave. Це в основному Sweave на стероїди. Навчитися так само просто, якщо не простіше, і набагато гнучкіше.
Крістоф_J


4

Мені здається решітка разом із супутниковою книгою "Решітка: багатовимірна візуалізація даних за допомогою R" від Deepayan Sarkar неоціненною.


4

Якщо ви займаєтесь будь-яким методом прогнозування, карета - знахідка. Особливо в поєднанні з багатоядерним пакетом можливі деякі досить дивовижні речі.


4

Щоденний найкорисніший пакет повинен бути "іноземним", який має функції для читання та запису даних для інших статистичних пакетів, наприклад, Stata, SPSS, Minitab, SAS тощо. Робота в полі, де R не є таким звичним, означає, що це є дуже важливим пакетом.


3

я використовую

car, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, переформатувати, RODBC, TeachingDemos, XML.

багато.


3

Я не міг би жити без:

  • решітка для графіки
  • xlsx або XLConnect для читання файлів Excel
  • rtf для створення звітів у форматі rtf (я вважаю за краще Sword або R2wd, але не можу встановити statconn на роботі; я обов'язково спробую odfWeave незабаром.)
  • nlme та lme4 для змішаних моделей
  • ff для роботи з великими масивами

2

RODBC для доступу до даних із баз даних, sqldf для виконання простих SQL-запитів у фреймах даних (хоча я змушую себе використовувати рідні команди R), а також ggplot2 та plyr



2

Ми в основному використовуємо:

  • ggplot - для діаграм
  • статистика
  • e1071 - для SVM

Ви також можете перевірити kernlab та піклуватися про SVM. Вони цікаві (не обов'язково кращі) альтернативи.
Зак


2

Для мене я використовую kernlab для лабораторії машинного навчання на основі ядра та e1071 для SVM та ggplot2 для графіки


2

Я досить часто використовую ggplot2, vegan та reshape.



2

Тут не згадується RColorBrewer , я часто використовую його для побудови графіків, якщо мені потрібні кольорові схеми


2

Я великий шанувальник RCPP, коли мені потрібен швидкий цикл або для виконання не дуже сумісних з лікуванням процедур. Він дуже добре реалізований в системі R eco, може приймати матрицю / розріджену матрицю без перетворення в якості аргументів у функції.

Синтаксис C ++ простий, коли ти робиш прості речі (що часто буває в моєму випадку).

Дійсно, вам не потрібно бути виробником упаковки, щоб мати потребу в цій чудовій мовці.

Я сказав, що C ++ дуже швидкий?


2

DoParallel і Foreach пакети зробили моє життя набагато простіше, дозволяючи мені распараллелить мій код і запустити його на обчислювальному оптимізованої наприклад , на Amazon EC2 ! Я їх дуже часто використовую. Але це було б неможливо без RStudio AMI, випущених Луї Аслеттом. Нарешті, я мушу згадати струнний пакет, який справді робить роботу зі струнами прогулянкою по парку. Використовуйте його в кожному додатку для видобутку тексту. А також я дуже часто використовую плетисту для створення високоякісних звітів про свою роботу. Велике спасибі за цей дивовижний пакет Yihui Xie!


1

Я частіше використовую ggplot2, переформатувати, решітку, в'язальну машину.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.