Я звик SAS
протягом 15 років, і почав R
серйозно використовувати останні 6 місяців, з деякими хитрощами в ньому на пару років попереду. З точки зору програмування, R
чи здійснюють маніпулювання даними безпосередньо, немає еквівалента DATA
або PROC SQL
процедур, оскільки вони не потрібні (останні є більш ефективними, SAS
коли існує багато маніпуляцій з даними, що виконуються із зовнішніх джерел даних, наприклад, адміністративних даних). Це означає, що тепер, коли я переймаюсь цим, обробка даних відбувається швидше R
і вимагає набагато менше коду.
Основне питання, з яким я стикався, - це пам’ять. Не всі R-пакети дозволяютьWEIGHT
специфікувати типи, тому якщо у вас є SAS
набори даних зі змінними, які використовуються у FREQ
або REPLICATE
операторах, у вас можуть виникнути проблеми. Я переглянув ff
і bigmemory
пакунки в R, але вони, здається, не сумісні з усіма R-пакетами, тому якщо у вас дуже великі набори даних, які потребують порівняно рідкісних аналізів та їх агрегування, у вас можуть виникнути проблеми із пам'яттю.
Для автоматизації, якщо у вас є, SAS macros
ви повинні мати можливість запрограмувати еквівалент R
і запустити як пакет.
Для кодування в R
я використовував Notepad++
і встановлював мовуR
, і тепер я відкриваю для себе радощі R Studio
. Обидва ці продукти безкоштовні, і вони позначають мову, як поліпшений SAS
синтаксис GUI (я тільки коли-небудь використовував екран синтаксису в SAS
).
Є веб-сайт та пов’язана з ним книга для людей, які переходять із місця SAS
на місцеR
. Я вважав їх корисними для спроб розробити, як перекласти деякі SAS
команди R
.
Оновлення: одна річ , яка відвезла мене горіхи , коли підходить до R
, що R
НЕ бере на себе весь цей набір даних ( data frame
в R
просторіччі), тому що це не статистичний пакет таким чином , що SAS
, SPSS
, Stata
, і т.д .. Так, наприклад, мені знадобився певний час, щоб if
я працював із заявами, тому що я постійно отримував допомогу для if
висловлювань з векторами (або, можливо, матрицями), тоді як мені потрібна if
заява, з якою працювали data frames
. Отже, сторінки довідки, ймовірно, повинні бути прочитані уважніше, ніж зазвичай, тому що вам потрібно буде перевірити, що команда, яку ви хочете зробити, буде працювати з типом об'єкта даних, який у вас є.
Біт, який все ще зводить мене з розуму при вивченні нової R
команди (наприклад, метод аналізу в пакеті, що додається), полягає в тому, що допомога для команд часто не є повністю самостійною. Я перейду на сторінку довідки, щоб спробувати вивчити команду, і замітки про використання, які часто ...
містяться в них. Іноді намагання розробити те, що може чи потрібно йти там, де ...
є, призвело мене до рекурсивного циклу. Відносна стислість довідкових записок, з SAS
яких наводяться докладні приклади синтаксису та відпрацьовані приклади з поясненням дослідження на прикладі, була досить великим шоком.