R проти SAS, чому SAS віддається перевазі приватних компаній?


143

Я дізнався R, але, схоже, компанії набагато більше цікавляться досвідом SAS. Які переваги SAS над R?


17
Це трагічно, але правда, я боюся ...
gung

19
Медичний статистик одного разу сказав мені, що вони використовують SAS, оскільки якщо вони помиляються через помилки програмного забезпечення і справа до судових позовів, SAS відшкодує їх. R поставляється без гарантії.
Момо

42
@ Momo R поставляється без гарантії, правда, але я хотів би побачити посилання на те, що SAS є такою сильною. Я не зміг знайти текст ліцензії SAS на їхньому веб-сайті, але мені вдалося знайти щось для одного компонента: support.sas.com/documentation/onlinedoc/sasc/doc650/common/… Це 90-денна гарантія на засоби масової інформації, що програмне забезпечення поставляється разом з усіма обмеженнями будь-яких інших гарантій. Будь ласка, дайте посилання, окрім "хтось мені колись сказав".
Брайан Діггс

13
Мав на увазі як анекдот, мені подобається прагматичний цинізм коментаря. Але рада, що ви перевірили, я ніколи не хвилювався.
Момо

36
SAS поставляється з тією ж гарантією, що і R: жодна.
Френк Харрелл

Відповіді:


139

Я думаю, що існує декілька питань (у порядку зростання можливої ​​дії):

  1. Традиція / звичка : люди звикли до SAS і не хочуть вчитися чомусь новому. (Це ускладнює те, як ви думаєте в SAS та R відрізняється.) Це може стосуватися всіх, кому, можливо, доведеться надсилати вам код або читати / використовувати ваш код, включаючи менеджерів та колег.
  2. Недовіра до безкоштовної програми : У мене кілька людей сказали, що вони не бажають приймати результати від R, оскільки у вас немає комерційної компанії, яка перевіряє код, щоб переконатися, що він дає правильні результати, перш ніж він вийде до клієнтів, щоб вони врешті-решт втратити бізнес.
  3. Великі дані : R виконує операції з усім, що запам'ятовується, тоді як SAS не обов'язково. Таким чином, якщо ваші дані наблизяться до меж вашої пам’яті, виникнуть проблеми.

Особисто я вважаю, що №3 має будь-які законні заслуги, хоча існують підходи до великих даних, розроблені разом з Р. Питання №1 говорять самі за себе. Я думаю, що №2 ігнорує кілька фактів: є деяка перевірка, яка триває з R, багато основних пакетів написані одними з найбільших імен у статистиці, і були проведені дослідження, які порівнюють точність різних статистичних програм & R безумовно, був конкурентоспроможним.


41
Точка 1 отримує більшу легітимність, якщо ви також включите "існуючу інфраструктуру" під цей інерційний банер. Якщо є існуючі бізнес-процеси, які вже використовують SAS, то існує перехідна вартість із зміною. Якщо це так, це не вибір між SAS та R, а вибір між перебуванням у SAS та переходом на R, що може мати інший висновок.
Брайан Діггс

25
Суть пункту 2 полягає в тому, що в той час як деякі пакети ROME написані експертами, інші - ні. Хто поручає їх? Хто їх тестує? (Я знаю, що вони перевірені, що вони запускаються, але хто перевіряє, що вони працюють правильно?) Я знаю, ви можете подивитися на код, але це передбачає час і можливість переглянути чужий код і перевірити його, часто для методів, які дуже складні.
Пітер Флом

18
@PeterFlom, ви піднімаєте розумну точку. Оскільки пакети стають більш езотеричними, гарантія менша, ніж є основні речі. Але як далеко ви повинні пройти? Навіть SEM, який є досить просунутим, був написаний в R Джоном Фоксом. Крім того, StasK робить хороший висновок про реальність перевірки статистичного програмного забезпечення на практиці. Нарешті, R набагато вичерпніший за будь-що інше, тому, коли ви хочете робити езотеричні речі з іншим програмним забезпеченням, то здебільшого доводиться кодувати його самостійно. Хто гарантує точність цього коду?
gung

33
Хто саме ветеринує SAS, Stata, SPSS, код? Чи є взагалі якийсь спосіб дізнатися, чи результати, які вони надають, методами, які вони говорять, реально реалізовані? Я знаю, як слід, наприклад, зі lme4списку розсилки, який порівнюється з SAS, з'являється досить регулярно. Але неможливо дізнатися, чи варто взагалі проводити такі порівняння. Не маючи доступу до джерела, ми маємо сприймати ті компанії, що їх результати, дійсно, є результатом їх програмного забезпечення. Чесно кажучи, я вважаю за краще мати можливість переглядати програмний код, який я використовую.
Джейсон Морган

28
Щоправда, але важко покарати статистичну обчислювальну систему за її всебічність. Або, якщо сказати іншим способом, спосіб R зробити щось краще, ніж інший спосіб не робити цього.
Френк Харрелл

105

Окрім хороших відповідей на даний момент, я додав би фактор збентеження. Якщо ви минулого року витрачаєте сотні тисяч доларів на підтримку SAS і SAS, і ви не пропонуєте витрачати нічого на R, при надзвичайно низьких цінах підтримки (Революція тощо), хтось із ланцюга збирається запитати, чому. Чи було помилкою витрачати стільки грошей минулого року, коли R існував минулого року? Або це помилка кинути професійне програмне забезпечення для чогось, створеного групою добровольців?

Після того, як проблема буде вирішена таким чином, це пропозиція про програш, тому, можливо, краще не вирішувати її.


47
Це, мабуть, найбільш цинічна відповідь на схрещені схрещення. +1
ймовірністьлогічний

11
@probabilityislogic: Дякую! Щоб було зрозуміло, це скоріше коментар щодо поганого управління вищим рівнем, ніж людей, які використовують програмне забезпечення. Я працював у місцях, де насправді було ставлення (на більш високих рівнях): "Хммм ... ти не витратив усіх грошей, які ми запланували для тебе в цьому році. Очевидно, ти можеш отримати менше грошей, тому ми "скорочуємо бюджет на наступний рік і надаємо додаткові кошти департаменту, який перевитратив". Правила Ділберта.
Уейн

11
"Ви не витратили гроші ..." - саме так працювала радянська система планування, з моїх знань з перших вуст.
Стаск

5
Хтось із ланцюга повинен пояснити, що за частку вартості ліцензії SAS можна встановити R Studio Server на віртуальній машині AWS з 16 ядрами та 256 ГБ оперативної пам’яті - в руках 2 хороших програмістів R, це більше потужніший за все, що може зробити SAS. Подумайте, як швидко мільярдні записи можуть нечітко відповідати один одному! Або з цього питання навіть Open Source PostgreSQL з Python + PERL досягне за частку витрат.
бродяга

1
"Або це помилка кинути професійне програмне забезпечення для чогось створеного групою добровольців?" Це помилкова дихотомія!
kjetil b halvorsen

54

Крім того , що Гун правильно ідентифікував тут, найбільша проблема у корпоративному світі - це спадщина. І коли у вас є якісний виробничий код, який, як відомо, виконує роботу, ви не змінюєте його. SAS існував там з 1970-х, і на той час це був єдиний, на той час стандартів, сценарій статистичної мови. Обсяг виробничого коду, накопичений з тих пір у SAS у фармації та уряді, немислимий, десятки тисяч людських років. Переписування цього в R або Stata зайняло б кілька років, отриманий код стане більш гнучким, більш ефективним, прозорим, легшим та дешевшим у обслуговуванні, але ніхто не заплатить за таке рефакторинг. (Мій досвід роботи з цим полягає в тому, що мій код Stata, як правило, приблизно втричі коротший; я одного разу мав проект, який перетворював SPSS-код в Stata, де я зробив його приблизно в 20 разів коротше.

У певному сенсі це аналогічна історія з академічними видавцями: вони їдуть в бік кінцевих користувачів, зберігаючи свої підписки поза необхідністю; університет без передплати Nature - це насправді не університет. Безкоштовне публікування через професійні товариства здешевить, люди готують свої подання в LaTeX в наші дні, тому вони готові до фотоапаратів, і ті ж люди надаватимуть експертну оцінку, тому не буде жодних погіршень якості в жодному з вимірів. Але ... не існує торгової марки та фактору впливу, що стоїть за Інтернет-журналами.

Це підсумовує все: http://scatter.wordpress.com/2011/06/28/stata-12/ . Stata віддається перевазі в колах, пов'язаних з економікою та політикою, і чим більше я вивчаю SAS, тим більше мені подобається Stata.


38
SAS має приголомшливий синтаксис, який почався з чогось схожого на JCL (IBM Job Control Language) для подання пакетних завдань з перфокарткою. Примітно, що люди все ще користуються ним.
Уейн

6
+1 Мені особливо сподобалось BlackBerry: iOS: Android: Nokia як SAS: Stata: R: аналогія SPSS у публікації розсилки.
jthetzel

6
Уейн, якщо ти коли-небудь замислювався над твердженням CARDS, ти розумієш, що SAS - це програмний пакет статистичних даних для роботи з перфокартами. Stata працює з прямокутними наборами даних. R працює з предметами. Отже, залежно від того, з яким типом даних вам доведеться мати справу, один може бути кращим, ніж інші.
Стаск

3
Одним із важливих моментів спадщини є такі речі, як затвердження FDA або подібні правила. Промисловість, про яку я говорив, не торкнеться нічого (TM) після того, як вони пережили це, щоб бути впевненим, що їм не доведеться повторювати весь процес. І це великий аргумент щодо грошей.
cbeleites

48

Я працював так само ефективно програмістом SAS протягом останніх семи років, поруч зі мною співробітник програмував SAS довше, ніж я був живий. Як зазначалося тут, за SAS існує велика кількість інерції / спадщини; але SAS так само, як R - це шлях до засобу, а не до самого засобу.

SAS надзвичайно ефективний при послідовному доступі до даних, а доступ до бази даних через SQL надзвичайно добре інтегрований. PROC дуже добре задокументовані, але, на жаль, не повністю стандартизовані з позначеннями (PROC OPTMODEL та IML - два приклади). Це трохи незграбно, коли мова йде про написання складного коду, і не такий елегантний для паралельного коду. Я також виявив, що імпорт файлів CSV часом є великим нещастям, і вважаю за краще просто скинути його на R спочатку до бази даних.

Хоча в SAS є інтерфейси для спільних об'єктів і dll, ви не отримуєте приємного доступу до файлів заголовка або чогось подібного, а розподіл коду також недоступний через щасливі пакети.

Однак, мало кого турбує хтось, включаючи в свій код якийсь езотеричний пакунок, який зараз не працює або зламаний, і який код у SAS, як правило, є відмінним (основний код R також відмінний, а також вільно доступний для всіх).

Як згадувалося раніше, SAS також є надзвичайно дорогим, але це хороший інструмент, до якого я звертаюсь, коли знаю, що існує консервована процедура, яка добре працює для моїх потреб.

R + SAS + mysql з невеликою кількістю perl для склеювання їх разом працює надзвичайно :)


11
Зауваження про підтримку старих пакетів також підходить для написаного користувачем макросу або старої програми, яку sas не оновлював.
ймовірністьлогічний

4
R також має дуже гарну підтримку SQL, отриману останнім часом за допомогою dplyrбібліотеки - вона буквально переводить синтаксис R / dplyr в SQL і викликає базу даних, ви можете вирішити, які операції робити на db-сервері та які локально, використовуючи той самий синтаксис: cran.r-project. org / web / пакети / dplyr / vignettes / databases.html
Тім

41

Тому я використовую і R, і SAS - правда, в наукових колах, - але є кілька причин, по яких я схильний рухатися до SAS часом:

  1. Краща документація. R стає в цьому кращим, але документація, особливо офіційна документація, часто є жахливою і непрозорою. Крім того, SAS підтримується великою інфраструктурою книг - використання R! серія допомагає цьому в R, але це ще не зовсім є. Я можу звернутися до аналізу виживання Пола Елісона за допомогою SAS або категоричного аналізу даних за допомогою SAS або книги, яку я маю про методи Монте-Карло за допомогою SAS, і у мене книга, чітко написана в досить послідовному стилі для мови, якою я користуюся.
  2. Інертність. Це не просто "компанії ліниві" - інерція теж має значення. Існують інституційні знання. Так і так є код, який це робить - і робить це добре.
  3. Пакети. Деякі пакети в R дивовижні. Деякі пакети - ні. Ви повинні піти їх, оцінити їх, і навіть тоді виникають певні проблеми, пов'язані зі стрибком віри в тому, що пакунок такий же хороший, як і хлопець, який його пише. Важко в це повірити. По суті, SAS має "повну віру та заслугу Інституту SAS", яка має досить солідний досвід.
  4. Підтримка з одного джерела. Якщо SAS порушений, ви телефонуєте SAS. Якщо R порушено, ви дзвоните ....?

21
"Якщо R порушено, ви дзвоните ....?" Брайан Ріплі :-) (+1 за цю добре аргументовану відповідь)
chl

6
Щодо 4), я вважаю, що поняття є заплутаними. Якщо ви користуєтесь програмою, і вона перервана, у вас зазвичай два варіанти. Ви можете заплатити за підтримку, або можете знайти вільно доступну підтримку (інтернет-спільнота, література, самі). R і SAS можна порівняти як статистичні мови програмування. Обидва мають вільну доступну підтримку, яку також можна порівняти. R і SAS не можна порівнювати з платними рішеннями підтримки ...
jthetzel

7
... Інститут SAS надає платну підтримку SAS. Такі компанії, як Revolution Analytics і TIBCO (S +), надають платну підтримку R. Якщо ви хочете порівняти рішення платної підтримки для R і SAS, вам слід порівняти Інститут SAS з Revolution Analytics і TIBCO, а не з Р. Плутанина, я вважаю, виникає внаслідок тісна інтеграція мови SAS з Інститутом SAS та неінтеграція мови R із корпоративною підтримкою та освітою.
jthetzel

3
@jthetzel Я не думаю, що це "плутанина". Мова SAS тісно поєднана зі службою SAS. Будь-яка платформа, на якій працює SAS, має підтримку від SAS. Це не вірно для R - підтримка, і мова відокремлена, можливо, вам не допоможе залежно від платформи (спробуйте поговорити з Revolution колись, не використовуючи Windows або RHEL ...), і вони не обов'язково візьмуть на себе відповідальність за Помилки RandomPackage, де як SAS підтримуватиме PROC Arbitrar.
Фоміт

2
@probabilityislogic Я вважаю, що це не обов'язково оцінювати його, щоб перевірити, чи підходить він для вашого аналізу. Так, і те, і інше може бути неправильним, і обидва потрібно оцінити. Але я довіряю команді контролю якості SAS більше, ніж я довіряю мені самостійно.
Фоміт

39

Ніхто не припустив, що причиною, яку він вважає за краще, є ідіотизм. Ось дві цитати, які я нещодавно натрапив:

"Про використання програмного забезпечення з відкритим кодом, такого як R, не було сумніву - ми не могли гарантувати ідеально повторюваний результат"

і

"Ми не зможемо надати будь-яку підтримку для цього, оскільки це програмне забезпечення з відкритим кодом"

Дві хвилини з цими людьми показали б їм, як вони помиляються.


3
Дві хвилини з якими людьми? Без посилань це майже так, як ніби ви тільки що склали ці цитати.
Девід Геффернан

4
друга цитата здається відмінною від інформаційного відділу ради, від них не можна очікувати, що вони підтримуватимуть все можливе програмне забезпечення з відкритим кодом, яке може використовувати клієнт, отже, попередження про ковдру. Я думаю, що найгірша цитата з відкритим кодом, яку я чув, була від SAS, яка сказала так, що "ви б довіряли джембо-реактивним пристроям, розробленим у відкритому коді, двигун може випасти"
Павло Хурлюк

5
@PaulHurleyuk: +1 Цитата була "У нас є клієнти, які будують двигуни для літаків. Я щасливий , що вони не використовують безкоштовне програмне забезпечення, коли я на літаку «. Директором по маркетингу SAS в цій статті New York Times на R . Представниця SAS уточнила свої зауваження в подальшому дописі в блозі .
jthetzel

4
@PaulHurleyuk: Так само не можна очікувати, що рада підтримуватиме будь-яке фірмове програмне забезпечення, яке клієнт може захотіти використовувати. Відкритість не є причиною. Якби вони сказали, що не можуть підтримувати нічого, крім підтримуваного набору програмного забезпечення, тоді добре.
Spacedman

5
У двох випадках, які я цитую, цілком може бути раціональне рішення, але наведені причини, очевидно, не є тими причинами. Раціональною причиною може бути "ми вже підтримуємо SAS, і ми не можемо дозволити собі підтримку двох пакетів статистики". Але "Ми не можемо підтримати це, оскільки це відкритий код" - це не послідовник. Дві частини можуть бути правдивими, але висновку не випливає. Це як би сказати "Єлизавета - Королева, тому що небо синє".
Спайдермен

23

Одне питання, схоже, не було чітко вирішене: жопа. Якщо ви перейдете з SAS, і все вибухне, людина, яка приймає рішення, завжди може сказати, що він придбав сучасне програмне забезпечення, і як йому знати, що воно порушиться? Якщо він вирішив піти з R, цей аргумент буде важче зробити. Так, це пов’язано з уже згадуваним тут аргументом інерції.

Кілька десятиліть тому вони говорили, що "нобій ніколи не звільнявся за покупку IBM" , яку називали найбільшою маркетинговою фразою коли-небудь.


2
Хоча я не впевнений, наскільки R є менш сучасним, ніж SAS (і що стосується багатьох процедур, я маю враження, що R є більш сучасним, ніж SAS). Я здогадуюсь, що багато користувачів SAS про це не знають ...
Патрік Куломбе

21

Як користувач SAS і R, я б сказав, що найбільшою причиною використання SAS над R (коли ми це робимо) є його здатність до послідовної обробки. Нам потрібні лише машини, що мають не більше 4 ГБ оперативної пам’яті, щоб обробити дані, варті 15 років. Мені знадобиться набагато більша машина, що використовує запас R, і я не намагався перенести код SAS для запуску з Revolution R.


8
+1, хоча варто відзначити, що існує декілька способів роботи з наборами даних, що перевищують пам'ять, в R ( bigmemory , ff , фрагменти даних із бази даних, широкий спектр розподілених варіантів обчислень). Але все це потребує налаштування; SAS дійсно просто пересмішиться через все, що ви кинете на нього, що є реальною перевагою.
Метт Паркер

21

Часи, коли вони змінюються

Станом на 2015 рік, актуарії віком близько 35 років вважають за краще використовувати R - у текстових книгах використовується як R, так і код SAS. Старі актуарії ніколи не навчилися використовувати R і віддають перевагу SAS та не використовують R. Частка актуарів, котрі фактично кодуються в SAS, зменшиться.

Якщо ви шукаєте науковця Google для праць, що посилаються на SAS, - ви знайдете постійні публікації з 550-ти на рік за останні кілька років. Якщо шукати документи, використовуючи R ("Фонд R для статистичних обчислень"), у 2014 році їх було 25100, а станом на середину липня 2015 року - 16 700. Складання курсу - зростає дуже швидко!

SAS протягом декількох років не допомагав собі, вимагаючи від університетів великих ліцензійних платежів - які вони з тих пір скасували - але зараз уже пізно багато університетів перейшли на викладання за допомогою R, а не SAS.

Нові статистичні методи публікуються в документах спільно з пакетом R. Деякі методики, які вже багато років знаходяться в базі R, досі не з'являються в SAS. Тепер ви можете використовувати R зсередини SAS.

Підсумовуючи, речі змінюються і швидко змінюються.


19

У фармацевтичній галузі використовується SAS, оскільки це те, що використовується та подобається FDA. Однак є деякі серйозні причини. Результати простежуються, а вихід має часову позначку. Статистики FDA можуть перевірити, що ви отримаєте. Це дуже добре для управління базами даних і це надійне програмне забезпечення. Звичайно, багато атрибутів SAS можна стверджувати, що вони присутні в інших програмних пакетах, включаючи R і SAS, є дорогими. І все-таки я думаю, що бажаючим бути прикладним статистиком, який працює в галузі, найкраще буде хоча б навчитися програмуванню в SAS. Використовуйте R або STATA, якщо ви хочете, але знаєте SAS. Коли ви працюєте в компанії, яка хоче, щоб ви використовували SAS, вони оплатять ліцензування.


4
Ось додаткова інформація про роздуми FDA щодо R: blog.revolutionanalytics.com/2012/06/fda-r-ok.html
Метт Паркер

4
Фонд R опублікував документ у 2008 році, в якому обговорював використання R у регламентованих клінічних випробуваннях . Це має бути хорошим посиланням для співробітників, які скептично ставляться до використання R.
jthetzel

2
Я погоджуюсь, що є можливість більше використовувати R у клінічних дослідженнях, і багато хто вважає, що R може бути зроблений так само простежено, як і SAS.
Майкл Черник

6
FDA досить голосно налаштовані на НЕ підтримку та не потребують використання жодного програмного забезпечення. Історично вірно, що більшість представників використовували SAS, тому FDA має багато знань про SAS, але вони дуже швидко охопили інші системи, використовуючи R для доволі багато останніх робіт, особливо навколо мета-аналізу.
ПавлоГюрлюк

1
@PaulHurleyuk Те, що FDA скаже публічно і як вони діють на практиці, не обов'язково однакове. Більшість фармацевтичних компаній в першу чергу стосуються клінічних випробувань фази II та III, і вони, як правило, очікують, що їм доведеться і надалі потрібно використовувати SAS для аналізу цих випробувань.
Майкл Черник

18

Я думаю, що ця цитата Енн Х. Міллі підсумовує те, як багато людей ставляться до R:

У нас є клієнти, які будують двигуни для літаків. Я щасливий, що вони не користуються безкоштовною програмою, коли сідаю на літак.

На жаль, я думаю, що це неправильне уявлення (вільне == неповноцінне) є поширеним у широкій публіці.


16

(трохи поза темою): перегляд цього іншого етапу: деякі переваги, які має R в наукових колах, не стосуються промисловості.

Наприклад, в академічних школах - це явна перевага, якщо ви можете сказати студентам піти і отримати програмне забезпечення та працювати вдома. У промисловості, як правило, не слід брати з собою жодних даних ...

Ви також не повинні випробовувати кілька речей (TM), завантажувати багато пакетів (навіть якщо це надійні та перевірені), використовувати новітні методи. Замість цього, як правило, очікується, що ви будете дотримуватися методів та коду, які використовуються роками і де поведінка відома віками. Ви б з цим не завоювали багато академічних заслуг.

І звичайно, як уже згадувалося: ніхто не збирається ризикувати повторним затвердженням усіх видів регуляторного затвердження заради переходу на R. З того, що я бачив, це менше про R та більше про величезні витрати + робота з отримання регуляторного затвердження .


3
Нічого, що потрібно зробити, щоб повторно затвердити нормативні акти для переходу на Р.
Френк Харрелл

2
@Frank: можливо ми думаємо за різними сценаріями: я думаю, ти, можливо, думаєш про нове випробування (і там ти маєш рацію) - я більше думаю з точки зору аналітики процесів (хімічний + статистичний аналіз) поточного виробництво. AFAIK, ви не можете просто переключити свій аналіз даних там (але тоді це не країна SAS). Але я можу помилятися.
cbeleites

2
Я не знайомий із цим світом, але підозрюю, що вчені мають більше свободи, ніж думають.
Френк Харрелл

13

Незважаючи на те, що це досить песимістично, моєю відповіддю буде те, що люди, які приймають широкі рішення в корпораціях на кшталт «ми просто використовуємо SAS», - це також такі люди, які не довіряють тому, чого вони не розуміють, і автоматично вважають цінністю чогось прямо пропорційний кількості грошей, яку ви витрачаєте на це. Це призводить до того, що вони вважають за краще платити за SAS, а не витрачати час на дослідження альтернатив.


12

Чому велика лікарська компанія навіть хоче перейти на R із SAS? SAS коштує мільйони, але це наркотична компанія нічого. Однак перетворення всіх стабільних систем звітності з SAS в R обійдеться в 50-100 разів дорожче.

SAS має феноменальну систему підтримки: щоразу, коли мені потрібна допомога, вони змогли її надати протягом декількох годин.

І що саме R має, що SAS не має: 1) краща графіка ... нормально, це велика, але графіка - це не все. окрім R, завжди можна використовувати додатковий інструмент для створення крутих графіків, і SAS не надто погано, якщо мова йде про графіку 2) сучасна та більш ефективна мова програмування. Багато користувачів SAS не є програмістами і не переймаються використанням класної мови. Вони просто хочуть мати можливість аналізувати дані.

Я люблю R, але великій компанії було б божевільно перетворити на SAS. Хоча це може мати сенс і для менших фірм


3
Погоджуюся з тобою, @Max. Нарешті відповідь, що надходить від когось із галузі. Перейти на Р.
Ден

3
Це помилково. Вартість підтримки програмування для SAS набагато вище, ніж для Р. Компанії наймають сховища програмістів SAS, щоб компенсувати архаїчну мову, яку використовує SAS.
Френк Харрелл

Я в промисловості і використовую і те, і інше. R може виконувати маніпуляції з даними та, що ще важливіше, аналізувати набагато менше ліній, а значить, може бути розроблений набагато швидше. Я скажу, що деякі лікарські компанії ретельно розробили системи SAS для регуляторного програмування, які були успішними. Точка враховує: чому змінюватись (у цей момент)? Якби вони робили це з нуля, можливо, замість цього R.
AdamO

11

Є кілька головних переваг, не в конкретному порядку

  • SAS має велику встановлену базу та тривалий досвід

Я цілеспрямовано уникаю використання виразних термінів, таких як "спадщина" або "звичка" Багато компаній використовують SAS протягом 30 або 40 років, і вони мають мільйони рядків робочого коду. Крім того, є всі переваги стабільної бази коду з мільйонами днів користувачів в області, де невеликі помилки можуть бути критичними. Це та сама причина, що аромати Unix як і раніше популярні, навіть незважаючи на те, що Unix старше 40 років і певним чином застаріли. Нарешті, існує велике співтовариство досвідчених фахівців SAS, які звикли вирішувати бізнес-проблеми

  • SAS добре підходить для неоднорідних, складних даних та операційних середовищ

Компанії мають багато різних джерел даних, що базуються в різних типах систем, а також у багатьох випадках, декількох операційних середовищах. R лише нещодавно отримав надзвичайно базові можливості для вирішення того, що може бути збережено в пам'яті. Порівняйте це з можливістю SAS підтримувати нативну, оптимізовану обробку баз даних для тераданих даних, щоб навести лише один приклад. У більшості реальних ситуацій найважча частина аналітики займається даними та операційним середовищем. (Вам потрібно запустити розроблений вами Windows код коду оцінки мейнфрейму? З SAS немає проблем. З R вам не пощастило.) R не вирішує жодної з цих проблем.

  • Користувачеві не потрібно турбуватися про те, щоб бути "самостійно"

Користувач SAS може бути впевнений, що кожен модуль коду був протестований кваліфікованими людьми. Не варто приділяти час і зусилля вивченню походження коду або самостійному його затвердженню. Крім того, якщо виникають проблеми будь-якого типу, надійна допомога (від чогось такого, що є основним, як документація, до чогось такого вичерпного, як детальне вивчення несподіваних результатів чи поведінки складного методу), користувач може забрати телефон і отримати допомогу.

  • Це "досить добре"

Мова вимикає деяких людей, тому що вона відрізняється від сучасних мов для загального програмування. Сказавши це, мова є високим рівнем, потужною, виразною та всеосяжною. Коротше кажучи, як тільки ви дізнаєтесь це, він виконує роботу. Для компаній елегантність рішення не є великою точкою продажу.


2
Елегантність, можливо - але коштує? Я думаю, що компанії переймаються цим!
ймовірністьлогічний

2
R може працювати на будь-якому мобільному телефоні до суперкомп'ютера з нульовою вартістю, і мейнфрейм теж при нульовій вартості.
Шон

9

Підтримка клієнтів.

Я колись спілкувався з другом, який працював у компанії, що спеціалізується на встановленні серверів, і він мені потім пояснив, чому великі компанії завжди обирають продукти Microsoft, а не йдуть з відкритим кодом. Перевага Microsoft у порівнянні зі своїми конкурентами з відкритим кодом - підтримка клієнтів. Якщо щось не в порядку з продуктом, компанія може зателефонувати в Microsoft, великі компанії навіть мають персональну підтримку для них. Не так із програмним забезпеченням з відкритим кодом.

Я думаю, що це саме та сама причина, що SAS має перевагу над R.


2
революція R (або інші компанії)?
Бен Болкер

4
Я вважаю, що ці коментарі невірні. У серверному світі правила відкритого коду, а веб-сервер Apache - найпопулярніший веб-сервер.
Френк Харрелл

Я ніколи не говорив, що він говорить про сервери. Скоріше про такі продукти, як Microsoft Office. Я лише згадав, що він працює в серверному світі.
Раскольников

2
Нагадує мені про компанії, які використовують спільний доступ та вікі з відкритим кодом. Майже завжди точка обміну є безплідною і оновлюється лише вікі.
TLJ

9

Що з Frontends? Що таке еквівалент R для посібника з підприємства SAS, студії веб-звітів або корпоративного майнера? Редагувати: ці інструменти дозволяють користувачеві, який не програмує, використовувати ДАННИЙ СКЛАД, не знаючи про основні технології. Вони не є насамперед інструментами для використання SAS як такого. R GUI - це лише IDE для мови R / системи, AFAIK. Вони не можуть надати допомогу нетехнічному користувачеві, який хоче отримати інформацію та розуміння у DWH.


2
Це відповідь. Що робить SAS настільки цінним для клієнтів (як ми), це простота використання для людей, яким не потрібно писати жодного рядка коду.
Курт

2
@Kurt, Гунг не хотів означати, що це не відповідь, а скоріше, що ваша відповідь не підходить до цього веб-сайту (а особливо, зокрема, для цього питання)
Stéphane Laurent

Є тони графічних інтерфейсів для R, дивіться stats.stackexchange.com/questions/5292/…
naught101

2
Ну, я працював з RStudio. У порівнянні з керівництвом по SAS Enterprise, у нього ще дуже довгий шлях, поки він не досягне простоти у користуванні для новачків. Додайте факт, що в R відсутній еквівалент серверу метаданих. І я повністю сумую за еквівалентним для WRS еквівалентом (можливо, я сліпий :)). Краса мови та продуктивність, яку ви можете досягти, означає майже нічого, що стосується компаній, де 90% "клієнтів" із сховища даних не могли написати "Hello World" в будь-якому середовищі програмування. Саме на цьому я хотів зазначити, і саме там ще багато роботи.
Курт

2
Дякую за оновлення своєї відповіді, @Kurt. Я думаю, це буде корисніше для майбутніх читачів зараз. Це правда, що для SAS існують пропозиції зі зберігання точок, клацань та сховища даних, які є більш комплексними, і готові до виходу з коробки, ніж Р. Це розумне питання. +1
gung

8

Я колись працював у консалтинговій компанії, яка надала допомогу SAS великому виробнику чіпів у Силіконовій долині. Наша контактна особа в компанії повідомила нам, що отримала пропозицію іншої компанії про надання їм саме таких консалтингів, використовуючи інше програмне забезпечення, яке охоплює всі сфери, на які поширюється SAS, і яке коштувало б компанії в частку того, що SAS стягував з них плату. ( $ 30 000 на противагу 1 000 000 $ ). Контактна особа розглядала, що робити, і вирішила проти інформування свого начальника про пропозицію, оскільки побоювалася звільнити його за використання SAS в першу чергу і не розглядала більш дешевих альтернатив. Натомість він наполягав на тому, щоб наша консалтингова компанія дала їм велику перерву в нашій консультаційній платі. Наша компанія погодилась.


1
Отже, ваша контактна особа не могла висловити аргумент, що R все ще порівняно з SAS, і він хотів зачекати, щоб переконатися, що R був встановлений, перш ніж його використовувати?
ймовірністьлогічний

6

Я не думаю, що про безпеку додатків не згадували. Це запитання було порушено у програмі Stack Overflow, але відмовилося, оскільки воно було поза темою.

Я співпрацюю зі Шведською національною радою з питань охорони здоров'я та добробуту, яка використовує SAS. Коли я розмовляв зі своїми статистиками (що подобається R), вони стверджують, що їхні ІТ-люди віддають перевагу SAS, оскільки вони не довіряють пакункам, завантаженим у Р. Моя дружина також працює в SAS, і її установа часто вимагає одного і того ж питання ...

Я хотів би побачити деякі коментарі до цього питання. Я швидко здійснив пошук, але не знайшов хороших посилань ...


3
Яка альтернатива завантаженню пакета, який забезпечує нові можливості (як це робить більшість пакетів R)? Це вдома, щоб виростити ці можливості? Це надійніше?
Френк Харрелл

2
@FrankHarrell Я згоден, але я думаю, що це може бути простою областю для розробників R, щоб націлити та вдосконалити. Простим рішенням може бути різний рівень безпеки для пакетів - якщо пакет має системний дзвінок або підключається самостійно до Інтернету, пакет повинен мати більш високий рівень доступу. Це могло б дозволити установкам з низьким рівнем дозволу в тих установах / компаніях, де витік даних викликає головне занепокоєння. Я як користувач можу також додатково перевірити, коли вирішу встановити пакет з високим рівнем кліренсу. (Btw, коли запланована ваша книга (RMS, версія 2)?
Макс Гордон

Я сподіваюся, що друге видання RMS з'явиться вже через рік.
Френк Харрелл

5

Причиною, яку я зрозумів найбільш переконливою, було те, що SAS має велику бібліотеку вертикальних бізнес-модулів, якими користуються люди в цій вертикалі, тому це дещо зафіксовано.
Але також SAS вирішив потреби цих вертикальних сегментів у бізнесі та оптимізував їхні потреби - оптимізовані в розумінні "користувачеві не потрібно робити багато зайвих робіт, щоб отримати результати". Я не є користувачем SAS, тому це не означає як упереджений захист бізнес-стратегії SAS.


4

Будучи великим комерційним продуктом, який є SAS, для його просування докладаються сильні та скоординовані зусилля. Я не думаю, що зусилля по просуванню використання R можуть відповідати цим.


8
Так, люди певною мірою виявляють R на своєму. Але значна частина питання зводиться до інерційності вивчення нової мови. Завжди з'являються нові мови, які мають переваги перед старими мовами, але користувачі чіпляються до старих мов (свідчить COBOL). Програмування в SAS є надзвичайно неефективним, вимагаючи, можливо, подвоїти кількість програмістів, щоб виконати ту саму роботу, як і R, але експерти SAS із задоволенням гуляють на своєму веселому шляху, і компанії бояться такого збою, який би заощадив мільйони доларів у зарплатах.
Френк Харрелл

3

Я дивлюсь на Open Source або ліцензійне програмне забезпечення, подібне до цього, будь то SAS або щось інше. Мій відділ ІТ є для надання послуги нашому бізнесу. Компанія не заробляє гроші на ІТ, лише на підтримці бізнес-ІТ. Бізнес має річний дохід в $ 16 млрд. Вона коштує близько $ 200 млн на рік. Якщо гроші питання , я б скоротити витрати, але якщо я економлю 10% ( $ 20 мільйонів) з мого бюджету, бізнес буде повідомлення? Вони просто скоротять мій бюджет наступного року? Якщо ІТ не вдасться, бізнес втрачає дохід, скільки залежить від характеру відмови. Частини бізнесу можуть більше не отримувати прибуток. Якщо такий товар, як SAS, не вдається, я можу подати позов за контрактом. Якщо продукт OSS не працює, я не можу. Я не поверну свої $16 мільярдів, але я, можливо, повернусь назад, і реально за допомогою SAS, ви навряд чи втратите партію. Різниця в ціні та вартості повинна виправдовувати будь-який додатковий сприйнятий ризик для бізнесу. Іноді дотримуватися SAS дешевше, ніж перекваліфікуватись. Іноді виникають вищі пріоритетні питання, тому компанії залишаються в SAS. Деяким компаніям не потрібен повний функціонал, і в цьому випадку альтернативи є життєздатними. Деяким не потрібна підтримка, і знову альтернативи є життєздатними. Якщо ви відповідаєте вимогам бізнесу, то будь-які варіанти є дійсними, якщо ви хочете надати підтримку бізнесу, вам потрібно переглянути загальну вартість власності за 5-10 років, можливість набору експертів з інструментів, стабільність у продукті тож вам не доведеться переписувати все з кожним новим випуском, навчальні курси, доступні для підвищення кваліфікації,


4
Я не дотримуюся ваших міркувань. Сума грошей, витрачена програвачами на програму архаїчною мовою (SAS) та сучасними вільними мовами, приголомшлива.
Френк Харрелл

4
@Frank - я не погоджуюся з вашою характеристикою. Грамотний програміст SAS може бути високопродуктивним у SAS, а компетентні програмісти SAS широко доступні. Я підтверджую, що R структурований більше як сучасна мова, і тому може бути простіше вчитися програмісту, який знає, скажімо, Java. З мого досвіду багатьох компаній, продуктивність розробників із використанням SAS рідко є суттєвим питанням.
JBK

9
Використовуючи SAS протягом 23 років і S-Plus / R протягом 22 років, я можу сказати, що досвідчений програміст SAS може бути високопродуктивним, але досвідчений програміст R може бути легко втричі більш продуктивним.
Френк Харрелл

2
"Я можу подати позов за контрактом" ха-ха - неправильний код, написаний працівниками, набагато більше шансів спричинити проблеми, ніж те, що SAS або R роблять "самостійно"
ймовірністьлогічний

1

Деякі причини, яких я не бачив, згадували:

  1. Краща документація. Документація SAS є багатослівною, R - документацією. Багато компаній можуть віддавати перевагу детальній документації.

  2. Кращі повідомлення про помилки. Повідомлення про помилки R часто здаються покликаними довести, що людина, яка пише повідомлення, розумніша, ніж людина, яка її читає.

  3. Технічна підтримка. SAS має найкращу технічну підтримку, яку я стикався в будь-якому місці, що надається SAS. Ви можете отримати допомогу з R, але ця допомога розсіяна по різних місцях і не завжди доступна. Люди на різних сайтах, які надають допомогу з R, є добровольцями - і волонтери не зобов’язані допомагати. Люди в технічній підтримці SAS платять за те, що вони роблять - і вони роблять це добре. Мало того, що вони роблять це добре, вони ввічливо вказують на те, що часто немає у всіх громадах R (моя улюблена? "Я отримала допомогу, набравши" допомогу ", чому б не спробувати ввести" допомогу "?")

  4. LATEX


1
Я впевнений, що є компанії, які продають технічну підтримку R. Але наскільки це добре, я не маю досвіду!
kjetil b halvorsen

1

Я думаю, що кут спадщини може бути великим з наступних причин. Організація наймає людину, називає їх людиною X. Вони - гуру / майстер обчислень / тощо. Вони створюють дивовижні програми / інструменти SAS / тощо. Вони настільки гарні, що інші люди в організації не відчувають, що їм потрібно зрозуміти, як працюють програми. Вони дозволяють так просто натиснути кнопку, і все просто працює (чарівні чорні скриньки).

Особа Х залишає організацію. На жаль, знання, які має особа Х, залишають організацію (управління документацією та знаннями не було визначено пріоритетів, замість цього були робочі програми). Їх замінює людина Y. Людина Y чудово підходить до R, але не має уявлення про SAS, а значить, і не має уявлення про те, як насправді працюють програми SAS. Існує величезна крива навчання, щоб навіть зрозуміти, щоCTCTзначно перевищує однорічну ліцензію на SAS. Я сподіваюся, що SAS зробить якийсь аналіз цієї торгівлі, і нехай це вплине на те, як вона встановлює ліцензійну плату (ну, якби я працював би в SAS). Також зауважте, як процедури побудови графіку SAS набагато кращі, ніж десятиліття тому (наприклад, proc sgplot vs proc plot). збіг, що R зробив хороший задум першим? Я думаю, що не! Це ефективно знижує ефективність від перемикання, оскільки побудова графіків вже не така вже й відрізняється - R все-таки краще, але недостатньо для перемикання ...


0

Для промислової статистики існують люди із забезпечення якості, які (як правило) не мають програми програмування, статистики чи наукового досвіду та перевіряють статистиків, програмістів та науковців. Вони хочуть знати: "Як ти знаєш, що те, що ти робиш, правильно?" і "Якщо це неправильно, то як ми можемо когось звинуватити і як вони за це заплатять?".

Ліцензія GNU / GPL Copyleft постачається із консервованим текстом, який говорить: "R - це вільне програмне забезпечення та постачається з АБСОЛЮТНО НЕ ГАРАНТІЯ" у тексті з усіма кришками точно так, як я написав. Це відрахування. Коли якісна людина читає цей текст, вони, в основному, прямо дискредитують R. Я маю на увазі, якщо товар хороший, варто додати гарантійне право? Така комерційна продукція привела нас до віри. Насправді, в кінцевому підсумку FDA сказала, що вони приймуть регуляторні подання в R, що відображають зміну в галузі програмного забезпечення. (Зверніть увагу, що це твердження з’являється після початкової дати публікації питання.)

Для того, хто нічого не знає про комп’ютери, уявлені сценарії безпеки, невідтворюваності та серйозних наукових помилок не є безмежними внаслідок цього АБСОЛЮТНО ВІДМОВЛЕННЯ ГАРАНТІЇ. Ми всі згодні, що помилки можуть мати катастрофічні витрати. Що стосується вашої ліцензії SAS, SAS має експертів, які можуть пояснити аудиторію своє програмне забезпечення, і за неможливого сценарію того, що SAS насправді викликає таке питання, вони можуть відповідати за штрафи та покарання (у них також є достатньо грошей для адвокатів, щоб гарантувати, що вони бути звільненим повністю в такому випадку). Тягар і витрати, пов'язані з тим, що аналітик / програміст представляє цю справу для R, в основному становить ліцензію SAS. Не те, що програмування в SAS повністю звільняє вас від нищівного тягаря дотримання якості!

В основному, я б сказав, що судовий процес зіграв важливу роль у необхідності дорогого ліцензійного програмного забезпечення.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.