Коли я викладав статистику випускників, я говорив своїм студентам: "Мені все одно, яким пакунком ви користуєтесь, і ви можете використовувати що-небудь для домашнього завдання, оскільки я очікую, що ви надасте змістовні пояснення, і я зніму бали, якщо я побачити tr23y5m
імена змінних у ваших публікаціях. Я можу підтримати ваше навчання дуже добре в Stata, і досить добре, в Р. З SAS ви самостійно, як ви стверджуєте, що пройшли курс навчання. За допомогою SPSS або Minitab, Бог благословить вас ". Я думаю, що розумні роботодавці подумають те саме. Важливим є ваша продуктивність щодо результатів проекту. Якщо ви зможете досягти поставленої мети за 40 годин роботи, добре; якщо ви можете досягти цього в C ++ за 40 годин роботи, чудово; якщо ви знаєте, як це зробити за R за 40 годин, але ваш керівник хоче, щоб ви це робили в SAS, і вам доведеться витратити 60 годин, щоб просто вивчити деякі основи і куди йдуть крапки з комою, це може бути розумним лише в контексті великої картини решти коду, який знаходиться в SAS ... і тоді менеджер не дуже розумний, найнявши програміста R.
З цієї точки зору загальної вартості "безкоштовний" R - це надзвичайно розкритий міф. Будь-який серйозний проект вимагає спеціального коду, якщо тільки для введення даних та форматування результатів, і це не нульова вартість професійного часу. Якщо для цього введення та форматування даних потрібно 10 годин коду SAS і 20 годин коду R, R є більш дорогим програмним забезпеченням на межі , як би сказав економіст, тобто з точки зору додаткових витрат на виробництво заданої функції . Якщо для великого проекту потрібно 200 годин часу програміста R та 100 годин часу програміста Stata для забезпечення однакової функціональності, Stata в цілому дешевшає, навіть облік ліцензії ~ $ 1К, яку вам потрібно придбати. Було б цікаво побачити такі прямі порівняння; Я брав участь у переписуванні величезного безладу 2 Мб коду SPSS, який, як кажуть, накопичився протягом приблизно 10 чоловік-років на ~ 150 К код Stata, який пробігав так само швидко, може бути швидше; це було близько 1 людинорічного проекту. Я не знаю, чи є цей коефіцієнт ефективності 10: 1 типовим для порівнянь SPSS: Stata, але я не здивуюсь, якби це було. Для мене робота з R - це завжди великі витрати через витрати на пошук: я маю визначити, який із п’яти пакетів з подібними іменами виконує те, що мені потрібно зробити, і оцінити, чи достатньо це надійно для мене, щоб використовувати його в моя робота. Часто це означає, що мені дешевше писати власний код Stata за менший час, ніж я витрачав би на те, щоб змусити R працювати в заданому завданні. Слід розуміти, що це моя особиста ідіосинкразія; Більшість людей на цьому веб-сайті краще використовувати R, ніж я.
Смішно, що ваш професор вважає за краще статтю чи ГАУСУ над R, оскільки "R не писали економісти". Ні Стата, ні ГАУС; вони написані комп'ютерними науковцями за допомогою інструментів комп'ютерних вчених. Якщо ваш професор отримує ідеї щодо програмування з CodeAcademy.com, це краще, ніж нічого, але розробка програмного забезпечення професійного рівня настільки ж відрізняється від набору тексту в текстове поле CodeAcademy.com, оскільки водіння вантажного автомобіля відрізняється від велосипедного. (Статистику розпочав робочий економетрист, який перетворив комп'ютерного вченого, але він не займається цим питанням економетрії праці вже близько 25 років.)
Оновлення : Як прокоментував AndyW нижче, ви можете написати жахливий код будь-якою мовою. Потім стає питання вартості, на якій мові легше налагодити. Для мене це виглядає як поєднання того, наскільки точним та інформативним є вихід, а також наскільки легким та прозорим є сам синтаксис, і я, звичайно, не можу відповісти на це. Наприклад, Python застосовує відступ коду, що є хорошою ідеєю. Stata та R-код можна скласти через дужки, і це не буде працювати з SAS. Використання підпрограм - це меч з двома ребрами: використання *apply()
спеціальної програми function
в R є, очевидно, дуже ефективною, але важче налагоджувати. Подібним чином, Stata local
s може замаскувати майже все, і дефолт до порожнього рядка, хоча й корисний, також може призвести до важких помилок.