Яке статистичне програмне забезпечення підходить для викладання студентського вступного курсу статистики з соціальних наук?


11

Я шукаю пакет програм статистики, який я можу використати у вступному курсі статистики для навчальної програми з суспільствознавства. Студенти не мають попередніх знань зі статистики та не мають досвіду роботи з мовами програмування. Мета полягає в тому, щоб ознайомити їх з основними статистичними поняттями (як засоби, дисперсія, сума квадратів, p-значень, ... і, нарешті, лінійна регресія) та дати можливість самостійно проводити базовий аналіз, використовуючи приклади наборів даних. Курс повинен стосуватися вивчення понять, роблячи статистику, а не запам'ятовування формул (хоча, я думаю, формули важливі).

Тому я шукаю альтернативу звичайному синтаксису (як звичайний R) або програмному забезпеченню, що керується точкою та клацанням (як SPSS або Rcmdr). Програмне забезпечення має бути легко засвоєним і мати чіткий графічний інтерфейс користувача, який візуалізує набори даних та пропонує стандартні графіки та таблиці. Найкраще було б, якби вона візуалізувала всі різні етапи аналізу (наприклад, читання та маніпулювання даними, обчислення описових заходів, виготовлення описових таблиць та графіків, обчислення інфекційних заходів, побудова графіків зараження, експорт до звіту).

Чи є у вас пропозиції щодо (відкритого чи безкоштовного) статистичного програмного забезпечення, яке підходить для вивчення та перших практик статистики?

EDIT
Дякую за ваші пропозиції. Я подивився в Gretl , а два інших я ПРОГРАМИ знайшов під час мого власного онлайн - довідки: RapidMiner і статистичної лабораторії . [1]
Я виявив , що gretlінтерфейс і вихід «s є більш ясним і цілеспрямований , ніж , наприклад Rcmdr, SPSS або Stata. Тому це досить кваліфікований інструмент для початку викладання статистики з моєї точки зору.
Однак графічний інтерфейс графічного інтерфейсу RapidMinerтаStatistical Labвразило мене, коли вони візуалізують окремі кроки статистичного аналізу (починаючи з завантаження даних). Я думаю, що це може бути корисним багатьом студентам, які борються зі звичним фокусом на математичних поясненнях. Звичайно, мені здається, що RapidMiner занадто перевантажений функціями, меню та кнопками для початківців, тоді як Статистична лабораторія значно більш зосереджена. Великим плюсом Статистичної лабораторії є консольний "R-калькулятор" з "майстром R-коду", який допомагає створювати реальний синтаксис R, на який покладається Статистична лабораторія Rдля своїх обчислень.
Нарешті, я вирішив почати зі статистичної лабораторії у першому семестрі, вводячи основні поняття та перейшовши на RStudio (та Rcmdr) у другому семестрі.

[1]: Gnumeric, SciPy, Scilab, GNU Octave і подібні мені здаються менш орієнтованими на суспільні науки.


8
@Matthias: Я думаю, якщо ваші студенти приїжджають / націлюються з / на сферу соціальних наук, то їх викладання R як перший крок у статистиці - це зайвий крок. Більшість із них матимуть проблеми з поняттям консолі, командами, синтаксисом тощо, і ви витратите більше часу, переглядаючи "концепції програмування" (що таке "функція", "цикл" тощо), ніж "статистика". Я базую це на попередньому досвіді, коли я робив підручники для статистики 101 у відділі Soc.Science; люди пропустили точку лекції, тому що вони зосередилися більше на тому, щоб R працювати над ними, ніж насправді вивчати їх дані.
usεr11852

1
@ user11852: Ви можете мати рацію, але це сумно, що середні школи висилають студентів без програмного впливу. Або університети, які допускають цей розрив. У університетському класі не повинно бути студента, який не знає, що таке цикл чи функція. Затримка експозиції просто висуває проблему в іншому місці.
curious_cat

2
@ user11852: Іншим менш приємним варіантом може бути, щоб кафедри сатистики наполягали на тому, що класи "101 для соціальних наук" мають передумову певного досвіду програмування або виправного класу програмування. У наші дні, коли майже всі предмети настільки сильно упереджені в обчисленні, насправді немає причин, чому програмування-101 не повинно бути першим класом, який кожен бере на себе.
curious_cat

6
Для чого це варто, я успішно використав R у своєму вступному курсі статистики з політології. Я використовував RStudio . У мене також були щотижневі «лабораторії», де я дозволяв би студентам спільно працювати над невеликими завданнями, в той час як я ходив і відповідав на запитання. З деяким добре прокоментованим прикладом коду, учні добре зробили і навряд чи нарікали. Вони насправді скаржилися на Р набагато менше, ніж у попередньому семестрі, коли я використовував Stata. Оскільки статистика не є безкоштовною, студенти повинні були прийти на лабораторні години, щоб виконувати свою роботу - вони ненавидів її.
Джейсон Морган

6
Я думаю, що R у поєднанні з RStudio може бути відмінним підходом. Він також створює основу для відтворюваної дослідницької практики, на відміну від систем меню. Я рекомендую видати кілька шаблонів коду, які студенти можуть завантажувати в RStudio з Інтернету (RStudio робить це легко) і дозволити студентам виконувати роботу зі зміни прізвищ змінних та статистичних моделей на те, що потрібно для проблеми.
Френк Харрелл

Відповіді:


12

Може, Гретл? http://gretl.sourceforge.net/

Це безкоштовно і використовується в нашому університеті для статистики студентів.


9
+1. Відмінна пропозиція. Я завжди вважав, що графічний інтерфейс Gretl є інтуїтивно зрозумілим, і відгуки, які він надає, є точними та без зайвих зайвих зусиль, які могли би відкласти кілька менш "технічних" студентів. Плюс він безкоштовний, добре задокументований і має консоль R, якщо хтось, якщо схильний побачити щось трохи «глибше».
usεr11852

8

Я б уникну більшості "відомих" матеріалів, MatLab , Maple , Mathematica , JMP , SAS або Minitab , тому що після закінчення ваших студентів вони повинні платити тисячі доларів на рік, щоб професійно ними користуватися. Кожна компанія, як правило, має свій улюблений інструмент, і якщо ви навчите їх інструменту, за який їхня компанія не заплатить, то їх набір навичок витрачається даремно. Мені також не подобаються власні бібліотеки - вони навчають користувачів натискати кнопки, і якщо користувач хоче перейти кудись інше (JMP чи що завгодно), навчання не переноситься.

Python, що включає SciPy / NumPy , досить непоганий. Він є відкритим кодом і добре підтримується. Він має граматику, що засвоюється / легко. Він все ще інтерпретується так, що він не кричить швидко, але якщо вони не знають сценаріїв або електронних таблиць, це набагато швидше, ніж вони коли-небудь знадобляться. PythonXY - хороша версія, має хороші вкладки та підтримку. Мені також подобається, що через нього можливе програмування GUI. Створення автономних додатків у Windows - це трохи складний, але, ймовірно, Waaaay вище рівня ваших учнів. (редагувати) Sage and Cythonістотно поліпшити значення пропозиції Python. Інтерфейс та зручність використання значно покращуються. Скомпільований код, який на 1000 разів швидше, ніж досить хороший інтерпретований код, звучить для мене чудово (або дивовижно). EDIT: Я розважався, використовуючи дистрибутив Anaconda (він же конда), і вони також дуже прості у використанні.

Я не великий фанат Perl . Це трохи застаріло. Йдеться про розбір та обробку тексту більше, ніж математика / наука. Не зрозумійте мене неправильно, це може робити математику / науку, але якщо ви знаєте VBA, то MSWord може робити математику / науку. Наявність того, що не в змозі - це не те, що має конкретну роботу, як ваша основна увага.

Мені подобається R , навіть якщо ви цього не робите, тому що він агресивно розробляється кваліфікованими докторами математики / статистики. Це означає, що навіть незважаючи на те, що граматика може бути klugy, у неї будуть бібліотеки, які є оновленими, і доведено, що вони не мають помилок. (В загальному)

Excel - це не поганий старт. Коли ви знаєте одну електронну таблицю, це полегшує використання будь-якої іншої. У бізнес-середовищі майже кожна компанія має офіс MicroSloth, тому Excel не є поганою ідеєю. Мені не подобається їх сценарій, але це лише вподобання, я все одно можу ним користуватися. Він коштує близько 150 доларів США порівняно з 5000 доларів США для деяких інших програмних засобів, тому вартість входу для звичайних людей є більш розумною.

Мова сценарію JMP є чужою. Це не перекладається на інше (nonSAS) програмне забезпечення. Тримайтеся подалі від цього. Єдиною особливістю мови, що можна придбати, є те, що вона може (в деякому обмеженому сенсі) запускати код "R". Якщо ви кодуєте в "R", просто використовуйте "R" і "RStudio".

Я не використовував MathCAD, тому не можу говорити про його актуальність. Я думаю, що це більш символічно, менше щодо імпорту зовнішніх даних. Це дешевше, поки що. Він не вільний і відкритий. Заклад у нього не перекладається на об'єкт іншою мовою. ( EDIT ) Також у цій категорії є EES , яким я також не вражений поза дуже вузьким вікном використання.

EDIT : Мене мало вразило LabVIEW . Використовувати досить просто, що за кілька годин хтось здатний. Він працює дуже швидко, як буквально в 1000 разів швидше, ніж MatLab, буквально такий самий ( MathScript ) код. Якщо у вас є важкі підйоми, варто трохи подумати. Це коштує грошей, але щось у районі 1/5 звичайного великого чавуну.

Удачі

EDIT: Я б не використовував статистичну LAboratory, тому що навіть коли ви вибираєте "англійська мова" для мови, вона виходить німецькою мовою, і вона не видаляється на Windows 7. Обидва адміністративні недоліки не сприймають мене. Я не можу ним керувати, і коли я намагався видалити його, це не вдалося.

За допомогою спроб та помилок я виявив налаштування меню, щоб відобразити його англійською мовою. Схоже, це відносно простий (і, отже, корисний і послідовний) інтерфейс у деяких R-бібліотеках для обробки та відображення даних. Мені доведеться більше розглянути, тому в цей момент "присяжних все ще немає".

РЕДАКТУЙТЕ більше:

-> Тут <- це цікаве посилання на цілу іншу дискусію про інструменти та верстаки.


2
Існує також RPy rpy.sourceforge.net , R як бібліотека для Python, тож ви отримуєте сучасні, перевірені без помилок аспекти R із синтаксичною простотою Python.
Ghillie Dhu

1
"вони навчають користувачів натискати кнопки, і якщо користувач хоче перейти кудись інше (JMP або будь-що інше), навчання не переноситься". Власна програма SAS не особливо добре навчається "натисканням кнопок", і проблеми з переносом між різними мовами навряд чи є особливістю власного програмного забезпечення. Чорт забираю, я більше вдома їхав із SysStat до JMP, ніж з Python до R.
Фоміт

@Epigrad - я спостерігаю, як весь час відключають інженери. Десятки і десятки людей. Я радий, що ти знайшов корисність для цього, але я дуже сподіваюсь, що ти непристойний, і загальна тенденція шкоди істотно не зміниться твоїм досвідом.
EngrStudent

@EngrStudent: Дякую за ваші зусилля, щоб спробувати Статистичну лабораторію! Налаштування меню для англійської мови справді не інтуїтивно зрозуміло, але після встановлення одного разу я не стикався з більшою проблемою з мовою. На жаль, я не можу змусити "майстра R-графіків" працювати, хоча нормальний R-графік працює добре, якщо я вставлю якийсь код R. Тому я наведу своїм студентам кілька прикладних фрагментів коду для створення базової графіки. Можливо, я перейшов раніше на RStudio ...
non-numeric_argument

1

Ви можете спробувати скористатися Gnumeric, високо продуманою електронною таблицею, також є електронна таблиця Open Office. За умови, що ви поясните дефекти використання електронних таблиць, зокрема Excel, після закінчення коледжу в подальшому практичному житті вони можуть не мати розкіш чогось подібного SPSS, але все ж можуть отримати корисні послуги з цих безкоштовних продуктів, які не надто вимогливі до математики та навичок програмування. . Багато офісних середовищ за замовчуванням містять Excel.

Подивіться на:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Статистика та Excel 2007

і пошук подібних посилань, таких як

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=uk#d85edd4978e53568 Кілінг, Келлі Б. та Павур, Роберт Дж. (2007). Порівняльне дослідження надійності дев'яти пакетів статистичних програм. Обчислювальна статистика та аналіз даних, 51, 3811–3831.


1

Я був CalEst . Ліцензія дешева, як 10 доларів, і забезпечує як розрахунки / графіку, так і чудове моделювання / діяльність для студентів на практиці. Більше того, на їхньому веб-сайті вони мають деякі інструменти, в основному в дистрибутивах, які можуть вам бути корисними.


Ця відповідь трохи коротка. Чи можете ви ще трохи розповісти про те, чому ви запропонуєте це програмне забезпечення та які переваги в ньому порівняно з конкуренцією?
kjetil b halvorsen

1

Ми почали використовувати Rguroo. Це програмне забезпечення є нещодавно випущеним. Це на основі R, але знання R кодування не потрібно. Це також веб-додаток, тому ви просто увійдете в браузер. Мої студенти можуть зберегти свою роботу на будь-якому етапі та повернутися, щоб завершити свою роботу. Графічний інтерфейс користувача дуже інтуїтивно зрозумілий, і результати виглядають чудово.


0

Ми використовуємо бета-версію Rguroo на наших вступних курсах статистики в Каліфорнійському державному університеті, Фуллертон протягом останніх трьох років. Вони зараз (серпень 2019 року) випустили офіційну версію, дивіться на https://Rguroo.com. Це програмне забезпечення статистики веб-додатків, яке працює в будь-якому браузері. Це програмне забезпечення призначене для викладання, і вони пропонують один на один демонстрацію та навчання викладачів; просто надішліть електронною поштою або зателефонуйте їм, щоб домовитись про демонстрацію. Програмне забезпечення працює у фоновому режимі R, але вам не потрібно знати R, все це вказує і клацніть. Він має багато чудових функцій, включаючи детальний вихід, чудові графічні інструменти, калькулятор ймовірності та засоби моделювання. Мені особливо подобаються функції відтворюваності, де ви можете зберегти свою роботу на будь-якому етапі, повернутися та продовжити там, де ви зупинилися. Ви також можете поділитися своєю роботою зі студентами через те, що вони називають файлами RGR. Підсумок ... це чудово, і ми продовжуємо його використовувати.


0

Я особисто використовую програмне забезпечення DataMelt для викладання статистики. Це дуже добре задокументовано, у ньому є навчальні посібники, книги та багато прикладів. Важливо також те, що можна шукати будь-який приклад, і ви можете отримати розумну відповідь (у фрагментах Javadoc та коду). Студенти можуть вивчити не лише Python (що є мовою програмування за замовчуванням), а й як кодувати статистичні методи на Java. На мій погляд, це є значною силою: студентам не потрібно вивчати дуже спеціалізовану «статистичну» мову, як-от R-stat. Вони можуть одночасно навчатися Java, що може відкрити багато можливостей, якщо вони вирішать перейти до галузі.


-1

Існує нове програмне забезпечення під назвою Rguroo, яке є веб-додатком. Це дуже зручно у використанні, оскільки не вимагає завантаження чи встановлення. Rguroo має двигун R, але його використання не вимагає кодування R, оскільки воно дозволяє використовувати потужність R, використовуючи графічний інтерфейс точкою та клацанням. Кожен аналіз є збереженим та відтворюваним. Ми використовуємо це програмне забезпечення для наших вступних та проміжних курсів статистики протягом останніх трьох років. На даний момент це безкоштовно, і ви можете створити обліковий запис на веб-сайті www.Rguroo.com. Виходячи з того, що я маю, він залишатиметься безкоштовним для всіх викладачів, і він матиме розумну річну плату за абонемент, десь від 10 до 20 доларів, для студентів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.