До речі, питання щодо використання електронних таблиць Google викликало контрастні (отже, цікаві) думки з цього приводу: Чи використовуєте деякі з вас електронну таблицю Google Документи для того, щоб проводити та ділитися своєю статистичною роботою з іншими?
Я маю на увазі старішу статтю, яка не здавалася настільки песимістською, але вона лише незначно цитується в роботі, яку ви згадали: Keeling and Pavur, порівняльне дослідження надійності дев'яти пакетів статистичних програм (CSDA 2007 51: 3811). Але тепер я знайшов вашу на своєму жорсткому диску. Також у 2008 році був спеціальний випуск, див. Спеціальний розділ про Microsoft Excel 2007 , а останнім часом у Журналі статистичного програмного забезпечення: Про числову точність електронних таблиць .
Я думаю, що це давня дискусія, і ви знайдете різні документи / думки про надійність Excel для статистичних обчислень. Я думаю, що існують різні рівні дискусії (який аналіз ви плануєте зробити, чи покладаєтесь на внутрішнє вирішення, чи є нелінійні терміни, які вводять дану модель тощо), і можуть виникнути джерела чисельної неточності. в результаті правильних обчислювальних помилок або проблем із вибором проекту ; це добре узагальнено в
М. Альтман, Дж. Гілл та М. П. Макдональд,
Числові питання статистичних обчислень для соціолога , Вілі, 2004.
Тепер для дослідження дослідницьких даних існують різні альтернативи, які забезпечують розширені можливості візуалізації, багатоваріантну та динамічну графіку, наприклад, GGobi - але дивіться відповідні теми на цій вікі.
Але, очевидно, перший пункт, який ви зробили, стосується іншої проблеми (IMO), а саме використання електронної таблиці для роботи з великим набором даних: просто імпортувати великий файл csv в Excel просто неможливо (я думаю про геномні дані, але це стосується інших видів високомірних даних). Він не був побудований для цієї мети.
R
або SAS).