Яка різниця між статистикою та інформатикою?


10

Ми завжди кажемо, що статистика просто стосується даних. Але ми також знаємо, що інформатика також отримує знання з аналізу даних. Наприклад, люди з біоінформатики можуть повністю пройти без біостатистики. Хочу знати, в чому суттєва різниця між статистикою та інформатикою.


7
Ні, це лише тому, що слово "інформатика" повністю втратило остаточне значення. "Біоінформатика" була придумана саме для "біології, зробленої на комп'ютері", нічого глибокого в цьому немає.

1
@mbq Погодився. "Інформатика" та "Біоінформатика" втратили будь-яке змістовне визначення.
Фоміт

чітко біоінформатика (застосуйте свої висновки, щоб спостерігати за своїми результатами біологічним шляхом)
Kamal Alblwei

Відповіді:


20

Відмінне запитання !!

Я кілька разів чув, що біоінформати можуть обійтися без біостатистики або навіть без статистики. Це абсолютно вірно, поки воно не стане помилковим. На мою думку, загальний брак статистичних знань має катастрофічний ефект у цій галузі, як показав Кіт Беггерлі . Я також міг зауважити, що відсутність базових знань у статистиці (та лінійній алгебрі) є причиною застою біоінформатиків у довгостроковій перспективі: без глибокого знання теорії вони, як правило, винаходять колесо і вдаються до спеціальних рішень, які вирішують нічого, крім власної проблеми.

Але тепер, щоб відповісти на ваше запитання, я згоден, що в цілому статистика не може обійтися без комп’ютерів тих днів. Однак одним із основних аспектів статистики є умовивід , який не має нічого спільного з комп'ютерами. Статистичний висновок - це насправді те, що робить статистику наукою, оскільки вона говорить про те, чи є ваші висновки в інших контекстах чи ні.

Коротше кажучи, ви можете проаналізувати пекло своїх даних, вам все одно знадобиться статистика, щоб знати обгрунтованість прогнозів чи рішень, які ви приймете на основі своїх аналізів.


Дякую. Чи можете ви пояснити більше про те, який загальний принцип стоїть за біоінформатикою, щоб зробити його дисципліною. Для статистики, загалом кажучи, є дві основні частини, одна - це чиста маніпуляція даними, інша - статистичний висновок, який ґрунтується на ймовірності, одна з чистої математики. На основі статистичних моделей (ймовірнісних моделей) статичні люди можуть займатися наукою. Що з біоінформатикою?
Гонгланг Ван

4
Біоінформатика - це просто використання комп'ютерів для вивчення біологічних питань. Дисципліни зазвичай визначаються питаннями, які вони задають, а не їхніми методами, тому біоінформатика повинна бути частиною біології, на мою думку. Він має спеціальну назву, оскільки біологи дуже погано користуються комп’ютерами, тому люди, які можуть це зробити, повинні мати спеціальну етикетку. Я не впевнений, що через 50 років, коли біологи краще будуть займатися інформатикою та математикою, біоінформатика все одно буде існувати.
gui11aume

2
Приємно бачити, як хтось ще цінує зусилля Кіта. Він, звичайно, не ухилявся від суперечок чи складних та незручних професійних ситуацій.
кардинал

@cardinal Saw Кіт говорив на конференції APHA рік-два тому. Це була одна з найкращих розмов, яку я бачив.
Фоміт

9

На мою думку, хоча існує достатня кількість перекриттів між полями, є і ключові відмінності. Зазвичай студент статистики (у вищих ступенях) займе більше уроків теорії (математики та математики), ніж студент інформатики, але студент інформатики дізнається більше з обчислювальної (особливо частини бази даних).

Розробка нового статистичного тесту припала б більше до статистиків, ніж до інформатиків, але проектування інтерфейсу для введення користувачем даних та створення таблиць та графіків припало б більше до інформатиста, ніж до статистиків.

Для статистиків комп'ютер - це інструмент, який допомагає зі статистикою. Інформатистська статистика - це інструмент, який допомагає збирати та поширювати інформацію (загалом через комп’ютер).

Тут можна редагувати -----

Щоб перебільшувати, ось приклад. Я працював над проектами з інформатиками (я статистик), коли лікар хоче створити систему, де інформація про пацієнтів використовується для прогнозування їхнього ризику певного стану (наприклад, розвиток тромбу), і хоче отримати певну форму насторожити, щоб повідомити про ризик. Моя роль у проекті (роль статистики) полягає у розробці моделі, яка буде передбачати ризик з урахуванням змінних прогнозів (одна логічна модель регресії - одна з таких моделей). Роль інформатиків у проекті полягає у розробці інструментів, які збирають змінні предиктора, використовувати мою модель на них, а потім надсилати результати лікареві. Дані можуть бути зібрані з електронного медичного запису або через екран для введення даних медсестри для заповнення або інших.

Зараз я (та багато інших статистиків) знаю достатньо програмного забезпечення, щоб я міг запитати базу даних, щоб отримати прогнози та створити певний тип попередження, але я радий залишити це інформатикам (і їм все одно краще). Є інформатики, які знають достатньо статистики, щоб відповідати логістичній регресійній моделі. Тож просту версію цього проекту може зробити лише статистик або лише інформатик, але найкраще, коли обидва працюють разом. Якщо ви дивитесь на цей проект і думаєте, що частина моделювання є цікавою частиною, а збір даних, попередження та інші інтерфейси - це лише інструменти для переміщення інформації до моделі та з неї, то ви більше статистики. Якщо ви бачите проектування інтерфейсу, оптимізацію пошуку даних, тестування різних типів сповіщень тощо.


(+1) Мені подобається баланс цієї відповіді. Я не впевнений, що цілком розумію, що було задумане самим останнім реченням.
кардинал

1
Я думаю, що ваш приклад дуже приємний і дає гарний портрет основного місця землі. Я б хотів, щоб я міг повторити його лише за цю частину. Ура.
кардинал

Ваш приклад справді класний. Дуже дякую. Зараз мені просто цікаво одне питання. Для статистиків чи всі статистичні моделі повинні мати частину висновку, наприклад, довірчий інтервал чи перевірку гіпотез, а отже, базуватися на ймовірнісних моделях? В іншому випадку вони лише маніпулюють набором даних шляхом побудови графіків та узагальнення.
Гонгланг Ван

9

Статистика виводить з даних; Інформація працює на даних. Вони, звичайно, перетинаються, але на питання, яке має ширший обсяг, немає відповіді.


"Статистика отримує дані; інформатика працює на даних." Це дійсно те, що я хочу підтвердити. Для висновку, який завжди базується на розподілі ймовірностей, він повинен включати довірчий інтервал або тестування гіпотез. В іншому випадку ви просто працюєте над даними.
Гонгланг Ван
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.