Чим відрізняються дискретні дані від безперервних даних?


62

Чим відрізняються дискретні дані від безперервних даних?


2
Ви спробували спочатку Google? Для мене це дає це .
Робін Жирард

Ось приємне відео, яке відповідає на ваше запитання. youtube.com/watch?v=MIX3ZpzEOdM

2
Просто подумайте цифровий проти аналоговий. Те саме - різні назви.
Пітікос

Я справді не знаю, в чому різниця між "дискретними" та "безперервними" даними. З якихось причин вступні уроки статистики справді сподобаються, щоб учні запам’ятовували правила для розмежування цих двох речей. Наскільки я зміг зрозуміти, відмінності полягають не в даних, а в тому, як ми вирішимо моделювати дані.
user795305

1
Це був найкращий результат в Google, @robingirard.
денсон

Відповіді:


58

Дискретні дані можуть приймати лише певні значення. Можливо, може бути нескінченна кількість цих значень, але кожне є виразним і між ними немає сірої області. Дискретні дані можуть бути числовими, як число яблук, але вони можуть бути і категоричними - як червоні чи сині, або чоловічі, або жіночі, або добрі чи погані.

Безперервні дані не обмежуються визначеними окремими значеннями, але можуть займати будь-яке значення у безперервному діапазоні. Між будь-якими двома безперервними значеннями даних може бути нескінченна кількість інших. Безперервні дані завжди по суті числові.

Іноді має сенс трактувати числові дані, що належать до одного типу, як до іншого. Наприклад, щось на кшталт висоти є безперервним, але часто нас не надто переймають крихітні перепади, а натомість групують висоти в кілька дискретних бункерів . І навпаки, якщо ми підраховуємо велику кількість якоїсь окремої сутності - зерна рису, терміти чи копійки в економіці - ми можемо вирішити не вважати 2 000 006 і 2 000 008 як принципово різними значеннями, а замість того, як сусідні точки на приблизний континуум.

Також іноді може бути корисно трактувати числові дані як категоричні, наприклад: недостатні ваги, нормальні, ожиріння. Зазвичай це просто інший вид поповнення.

Рідко має сенс розглядати категоричні дані як безперервні.


@walktalky як @jeromy натякає на, принаймні, в психології, категоріальні змінні, такі як відповіді на запитання, часто вважаються репрезентацією основної ознаки, тому в цьому сенсі категоріальні дані іноді приймаються як постійні.
richiemorrisroe

@richiemorrisroe Не можна було б розібратися про різницю між даними та ймовірною ознакою, але, звичайно, ти маєш рацію. У відповідь на це подальше запитання було зроблено кілька дуже цікавих подальших питань .
walkytalky

дякую за посилання, ці відповіді дійсно дуже цікаві.
richiemorrisroe

> " Можливо, може бути нескінченна кількість цих значень, але кожне є виразним і між ними немає сірої області " - насправді цілком можливо дискретний розподіл з чіткими значеннями, і все ж одночасно для будь-яких двох вибірні значення, які ви вибираєте, завжди мають більше значень між ними ("сенс сірого" в певному сенсі). Вони на практиці не придумують все так часто, але цілком можливо для них реально придумати; Дійсно, я можу придумати два чіткі (якщо пов'язані) приклади, які легко виникають.
Glen_b

щоб уточнити, навіть якби у вас було 10 мільярдів рядків даних Ohlc для акціонерного активу, це все одно вважатиметься дискретним? але тоді не можна, щоб ціна активу була будь-якою від 1 до нескінченності, як думати в такому типі ситуації?
PirateApp

19

Дані завжди дискретні. З огляду на вибірку nзначень змінної, максимальна кількість різних значень, яку може приймати змінна, дорівнює n. Дивіться цю цитату

Усі фактичні пробні простори дискретні, і всі видимі випадкові змінні мають дискретні розподіли. Безперервний розподіл - це математична конструкція, придатна для математичного лікування, але практично не спостерігається. EJG Pitman (1979, с. 1).

Дані про змінну, як правило, прийнято черпати з випадкової змінної. Випадкова величина є безперервною у межах діапазону, якщо існує нескінченна кількість можливих значень, які змінна може приймати між будь-якими двома різними точками в діапазоні. Наприклад, висота, вага та час зазвичай вважаються суцільними. Звичайно, будь-яке вимірювання цих змінних буде гранично точним і в деякому сенсі дискретним.

Корисно розрізняти впорядковані (тобто порядкові), не упорядковані (тобто номінальні)
та бінарні дискретні змінні.

Деякі вступні підручники плутають суцільну змінну з числовою змінною. Наприклад, оцінка в комп'ютерній грі є дискретною, хоча вона є числовою.

Деякі вступні підручники плутають змінну співвідношення із суцільними змінними. Змінна кількість - це змінна коефіцієнт, але вона не є суцільною.

У фактичній практиці змінна часто трактується як безперервна, коли вона може приймати досить велику кількість різних значень.

Список літератури

  • Pitman, EJG 1979. Деякі основні теорії для статистичного висновку. Лондон: Чапман і Холл. Примітка. Цю цитату я знайшов у вступі до глави 2 книги Мюррея Еткіна Статистичні умовиводи: інтегрований байєсівський / імовірнісний підхід

12
Ймовірність теж є "математичною конструкцією", а не "безпосередньо спостережливою". Чи означає це, що ймовірності не існує? В цілому, це цікава відповідь , здається , на основі неспроможною передумові , що дані повинні бути охарактеризоване значеннями , вони дійсно є , а не значеннями математична модель дозволяє їм мати. Останнє є вирішальною характеристикою, а не першою. Все це говорить про те, що важливо в постійному / дискретному розрізненні - це те, як ми думаємо про дані (тобто як ми моделюємо їх).
whuber

3
Існує розумна маленька байка, що ілюструє точку @ whuber: Лорд (1953), "Про статистичну обробку футбольних чисел", American Psychologist , 8 , pp750-51.
Scortchi

Дякую, @ Scortchi. Веб-версії доступні через пошук науковців Google . Лорд вирішує помилкове уявлення, гаряче обговорене 60 років тому, про те, наскільки "теорія вимірювань" повинна впливати (а то й обмежувати сферу) статистичного аналізу. Моя думка була іншою щодо розрізнення модельних конструкцій та спостережень.
whuber

12

Температури безперервні. Це може бути 23 градуси, 23,1 градус, 23,100004 градуси.

Секс дискретний. Ви можете бути тільки чоловіком або жінкою (у класичному мисленні все одно). Щось ви могли б представляти цілою кількістю, наприклад, 1, 2 тощо

Різниця важлива, оскільки багато алгоритмів статистики та обміну даними можуть обробляти один тип, а не інший. Наприклад, у регулярній регресії Y має бути безперервним. У логістичній регресії Y дискретний.


5
Y

8

Дискретні дані можуть приймати лише певні значення.

Приклад: кількість учнів у класі (не можна мати половину учня).

Постійні дані - це дані, які можуть приймати будь-яке значення (в межах діапазону)

Приклади:

  • Зріст людини: може бути будь-яка цінність (у межах людської висоти), а не лише певні фіксовані висоти,
  • Час у гонці: ви навіть можете виміряти його на частки секунди,
  • Вага собаки,
  • Довжина листка,
  • Вага людини,

2
Ви також можете сказати нам, куди ви скопіювали відповіді, вставлені з: mathsisfun.com/data/data-discrete-continuous.html
philmcole

Чудово описано.
Арсман Ахмад

0

Що стосується бази даних, ми б завжди зберігали дані дискретно, навіть характер даних є безперервним. Чому слід наголосити на характері даних? Ми повинні взяти на себе розподіл даних, які могли б допомогти нам проаналізувати дані. ЯКЩО характер даних неперервний, я пропоную вам використовувати їх шляхом постійного аналізу.

Візьмемо приклад безперервного та дискретного: MP3. Навіть тип "звуку" є аналогією, якщо він зберігається в цифровому форматі. Ми повинні аналізувати це завжди аналогічно.


0

З одного боку, з практичної точки зору я згоден з відповіддю Джеромі Англіма. Зрештою, ми більшість часу маємо справу з дискретними змінними, хоча з теоретичної точки зору вони є безперервними - і це має реальний вплив, наприклад, на класифікацію. Нагадаємо, документ Стробля вказує на те, що випадкові ліси є упередженими до змінних з декількома точками різання (більша точність, але потенційно схожа природа). З мого особистого досвіду ймовірнісні нейронні мережі можуть також представляти зміщення, коли змінні мають різну точність, якщо вони не є однотипними (тобто безперервними). З іншого боку, з теоретичної точки зору класична класифікація (наприклад, безперервна, дискретна, номінальна тощо) - це IMHO, правильно. Відповідно, я думаю, що назва джерела статті Quinlan, що описує алгоритм M5, який є "регресором" - це чудовий вибір. Отже, визначення та наслідки безперервного проти дискретного є актуальними залежно від "середовища".

Відгуки:

Quinlan JR (1992). Навчання за допомогою безперервних занять. В: П'ята спільна конференція Австралії з питань ІІІ. Сідней (Австралія), 343–348.

Strobl C., Boulesteix A.-L., Zeileis A., & Hothorn T. (2007). Зміщення у випадкових лісових заходах змінної важливості: ілюстрації, джерела та рішення. BMC Bioinformatics, 8, 25. doi: 10.1186 / 1471-2105-8-25


-1

Дискретні дані приймають окремі значення, тоді як безперервні дані не обмежуються окремими значеннями.

Дискретні дані є чіткими і між ними немає сірої області, тоді як безперервні дані займають будь-яке значення над суцільним значенням даних.


-2

Дискретні дані Вони можуть приймати окремі значення. Вони числові.


Ласкаво просимо в CV! Дякуємо за відповідь, але, будь ласка, знайдіть час, щоб переглянути попередні відповіді та врахувати, чи додаєте ви щось корисне.
Scortchi

-3

Дискретні дані можуть приймати лише цілі значення, тоді як безперервні дані можуть приймати будь-яке значення. Наприклад, кількість хворих на рак, які лікуються в лікарні щороку, є дискретною, але ваша вага є постійним. Деякі дані є суцільними, але вимірюються дискретно, наприклад, ваш вік. Як правило, повідомляють про свій вік 31 рік.


11
Дані можуть бути дискретними, не обмежуючись цілими числами. Або цифри, з цього приводу. Завжди можна представляти дискретні дані цілими числами, але це не означає, що дані можуть приймати лише такі значення.
walkytalky

-4

Дискретні дані пертикулярно говорять про кінцеві значення, а безперервні дані - про значення ifinite .....


2
Хочете допрацювати?
chl
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.