Можливо, це корисно для деяких людей, які поділяють таке ж інтуїтивне розуміння. Ми всі бачили щось подібне:
Ці дані, ймовірно, незалежні, але чітко виявляють кореляцію (r = 0,66). "Я думав, що незалежність передбачає нульову кореляцію!" каже студент.
Як вже вказували інші, значення вибірки співвідносяться, але це не означає, що у населення існує ненульова кореляція.
Звичайно, ці двоє мають бути незалежними - якщо Ніколас Кейдж з'явився в 10-ти фільмів цього року, ми не повинні закривати місцевий басейн на літо з метою безпеки.
Але коли ми перевіряємо, скільки людей потонуло цього року, є невелика ймовірність, що цього року потонуть рекордні 1000 людей.
Отримати таку кореляцію малоймовірно. Можливо, одна з тисячі. Але це можливо, навіть якщо вони незалежні. Але це лише один випадок. Вважайте, що там можна відміряти мільйони можливих подій, і ви можете побачити шанс того, що шанси деяких двох, що трапляються, дають високу кореляцію, досить високі (отже, існування таких графіків, як вище).
Інший спосіб поглянути на це - те, що гарантування того, що два незалежні події завжди даватимуть непов'язані значення, саме по собі є обмежувальним. Враховуючи дві незалежні кістки та результати першої, існує певний (значний) набір результатів для другої кістки, який дасть певну ненульову кореляцію. Обмеження результатів другої кістки давати нульову кореляцію першому є явним порушенням незалежності, оскільки рулони перших кісток тепер впливають на розподіл результатів.