Чи існує "привіт, світ" для статистичної графіки?


26

У комп’ютерному програмуванні існує класична перша програма для навчання / викладання нової мови чи системи, яка називається "привіт, світ". http://en.wikipedia.org/wiki/Hello_world_program

Чи існує класична перша візуалізація даних для використання графічного пакету? Якщо так, то що це? А як ні, то які б були хороші кандидати?


3
Ласкаво просимо на наш сайт! Наш попит часто запитує: "Ви повинні задавати лише практичні, відповідальні запитання на основі актуальних проблем, з якими ви стикаєтеся". Не могли б ви детальніше розібратися в тому, яка ваша справжня проблема?
whuber

3
Я хотів би визначити "стандартний тестовий предмет" для статистичної графіки, якщо такий існує, включити до навчального матеріалу, який я розробляю.
Авраам Д Флаксман

2
Оскільки графічні програми різняться настільки сильно, що важко уявити якусь стандартну або універсальну графіку. Там є деякі стандарти для певних типів Graphing пакетів, таких як історично відомих кроликами і чайники для 3D - графіки. Тоді, коли ваше питання буде відповідати, це допоможе йому бути більш конкретним щодо того, який пакет (и) буде призначений для покриття вашого навчального матеріалу.
whuber

1
Хороший момент, дякую. Я включу принаймні щось про статистичну графіку в R, STATA, Python та Javascript.
Авраам D Флаксман

@AbrahamDFlaxman Мені цікаво цей "навчальний матеріал" і хто і для чого він призначений. Ви можете сказати більше?
Пітер Флом - Відновіть Моніку

Відповіді:


9

Дві думки:

А. Коли я намагаюся зрозуміти суть "Hello World", це мінімум, що необхідно зробити мовою програмування, щоб створити дійсну програму, яка друкує один рядок тексту. Це говорить мені про те, що ваш "Hello World" має бути універсальним набором даних, найголовніше, що ви можете підключити до статистичної чи графічної програми.

B. Я не знаю жодної графіки "Hello World". Найближчим, до якого я можу підійти, є типові набори даних, які входять у різні статистичні пакети, такі як R-AirPassengers. У R графічний вислів Hello World буде таким:

plot (AirPassengers)  # Base graphics, prints line graph

або

qplot (AirPassengers) # ggplot2, prints a bar chart

або

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

Особисто я вважаю, що найпростіший графік - це лінійний графік, у якому N елементів у межах Y та X становить від 1: N. Але це не стандарт.


2
Консенсус цієї та інших відповідей полягає в тому, що в даний час не існує "привіт, світ" статистичної графіки. Я думаю, що ваша пропозиція про універсальний набір даних, з N елементів у Y та X, що варіюється від 1: N, є переконливою. В подальшому аналогії з "привіт, світ", було б непогано мати невеликий N і пам'ятний Y. Що ви думаєте про N = 5 і Y = (3,1,4,1,5,9) (тобто цифр пі)? Можливо, це занадто математично.
Авраам D Флаксман

1
@AbrahamDFlaxman: Я не думаю, що це математика, я думаю, що це здорово. Запам'ятовується, короткий, а графік - це не просто пряма лінія чи щось. Дані добре відомі і не пов'язані з будь-якою конкретною програмою, і їх можна довільно розширити всім бажаючим більше балів. Я за це голосую!
Уейн

24

Я, мабуть, почав би з розсіювачів і продемонстрував чотири потворні кореляції .


2
+1. Але ви можете розглянути щось трохи більш загальне, наприклад, якусь форму сюжетної лінії. Зрештою, як тільки ви зможете намалювати відрізок лінії, ви можете намалювати що завгодно . Це перегукується з ідеєю "Привіт, світ!": Як тільки ви зможете отримати читабельний вихід з програми, ви знаєте, що можете спілкуватися з комп'ютером, а решта - лише деталі :-). (Деталі можуть бути важкими . Під час навчання запису асемблерного коду для мейнфрейму IBM 360 найпростішим способом отримання виводу було зберігання його в оперативній пам’яті та створення помилки в кінці виконання, внаслідок чого система друкує шістнадцятковий дамп ядра !)
блуд

Я думаю, що в квартеті Anscombe в загальній складності міститься занадто багато, щоб використовуватись як "привіт, світ" статистичної графіки, але Рисунок 1 з його статті може бути хорошим кандидатом. З інших відповідей, однак, йдеться про універсальний набір даних, до якого я схиляюся.
Авраам D Флаксман

7

Гістограма зразка нормально розподіленої випадкової величини.


Мені подобається, як це виглядатиме, але, можливо, гістограми потребують більшої обробки даних, ніж розкидання, і придумати зразки з нормального розподілу можуть відволікати.
Авраам Д Флаксман

Я щойно помітив, що це перший приклад із веб-сторінки Matplotlib: matplotlib.org
Abraham D Flaxman

5

Я думаю, що відповідь - «ні». Тобто, взагалі немає узгодженої відповіді на ваше запитання.

@StasK вказує на розсіювач.

Але я б врахував, що plotробить R: Це залежить від даних!

Ви можете стверджувати, що одновимірні статистичні дані простіші, ніж двоваріантні. Отже ... мабуть, найосновніше - це гістограма; чи, можливо, барна ділянка; можливо, графік щільності.

Якщо точка "Привіт, світ!" це показати, що ти можеш змусити комп’ютер щось робити, то я б сказав, що будь-який сюжет зробив би.


1
Можливо, відсутність стандартного тестового елемента вказує на те, що ви правильні, і більш доцільно використовувати будь-який сюжет, найпростіший у демонструваній системі. Однак це ускладнює порівняння.
Авраам Д Флаксман

5

Не впевнений, чи точно він належить до привітного світу, але в R також є демонстрації, вбудовані у багато пакетів. напр

library(graphics)
demo(graphics)

буде переглядати користувача через деякі основні графіки, доступні в пакеті. Просто клацніть мишкою по кожному зображенню, щоб переглянути основні графічні ілюстрації. Всього за допомогою двох рядків користувач знайомиться з деякими надихаючими можливостями R-графіки для статистики.

Відповідний код для створення графіки відображається на консолі R.

введіть тут опис зображення


2

Я б сказав, що було дві програми типу "Hello World" для візуалізації даних:

Друк ("Hello World"): Щось на зразок гістограми звичайно розподіленої змінної чи, можливо, простого розсіювання X, Y.

Щось дещо складніше, як, наприклад, у розділі, де люди приймають принципи Hello World і починають грати з введенням користувача, символами втечі та подібним, я б сказав, що це буде грати з набором даних Iris.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.