Хорошими назвами змінних є:
а) коротка / проста введення,
б) легко запам'ятовується,
в) зрозуміла / комунікативна.
Я щось забуваю? Послідовність - це щось шукати. Я б сказав, що послідовні конвенції про іменування сприяють вищезгаданим якостям. Послідовність сприяє (б) простоті пригадування та (в) зрозумілості, хоча інші фактори часто важливіші. Існує чіткий компроміс між (a) довжиною іменем / простотою введення тексту (наприклад, всі малі літери) та (c) зрозумілістю.
Я вкладаю досить багато думок у ці питання, тому що тисячі людей використовують дані, і я сподіваюся, що багато хто використовуватиме мій код для підготовки даних та полегшення деяких видів аналізу. Дані, отримані з довгого вивчення здоров'я здоров'я підлітків, розбиті на декілька наборів даних. Першим моїм кроком було взяти 227 змінних у найбільш часто використовуваному наборі даних, перекодувати їх, дати їм більш значущі імена. Оригінальні назви змінних - такі речі, як "допомога", "s1", "s2", які я перейменував у "aid2", "age" та "male.is". В інших наборах даних є тисячі інших змінних, які можуть бути об'єднані залежно від цілей дослідника.
Поки я перейменую змінні, я хочу зробити їх максимально корисними. Ось деякі питання, які я розглядав. Поки що я використовував лише малі регістри та уникав використання будь-яких тире чи підкреслення, і я використовував лише періоди для однієї дуже конкретної мети. Це має силу простоти та послідовності та не створює проблем для більшості змінних. Але оскільки речі стають складнішими, я спокушаюся порушити свою послідовність. Візьмемо, наприклад, мій змінний "talkprobmsum", його було б легше читати як "talkProbMSum" або ще краще "talk.prob.m.sum", але якщо я буду використовувати великі літери або крапки для розділення слів, то я не повинен робити це для всіх змінних?
Деякі змінні реєструються більше, ніж один раз, наприклад, змінні перегони, тому я додав .is або .ih, щоб вказати, що вони надходять із анкети в школі чи вдома. Але напевно є деякі повтори, про які я ще не знаю, чи було б краще додати посилання до набору даних до імені кожної змінної?
Мені потрібно згрупувати центр і стандартизувати багато змінних, як я це робив, додаючи .zms, що означає z-оцінка чоловіків та шкіл.
Будь-які загальні чи конкретні думки чи ресурси високо оцінюються. Дивіться у цьому сховищі деякий мій код та описову статистику зі списком змінних імен. Я коротко описав причину спільного використання цього коду тут , і він був трохи оприлюднений тут , але ці два останні посилання насправді не стосуються питання конвенцій про іменування змінних. Додано: Я редагував це легенько, в основному просто переміщуючи абзац, щоб спробувати уникнути певної плутанини, помітної в коментарях. Дякую за думки!
Додано 05.09.2016: Варто відзначити посібник зі стилів R Хедлі Вікхема та керівництво Google щодо стилю R ... Хедлі говорить:
Імена змінних та функцій повинні бути малими літерами. Використовуйте підкреслення (_), щоб розділити слова в імені.
Google каже:
Не використовуйте підкреслення (_) або дефіси (-) в ідентифікаторах. Ідентифікатори повинні бути названі згідно з наступними умовами. Кращою формою для імен змінних є всі маленькі літери та слова, розділені крапками (змінною. ім'я), але також приймається змінна назва; назви функцій мають початкові великі літери та відсутні крапки (FunctionName); константи називаються як функції, але з початковою k.
R
, а про відповідні практики документування та використання даних.