Немає підстав переглядати весь вихід великого фрейму даних. Перегляд або маніпулювання великими кадрами даних зайво використовуватиме велику кількість ваших комп'ютерних ресурсів.
Все, що ви робите, можна зробити мініатюрним. Набагато простіше працювати над кодуванням та маніпулюванням даними, коли кадр даних невеликий. Найкращий спосіб роботи з великими даними - це створити новий кадр даних, який займає лише невелику частину або невелику вибірку великого кадру даних. Потім ви можете вивчити дані та зробити кодування на меншому кадрі даних. Після того, як ви вивчили дані та налагодите роботу коду, просто використовуйте цей код на більшому кадрі даних.
Найпростіше - просто взяти перший n, номер перших рядків з кадру даних за допомогою функції head (). Функція головки друкує лише n, кількість рядків. Можна створити міні-кадр даних, використовуючи головну функцію на великому кадрі даних. Нижче я обрав перші 50 рядків і передав їх значення малому файлу. Це передбачає, що BigData - це файл даних, який надходить з бібліотеки, яку ви відкрили для цього проекту.
library(namedPackage)
df <- data.frame(BigData) # Assign big data to df
small_df <- head(df, 50) # Assign the first 50 rows to small_df
Це буде працювати більшу частину часу, але іноді великий кадр даних поставляється з обраними змінними або зі змінними вже згрупованими. Якщо великі дані є такими, вам потрібно буде взяти випадкову вибірку рядків з великих даних. Потім використовуйте наступний код:
df <- data.frame(BigData)
set.seed(1016) # set your own seed
df_small <- df[sample(nrow(df),replace=F,size=.03*nrow(df)),] # samples 3% rows
df_small # much smaller df