Запитання з тегом «hadoop»

Hadoop - проект з відкритим кодом Apache, який пропонує програмне забезпечення для надійних та масштабованих розподілених обчислень. Ядро складається з розподіленої файлової системи (HDFS) та менеджера ресурсів (YARN). Різні інші проекти з відкритим кодом, такі як Apache Hive, використовують Apache Hadoop як стійкий шар.

21
Попередження Hadoop "Неможливо завантажити нативну бібліотеку hadoop для вашої платформи"
Наразі я налаштовую hadoop на сервері, на якому працює CentO . Під час запуску start-dfs.shабо stop-dfs.shя отримую таку помилку: УВАГА util.NativeCodeLoader: Не вдається завантажити нативну бібліотеку hadoop для вашої платформи ... використовуючи вбудовані Java-класи, де це можливо Я працюю Hadoop 2.2.0. Здійснення пошуку в Інтернеті підняло це посилання: http://balanceandbreath.blogspot.ca/2013/01/utilnativecodeloader-unable-to-load.html Однак …

19
Різниця між свинею та вуликом? Чому обоє? [зачинено]
Закрито . Це питання ґрунтується на думці . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб на нього можна було відповісти фактами та цитатами, відредагувавши цю публікацію . Закрито 4 роки тому . Удосконаліть це питання Моє передісторія - 4 тижні в світі Hadoop. Трохи попробовували у …
256 hadoop  hive  apache-pig 

8
Apache Spark: кількість ядер проти кількості виконавців
Я намагаюся зрозуміти взаємозв'язок кількості ядер та кількості виконавців під час виконання завдання Spark на YARN. Тестове середовище таке: Кількість вузлів даних: 3 Технічні характеристики вузла даних: Процесор: Core i7-4790 (кількість ядер: 4, кількість потоків: 8) ОЗУ: 32 ГБ (8 ГБ х 4) Жорсткий диск: 8 ТБ (2 ТБ х …

16
Коли використовувати Hadoop, HBase, вулик та свиню?
Які переваги використання Hadoop або HBase або вулика ? Наскільки я розумію, HBase уникає використання зменшення карт і має схоже на стовпчик сховище поверх HDFS. Hive - це інтерфейс, схожий на sql, для Hadoop та HBase . Я також хотів би знати, як вулик порівнює зі Свині .
185 hadoop  hbase  hive  apache-pig 

15
Як вимкнути журнал INFO в Spark?
Я встановив Spark за допомогою посібника AWS EC2, і я можу запустити програму за допомогою bin/pysparkсценарію, щоб дістатися до іскрового підказка, а також можу успішно виконати Швидкий старт. Однак я не можу за все життя зрозуміти, як зупинити весь багатослівний INFOжурнал після кожної команди. Я спробував майже кожен можливий сценарій …

14
Іскра - завантажити файл CSV як DataFrame?
Я хотів би прочитати CSV в іскрі і перетворити його у DataFrame і зберігати його в HDFS df.registerTempTable("table_name") Я намагався: scala> val df = sqlContext.load("hdfs:///csv/file/dir/file.csv") Помилка, яку я отримав: java.lang.RuntimeException: hdfs:///csv/file/dir/file.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [49, 59, 54, …

3
Які плюси та мінуси формату паркету порівняно з іншими форматами?
Характеристики паркету Apache: Самоописування Стовпчастий формат Незалежна від мови У порівнянні з Avro, послідовними файлами, RC-файлами тощо, я хочу переглянути формати. Я вже читав: як працює Impala з форматами файлів Hadoop , вона дає деяку інформацію про формати, але я хотів би знати, як здійснюється доступ до даних та зберігання …
136 file  hadoop  hdfs  avro  parquet 


6
Різниця між HBase та Hadoop / HDFS
Це наївне питання, але я новачок у парадигмі NoSQL і не знаю багато про це. Тож якщо хтось може допомогти мені чітко зрозуміти різницю між HBase та Hadoop або якщо дати кілька покажчиків, які можуть допомогти мені зрозуміти різницю. До цього часу я провів деякі дослідження і відповідно. Наскільки я …
130 hadoop  nosql  hbase  hdfs  difference 


13
Об’єднання декількох завдань MapReduce в Hadoop
У багатьох ситуаціях із реального життя, коли ви застосовуєте MapReduce, остаточні алгоритми в кінцевому підсумку становлять кілька кроків MapReduce. тобто Map1, Reduce1, Map2, Reduce2 тощо. Таким чином, у вас є вихід з останнього зменшення, яке потрібне як вхід для наступної карти. Проміжні дані - це те, чого ви (загалом) не …
124 hadoop  mapreduce 


6
Як записи процесу Hadoop розбиваються на межі блоку?
Відповідно до Hadoop - The Definitive Guide Логічні записи, які визначають FileInputFormats, зазвичай не вписуються акуратно в блоки HDFS. Наприклад, логічні записи TextInputFormat - це рядки, які частіше за все перетинають межі HDFS. Це не стосується функціонування вашої програми - наприклад, рядки не пропущені або порушені, але про це варто …
119 hadoop  split  mapreduce  block  hdfs 

9
Яка мета переміщення та сортування фази редуктора в програмі зменшення карт?
У програмі Map Reduce скорочення фаза зменшення, сортування та зменшення є її підрозділами. Сортування - дорога справа. Яка мета переміщення та сортування фази редуктора в програмі зменшення карт?

18
Різниця між внутрішніми таблицями вуликів від зовнішніх таблиць?
Хто-небудь може сказати мені різницю між зовнішньою та внутрішньою таблицями Hive. Я знаю, що різниця виникає при опусканні столу. Я не розумію, що ви маєте на увазі під тим, що дані та метадані видаляються у внутрішніх, а лише метадані видаляються у зовнішніх таблицях. Хто-небудь може мені пояснити з точки зору …
110 hadoop  hive  hiveql 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.