Ось сім кроків, щоб встановити іскру на Windows 10 і запустити її з python:
Крок 1: завантажте файл gz spark 2.2.0 tar (tape Archive) у будь-яку папку F за цим посиланням - https://spark.apache.org/downloads.html . Розпакуйте його та скопіюйте розпаковану папку у потрібну папку А. Перейменуйте папку spark-2.2.0-bin-hadoop2.7 на spark.
Нехай шлях до папки spark буде C: \ Users \ Desktop \ A \ spark
Крок 2: завантажте файл hardoop 2.7.3 tar gz до тієї ж папки F за цим посиланням - https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.3/hadoop-2.7 .3.tar.gz . Розпакуйте його та скопіюйте розпаковану папку в ту саму папку A. Перейменуйте назву папки з Hadoop-2.7.3.tar на hadoop. Нехай шлях до папки hadoop буде C: \ Users \ Desktop \ A \ hadoop
Крок 3: Створіть новий текстовий файл блокнота. Збережіть цей порожній файл блокнота як winutils.exe (із типом Зберегти як: Усі файли). Скопіюйте цей файл O KB winutils.exe у вашу папку bin у Spark - C: \ Users \ Desktop \ A \ spark \ bin
Крок 4: Тепер ми повинні додати ці папки до системного середовища.
4a: Створіть системну змінну (не змінна користувача, оскільки змінна користувача успадкує всі властивості системної змінної) Ім'я змінної: SPARK_HOME Значення змінної: C: \ Users \ Desktop \ A \ spark
Знайдіть системну змінну Path і натисніть редагувати. Ви побачите кілька шляхів. Не видаляйте жоден із шляхів. Додайте це значення змінної -; C: \ Users \ Desktop \ A \ spark \ bin
4b: Створення системної змінної
Ім'я змінної: HADOOP_HOME Значення змінної: C: \ Users \ Desktop \ A \ hadoop
Знайдіть системну змінну Path і натисніть редагувати. Додайте це значення змінної -; C: \ Users \ Desktop \ A \ hadoop \ bin
4c: Створіть системну змінну Ім'я змінної: JAVA_HOME Шукати Java у вікнах. Клацніть правою кнопкою миші та клацніть відкрите розташування файлу. Вам доведеться ще раз клацнути правою кнопкою миші на будь-якому з файлів Java та клацнути на відкритому розташуванні файлу. Ви будете використовувати шлях до цієї папки. АБО ви можете шукати C: \ Program Files \ Java. Моя версія Java, встановлена в системі, - jre1.8.0_131. Значення змінної: C: \ Program Files \ Java \ jre1.8.0_131 \ bin
Знайдіть системну змінну Path і натисніть редагувати. Додайте це значення змінної -; C: \ Program Files \ Java \ jre1.8.0_131 \ bin
Крок 5: Відкрийте командний рядок і перейдіть до папки "іскровий бен" (введіть cd C: \ Users \ Desktop \ A \ spark \ bin). Тип іскрова оболонка.
C:\Users\Desktop\A\spark\bin>spark-shell
Це може зайняти час і дати деякі попередження. Нарешті, буде показано запрошення до версії 2.2.0
Крок 6: Введіть exit () або перезапустіть командний рядок і знову перейдіть до папки spark bin. Введіть піспарк:
C:\Users\Desktop\A\spark\bin>pyspark
Він буде відображати деякі попередження та помилки, але ігнорувати. Це працює.
Крок 7: Завантаження завершено. Якщо ви хочете безпосередньо запустити іскру з оболонки python, перейдіть до Сценарії у вашій папці python і введіть
pip install findspark
в командному рядку.
У оболонці python
import findspark
findspark.init()
імпортувати необхідні модулі
from pyspark import SparkContext
from pyspark import SparkConf
Якщо ви хочете пропустити кроки для імпорту findspark та його ініціалізації, будь ласка, виконайте процедуру, вказану при
імпорті pyspark у оболонці python