Я побудував Spark 1.4 від майстра розробки GH, і збірка пройшла нормально. Але коли я роблю a, bin/pyspark
я отримую версію Python 2.7.9. Як я можу це змінити?
Я побудував Spark 1.4 від майстра розробки GH, і збірка пройшла нормально. Але коли я роблю a, bin/pyspark
я отримую версію Python 2.7.9. Як я можу це змінити?
Відповіді:
Просто встановіть змінну середовища:
export PYSPARK_PYTHON=python3
якщо ви хочете, щоб це було постійною зміною, додайте цей рядок до сценарію pyspark.
export PYSPARK_PYTHON=python3.5
для Python 3.5
$SPARK_HOME/conf/spark-env.sh
так spark-submit
використовує той же перекладач , а також.
PYSPARK_PYTHON=python3
./bin/pyspark
Якщо ви хочете запустити програму IPython Notebook, напишіть:
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
Якщо python3
він недоступний, вам потрібно пройти шлях до нього.
Майте на увазі, що чинна документація (станом на 1.4.1) має застарілі інструкції. На щастя, його виправили .
Загляньте у файл. Рядок shebang, ймовірно, вказує на двійковий файл 'env', який шукає шлях до першого сумісного виконуваного файлу.
Ви можете змінити python на python3. Змініть env, щоб використовувати безпосередньо кодований двійковий файл python3. Або виконайте двійковий файл безпосередньо за допомогою python3 і опустіть рядок shebang.
PYSPARK_PYTHON
змінної середовища.
Для Jupyter Notebook відредагуйте spark-env.sh
файл, як показано нижче, з командного рядка
$ vi $SPARK_HOME/conf/spark-env.sh
Перейдіть до нижньої частини файлу та скопіюйте ці рядки
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
Потім просто запустіть наступну команду, щоб запустити pyspark у блокноті
$ pyspark
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
в цьому випадку він запускає ноутбук IPython 3.