Я отримав те саме питання щодо автономної іскри у вікнах . Моя версія виправлення така: у мене для змінних середовища було встановлено як нижче
PYSPARK_SUBMIT_ARGS="pyspark-shell"
PYSPARK_DRIVER_PYTHON=jupyter
PYSPARK_DRIVER_PYTHON_OPTS='notebook' pyspark
За допомогою цього налаштування я виконав Action на pyspark і отримав наступний виняток:
Python in worker has different version 3.6 than that in driver 3.5, PySpark cannot run with different minor versions.
Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set.
Щоб перевірити, з якою версією python використовує мій spark-worker , натисніть наступне в підказці cmd .
python --version
Python 3.6.3
який показав мені Python 3.6.3 . Очевидно, що мій працівник іскри використовує системний python, який є v3.6.3.
Тепер, коли я встановив свій драйвер іскри на запуск jupyter, встановивши, PYSPARK_DRIVER_PYTHON=jupyter
мені потрібно перевірити версію python, яку використовує jupyter.
Для цього відкрийте підказку Anaconda і натисніть
python --version
Python 3.5.X :: Anaconda, Inc.
Тут отримав jupyter Пітон з допомогою v3.5.x . Ви можете перевірити цю версію також у будь-якому блокноті (Довідка-> Про мене).
Тепер мені потрібно оновити python jupyter до версії v3.6.6 . Для цього відкрийте підказку Anaconda і натисніть
conda пошук python
Це дасть вам список доступних версій python в Anaconda. Встановіть бажаний за допомогою
conda встановити python = 3.6.3
Тепер у мене встановлено обидві версії Python тієї ж версії 3.6.3. Spark не повинен відповідати і не відповідав, коли я запускав Action на драйвері Spark. Виняток зник. Щасливого кодування ...