Я працюю над створенням набору VM для експерименту зі Spark, перш ніж витрачати гроші та витрачати гроші на створення кластеру з деяким обладнанням. Коротка примітка: Я є вченим з досвідом прикладного машинного навчання і трохи пішов з науки про дані. Я використовую інструменти для обчислень, рідко мені знадобиться їх налаштувати.
Я створив 3 VM (1 майстер, 2 раби) і встановив Spark успішно. Здається, все працює як слід. Моя проблема полягає у створенні сервера Jupyter, до якого можна підключитись із браузера, який не працює на машині кластера.
Я успішно встановив ноутбук Юпітер ... і він працює. Я додав новий профіль IPython, який з'єднується з віддаленим сервером за допомогою Spark.
тепер проблема
Команда
$ ipython --profile=pyspark
працює нормально, і він підключається до іскрового скупчення. Однак,
$ ipython notebook --profile=pyspark
[<stuff is here>] Unrecognized alias: "profile=pyspark", it will probably have no effect.
за замовчуванням для default
профілю, а не для pyspark
профілю.
Конфігурація мого ноутбука для pyspark
:
c = get_config()
c.NotebookApp.ip = '*'
c.NotebookApp.open_browser = False
c.NotebookApp.port = 8880
c.NotebookApp.server_extensions.append('ipyparallel.nbextension')
c.NotebookApp.password = u'some password is here'
$ ipython --profile=pyspark notebook
? Можливо, проблема полягала лише в порядку наведення аргументів.