У мене є програма для іскрового потокового передавання, яка виробляє набір даних на кожну хвилину. Мені потрібно зберегти / перезаписати результати оброблюваних даних.
Коли я намагався замінити набір даних org.apache.hadoop.mapred.FileAlreadyExistsException, зупиняє виконання.
Я встановив властивість Spark set("spark.files.overwrite","true")
, але немає удачі.
Як перезаписати або попередньо виділити файли з іскри?
set("spark.files.overwrite","true")
працює тільки для файлів доданий Повсюдноspark.addFile()