Програмування azure-databricks

Apache Spark: вплив переділу, сортування та кешування на з'єднання

Я вивчаю поведінку Спарка під час приєднання таблиці до себе. Я використовую Databricks. Мій фіктивний сценарій: Читання зовнішньої таблиці як фрейму A (основні файли у форматі delta) Визначте фрейм даних B як кадр даних A із вибраними лише певними стовпцями З'єднайте фрейми даних A і B у колонці1 та колонці2 …

10 apache-spark pyspark bigdata azure-databricks delta-lake

Запитання з тегом «azure-databricks»