Запитання з тегом «pyspark-sql»

13
Як змінити назви стовпців кадру даних у pyspark?
Я надходжу з фону панд, і я звик читати дані з файлів CSV у кадр даних, а потім просто змінювати імена стовпців на щось корисне за допомогою простої команди: df.columns = new_column_name_list Однак те ж не працює у фреймах даних pyspark, створених за допомогою sqlContext. Єдине рішення, з якого я …

9
показати різні значення стовпців у фреймі даних pyspark: python
Будь ласка, запропонуйте альтернативну структуру даних pyspark для Pandas df['col'].unique(). Я хочу перерахувати всі унікальні значення у стовпці pyspark dataframe. Не спосіб типу SQL (registertemplate, а потім SQL-запит для різних значень). Також мені це не потрібно groupby->countDistinct, натомість я хочу перевірити різні ЦІННОСТІ в цьому стовпці.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.