У мене є pandas
кадр даних, і я хотів би мати можливість передбачити значення стовпця A за значеннями у стовпцях B і C. Ось іграшковий приклад:
import pandas as pd
df = pd.DataFrame({"A": [10,20,30,40,50],
"B": [20, 30, 10, 40, 50],
"C": [32, 234, 23, 23, 42523]})
В ідеалі я мав би щось на кшталт, ols(A ~ B + C, data = df)
але коли я дивлюсь на приклади з бібліотек алгоритмів, схоже, що scikit-learn
вони подають дані в модель зі списком рядків замість стовпців. Це вимагає від мене переформатування даних у списки всередині списків, що, здається, в першу чергу перешкоджає використанню панд. Що є найбільш пітонічним способом запустити регресію OLS (або будь-який алгоритм машинного навчання загалом) для даних у кадрі даних панди?
formula
, я випадково набравformulas
натомість і отримав дивну помилку:TypeError: from_formula() takes at least 3 arguments (2 given)