Es un algoritmo supervisado utilizado para clasificación binaria. Calcula la probabilidad de que un dato pertenezca a una categoría específica.
donde .
P(y=1)=11+e−zP(y=1) = \\frac{1}{1 + e^{-z}}
z=w⋅x+bz = w \\cdot x + b
Pendiente de desarrollo. Se sugiere usar:
LogisticRegression de scikit-learn.Codigo
from sklearn.linear_model import LogisticRegression
df = pd.read_csv("datos_seguro.csv")
plt.scatter(df["edad"], df["compra"])
X_train, X_test, y_train,y_test = train_test_split(df[["edad"]], df["compra"], train_size=0.9)
regrersion = LogisticRegression()
regrersion.fit(X_train, y_train)
predict = regrersion.predict(X_test)
regrersion.score(X_train, y_train) *100
plt.scatter(df["edad"], df["compra"])
plt.scatter(X_test, predict, color='r')
probabilidades = regrersion.predict_proba(np.arange(25,55,5).reshape(-1,1)) # provabilidades
np.arange(25,55,5) , probabilidades[:,1]
plt.scatter(df["edad"], df["compra"])
plt.scatter(X_test, predict, color='r')
plt.scatter(np.arange(25,55,5), probabilidades[:,1])
Predecir si una persona comprará un producto basado en su edad utilizando regresión logística.