Regresion logistica

2. Regresión Logística

¿Qué es la regresión logística?

Es un algoritmo supervisado utilizado para clasificación binaria. Calcula la probabilidad de que un dato pertenezca a una categoría específica.

Características principales:

Salida: Valores entre 0 y 1.
Función sigmoide para modelar las probabilidades:

donde .

P(y=1)=11+e−zP(y=1) = \\frac{1}{1 + e^{-z}}

z=w⋅x+bz = w \\cdot x + b

Implementación (en el archivo):

Pendiente de desarrollo. Se sugiere usar:

LogisticRegression de scikit-learn.
Datos categóricos para probar clasificaciones binarias.

Codigo

from sklearn.linear_model import LogisticRegression
df = pd.read_csv("datos_seguro.csv")
plt.scatter(df["edad"], df["compra"])
X_train, X_test, y_train,y_test = train_test_split(df[["edad"]], df["compra"], train_size=0.9)
regrersion = LogisticRegression()
regrersion.fit(X_train, y_train)
predict  = regrersion.predict(X_test)
regrersion.score(X_train, y_train) *100
plt.scatter(df["edad"], df["compra"])
plt.scatter(X_test, predict, color='r')
probabilidades = regrersion.predict_proba(np.arange(25,55,5).reshape(-1,1)) # provabilidades
np.arange(25,55,5) ,  probabilidades[:,1]
plt.scatter(df["edad"], df["compra"])
plt.scatter(X_test, predict, color='r')
plt.scatter(np.arange(25,55,5), probabilidades[:,1])

Regresión Logística con Python y Scikit-learn

Objetivo:

Predecir si una persona comprará un producto basado en su edad utilizando regresión logística.