I den här bloggen kommer vi att diskutera de grundläggande begreppen för logistisk regression och vilken typ av problem den kan hjälpa oss att lösa.
Logistisk regression är en klassificeringsalgoritm som används för att tilldela observationer till en diskret uppsättning klasser. Några exempel på klassificeringsproblem är skräppost eller inte skräppost, bedrägeri eller inte bedrägeri vid online-transaktioner, malign eller godartad tumör. Logistisk regression omvandlar sitt resultat med hjälp av den logistiska sigmoidfunktionen för att returnera ett sannolikhetsvärde.
Multilinjära funktioner failsClass (t.ex. Cats, dogs or Sheep’s)
Logistisk regression
Logistisk regression är en algoritm för maskininlärning som används för klassificeringsproblem, det är en algoritm för prediktiv analys och bygger på begreppet sannolikhet.
Vi kan kalla en logistisk regression för en linjär regressionsmodell, men den logistiska regressionen använder en mer komplex kostnadsfunktion, denna kostnadsfunktion kan definieras som ”Sigmoid-funktionen” eller även känd som ”logistisk funktion” i stället för en linjär funktion.
Hypotesen för logistisk regression tenderar att begränsa kostnadsfunktionen mellan 0 och 1. Därför kan linjära funktioner inte representera den eftersom den kan ha ett värde som är större än 1 eller mindre än 0, vilket inte är möjligt enligt hypotesen för logistisk regression.
Vad är Sigmoid-funktionen?
För att kartlägga förutsagda värden till sannolikheter använder vi Sigmoid-funktionen. Funktionen mappar varje verkligt värde till ett annat värde mellan 0 och 1. Inom maskininlärning använder vi Sigmoid för att mappa förutsägelser till sannolikheter.
För logistisk regression definieras kostnadsfunktionen som: