Skirtumas tarp tiesinės regresijos ir logistinės regresijos - Skirtumas Tarp

Skirtumas tarp tiesinės regresijos ir logistinės regresijos

The pagrindinis skirtumas tarp linijinės regresijos ir logistinės regresijos yra ta, kad linijinė regresija naudojama nepertraukiamai vertei prognozuoti, o logistinė regresija naudojama diskretinei vertei prognozuoti.

Mašinų mokymosi sistemos gali numatyti būsimus rezultatus, pagrįstus ankstesnių sąnaudų mokymu. Yra du pagrindiniai mašinų mokymosi tipai, vadinami prižiūrimu mokymu ir be priežiūros. Regresija ir klasifikacija patenka į prižiūrimą mokymąsi, o klasterizacija patenka į nekontroliuojamą mokymąsi. Prižiūrimi mokymosi algoritmai naudoja pažymėtus duomenis duomenų rinkimui mokyti. Linijinė regresija ir logistinė regresija yra dviejų tipų prižiūrimi mokymosi algoritmai. Linijinė regresija naudojama, kai priklausomas kintamasis yra nepertraukiamas, o modelis yra tiesinis. Logistinė regresija naudojama, kai priklausomas kintamasis yra diskretiškas, o modelis yra netiesinis.

Pagrindinės sritys

1. Kas yra tiesinė regresija
- Apibrėžimas, funkcionalumas
2. Kas yra logistinė regresija
- Apibrėžimas, funkcionalumas
3. Skirtumas tarp tiesinės regresijos ir logistinės regresijos
- Pagrindinių skirtumų palyginimas

Pagrindinės sąlygos

Linijinė regresija, logistinė regresija, mašinų mokymasis


Kas yra tiesinė regresija

Linijinė regresija nustato santykį tarp nepriklausomų ir priklausomų kintamųjų. Abi jos yra gretimos. Nepriklausomas kintamasis yra kintamasis, kurio nepakeičia kiti kintamieji. Jis žymimas x. Taip pat gali būti keli nepriklausomi kintamieji, tokie kaip x1, x2, x3 ir pan. Priklausomi kintamieji keičiasi pagal nepriklausomą kintamąjį ir yra žymimi y.

Kai yra vienas nepriklausomas kintamasis, regresijos lygtis yra tokia.

y = b0 + b1x

Pavyzdžiui, darome prielaidą, kad x reiškia kritulių kiekį ir y reiškia pasėlių derlių.


1 pav. Linijinė regresija

Duomenų rinkinys atrodys aukščiau. Tada pasirinkta eilutė, apimanti daugumą duomenų taškų. Ši eilutė atspindi numatomas vertes.


2 pav. Atstumas tarp faktinių duomenų taškų ir numatomų verčių

Tada atstumas nuo kiekvieno duomenų taško iki linijos randamas kaip parodyta aukščiau esančiame grafike. Tai atstumas tarp tikrosios vertės ir numatomos vertės. Šis atstumas taip pat žinomas kaip klaida arba liekanos. Geriausia tinkama linija turėtų turėti mažiausiai klaidų kvadratų sumą. Pateikiant naują kritulių kiekį (x), galima rasti atitinkamą pasėlių derlių (y), naudojant šią liniją.

Realiame pasaulyje gali būti keli nepriklausomi kintamieji (x1, x2, x3…). Tai vadinama kelių linijine regresija. Daugialypė linijinė regresijos lygtis yra tokia.

Kas yra logistinė regresija

Logistinę regresiją galima naudoti dviejų klasių klasifikavimui. Jis taip pat žinomas kaip binarinė klasifikacija. Kiti logistinės regresijos pavyzdžiai - tikrinimas, ar el. Laiškas yra šlamštas, ar ne prognozavimas, ar klientas įsigys produktą, ar ne, prognozuoja, ar galima gauti reklamą, ar ne.


3 pav. Logistinė regresija

Tarkime, kad valandų, kurias studentas studijuoja per dieną, skaičius yra nepriklausomas kintamasis. Priklausomai nuo to, apskaičiuojama egzamino pasibaigimo tikimybė. Vertė 0,5, laikoma riba. Kai suteikiamas naujas valandų skaičius, galima rasti atitinkamą egzaminą per šią diagramą. Jei tikimybė yra didesnė kaip 0,5, ji laikoma 1 arba perduodama. Jei tikimybė yra mažesnė nei 0,5, tai laikoma 0 arba nepavyksta.

Linijinės regresijos lygties taikymas sigmoidinei funkcijai suteiks logistinės regresijos lygtį.

Sigmoidinė funkcija yra


Kitas svarbus dalykas, kurį reikia pažymėti, yra ta, kad logistinė regresija taikoma tik 2 klasėms klasifikuoti. Jis nenaudojamas daugiaklasių klasifikavimui.

Skirtumas tarp tiesinės regresijos ir logistinės regresijos

Apibrėžimas

Tiesinė regresija yra tiesinis metodas, kuris modeliuoja priklausomo kintamojo ir vieno ar daugiau nepriklausomų kintamųjų santykį. Priešingai, logistinė regresija yra statistinis modelis, kuris numato tikimybę, kad rezultatas gali turėti tik dvi reikšmes.

Naudojimas

Regresijos problemoms spręsti naudojama linijinė regresija, tačiau klasifikavimo problemoms spręsti sprendžiama logistinė regresija (dvejetainė klasifikacija).

Metodika

Linijinė regresija įvertina priklausomą kintamąjį, kai pasikeičia nepriklausomas kintamasis. Logistinė regresija apskaičiuoja įvykio galimybę. Tai vienas svarbus skirtumas tarp linijinės regresijos ir logistinės regresijos.

Išėjimo vertė

Be to, tiesinės regresijos metu išėjimo vertė yra nepertraukiama. Logistinėje regresijoje išėjimo vertė yra atskira.

Modelis

Nors tiesinė regresija naudoja tiesią liniją, logistinė regresija naudoja S kreivę arba sigmoidinę funkciją. Tai dar vienas svarbus skirtumas tarp tiesinės regresijos ir logistinės regresijos.

Pavyzdžiai

Prognozuojant šalies BVP, prognozuojant produkto kainą, prognozuojant būsto pardavimo kainą, rezultato prognozavimas yra keletas tiesinės regresijos pavyzdžių. Prognozuojama, ar el. Laiškas yra šlamštas, ar prognozuoti, ar kredito kortelės sandoris yra sukčiavimas, ar ne, prognozuoja, ar klientas imsis paskolą, ar ne, yra keletas logistinės regresijos pavyzdžių.

Išvada

Skirtumas tarp tiesinės regresijos ir logistinės regresijos yra tas, kad linijinė regresija naudojama nuolatinei vertei prognozuoti, o logistinė regresija naudojama diskrečiosios vertės prognozavimui. Trumpai tariant, regresijai naudojama linijinė regresija, o klasifikacijai naudojama logistinė regresija.

Nuoroda:

1. Tiesinė regresijos analizė | Linijinė regresija Pythone | Mašinų mokymosi algoritmai | Simplilearn, 2018 m. Kovo 26 d.