Čo je to supervidované strojové učenie?
Pri supervidovanom učení trénujete stroj pomocou údajov, ktoré sú dobre „označené “. Znamená to, že niektoré údaje sú už označené správnou odpoveďou. Dá sa to prirovnať k učeniu, ktoré prebieha za prítomnosti školiteľa alebo učiteľa.
Algoritmus učeného pod dohľadom sa učí z označených údajov o tréningu, pomáha vám predpovedať výsledky pre nepredvídané údaje. Úspešné budovanie, škálovanie a nasadenie presného strojového učenia pod dohľadom Model dátovej vedy vyžaduje čas a technické znalosti od tímu vysoko kvalifikovaných vedcov v oblasti dát. Vedec zaoberajúci sa údajmi musí navyše vytvoriť nové modely, aby sa ubezpečil, že poskytnuté poznatky zostávajú pravdivé, kým sa údaje nezmenia.
V tomto návode sa naučíte
- Čo je to supervidované strojové učenie?
- Čo je to učenie bez dozoru?
- Prečo supervidované učenie?
- Prečo učenie bez dozoru?
- Ako funguje kontrolované učenie?
- Ako funguje učenie bez dozoru?
- Typy techník strojového učenia pod dohľadom
- Typy techník strojového učenia bez dozoru
- Učenie pod dohľadom vs.
Čo je to učenie bez dozoru?
Učenie bez dozoru je technika strojového učenia, pri ktorej nemusíte dohliadať na model. Namiesto toho musíte modelu umožniť, aby sám pracoval na zisťovaní informácií. Zaoberá sa hlavne neoznačenými údajmi.
Algoritmy učenia bez dozoru vám umožňujú vykonávať zložitejšie úlohy spracovania v porovnaní s učením pod dohľadom. Aj keď učenie bez učiteľa môže byť nepredvídateľnejšie v porovnaní s inými metódami prirodzeného učenia, hlbokého učenia a posilňovania učenia.
Prečo supervidované učenie?
- Učenie pod dohľadom vám umožňuje zhromažďovať údaje alebo vytvárať výstupné údaje z predchádzajúcich skúseností.
- Pomáha vám optimalizovať výkonnostné kritériá na základe skúseností
- Kontrolované strojové učenie vám pomôže vyriešiť rôzne typy problémov s výpočtom v reálnom svete.
Prečo učenie bez dozoru?
Tu sú hlavné dôvody využívania učenia bez dozoru:
- Nervové strojové učenie nájde v dátach všetky druhy neznámych vzorov.
- Metódy bez dozoru vám pomôžu nájsť funkcie, ktoré môžu byť užitočné pri kategorizácii.
- Prebieha v reálnom čase, takže všetky vstupné údaje musia byť analyzované a označené za prítomnosti študentov.
- Je jednoduchšie získať neoznačené údaje z počítača ako označené údaje, ktoré si vyžadujú manuálny zásah.
Ako funguje kontrolované učenie?
Napríklad chcete trénovať stroj, ktorý vám pomôže predpovedať, ako dlho vám bude trvať cesta z vášho pracoviska domov. Tu začnete vytvorením množiny označených údajov. Tieto údaje zahŕňajú
- Poveternostné podmienky
- Denný čas
- Prázdniny
Všetky tieto podrobnosti sú vašimi vstupmi. Výstupom je čas, ktorý trval cesta späť domov v konkrétny deň.
Inštinktívne viete, že ak vonku prší, potom vám cesta domov bude trvať dlhšie. Ale stroj potrebuje dáta a štatistiku.
Pozrime sa teraz, ako môžete v tomto príklade vytvoriť supervizovaný model učenia, ktorý pomôže používateľovi určiť čas dochádzania. Prvá vec, ktorú musíte vytvoriť, je tréningová dátová sada. Táto tréningová sada bude obsahovať celkový čas dochádzania a zodpovedajúce faktory, ako je počasie, čas atď. Na základe tejto tréningovej sady môže váš stroj vidieť, že existuje priamy vzťah medzi množstvom dažďa a časom, ktorý budete potrebovať na cestu domov.
Takže zistí, že čím viac bude pršať, tým dlhšie budete jazdiť autom, aby ste sa dostali späť do svojho domova. Môže tiež vidieť súvislosť medzi časom, keď odídete z práce, a časom, keď budete na ceste.
Čím bližšie ste k 18.00, tým dlhšie trvá cesta domov. Vaše zariadenie môže nájsť niektoré vzťahy s vašimi označenými údajmi.
Toto je začiatok vášho dátového modelu. Začína to mať vplyv na to, ako dážď ovplyvňuje spôsob, akým ľudia jazdia. Začína sa tiež vidieť, že viac ľudí cestuje v konkrétnu dennú dobu.
Ako funguje učenie bez dozoru?
Zoberme si prípad dieťaťa a jeho rodinného psa.
Pozná a identifikuje tohto psa. O niekoľko týždňov neskôr rodinný priateľ vezme psa a snaží sa s dieťaťom hrať.
Dieťa tohto psa skôr nevidelo. Ale uvedomuje si, že mnoho funkcií (2 uši, oči, chôdza po 4 nohách) je ako jej domáci miláčik. Identifikuje nové zviera ako psa. Toto je učenie bez dozoru, kde sa neučíte, ale učíte sa z údajov (v tomto prípade údajov o psovi). Keby to bolo učenie pod dohľadom, rodinný priateľ by dieťaťu povedal, že je to pes.
Typy techník strojového učenia pod dohľadom
Regresia:
Regresná technika predpovedá jednu výstupnú hodnotu pomocou tréningových údajov.
Príklad: Pomocou regresie môžete predpovedať cenu domu z údajov o školení. Vstupnými premennými budú lokalita, veľkosť domu atď.
Klasifikácia:
Klasifikácia znamená zoskupenie výstupu vo vnútri triedy. Ak sa algoritmus pokúša označiť vstup do dvoch odlišných tried, nazýva sa to binárna klasifikácia. Výber medzi viac ako dvoma triedami sa označuje ako klasifikácia viacerých tried.
Príklad : Určenie, či niekto bude alebo nebude neplatičom pôžičky.
Silné stránky : Výstupy majú vždy pravdepodobnostnú interpretáciu a algoritmus je možné legalizovať, aby nedošlo k preťaženiu.
Slabé stránky : Logistická regresia môže mať slabšiu výkonnosť, ak existuje viac alebo nelineárne hranica rozhodovania. Táto metóda nie je flexibilná, takže nezachytáva zložitejšie vzťahy.
Typy techník strojového učenia bez dozoru
Problémy s učením bez dozoru sa ďalej zoskupovali do problémov s klastrovaním a združovaním.
Zhlukovanie
Zhlukovanie je dôležitý pojem, pokiaľ ide o učenie bez dozoru. Zaoberá sa hlavne hľadaním štruktúry alebo vzoru v zbierke nekategorizovaných údajov. Klastrové algoritmy spracujú vaše údaje a vyhľadajú prirodzené klastre (skupiny), ak v údajoch existujú. Môžete tiež upraviť, koľko klastrov by mali vaše algoritmy identifikovať. Umožňuje vám upraviť podrobnosti týchto skupín.
Združenie
Asociačné pravidlá vám umožňujú vytvárať asociácie medzi dátovými objektmi vo veľkých databázach. Táto technika bez dozoru je o objavovaní vzrušujúcich vzťahov medzi premennými vo veľkých databázach. Napríklad ľudia, ktorí si kupujú nový domov, si s najväčšou pravdepodobnosťou kúpia nový nábytok.
Ďalšie príklady:
- Podskupina pacientov s rakovinou zoskupených podľa meraní génovej expresie
- Skupiny nakupujúcich na základe ich histórie prehliadania a nákupu
- Skupina filmov podľa hodnotenia diváka filmu
Učenie pod dohľadom vs.
Parametre | Technika strojového učenia pod dohľadom | Technika strojového učenia bez dozoru |
Proces | V modeli učenia pod dohľadom budú uvedené vstupné a výstupné premenné. | V modeli výučby bez dozoru sa poskytnú iba vstupné údaje |
Vstupné Data | Algoritmy sú trénované pomocou označených údajov. | Algoritmy sa používajú proti údajom, ktoré nie sú označené |
Použité algoritmy | Podpora vektorových strojov, neurónových sietí, lineárnej a logistickej regresie, náhodných lesov a klasifikačných stromov. | Neregistrované algoritmy možno rozdeliť do rôznych kategórií: napríklad Klastrové algoritmy, K-prostriedky, Hierarchické klastrovanie atď. |
Výpočtová zložitosť | Učenie pod vedením je jednoduchšia metóda. | Výučba bez učiteľa je výpočtovo zložitá |
Používanie údajov | Model s supervíznym učením využíva tréningové dáta na zistenie súvislosti medzi vstupom a výstupmi. | Učenie bez dozoru nepoužíva výstupné údaje. |
Presnosť výsledkov | Vysoko presná a dôveryhodná metóda. | Menej presná a dôveryhodná metóda. |
Učenie v reálnom čase | Metóda učenia prebieha offline. | Metóda učenia prebieha v reálnom čase. |
Počet tried | Počet tried je známy. | Počet tried nie je známy. |
Hlavná nevýhoda | Klasifikácia veľkých dát môže byť v supervidovanom učení skutočnou výzvou. | Nemôžete získať presné informácie týkajúce sa triedenia údajov a výstup ako údaje použité v učení bez dozoru je označený a nie je známy. |
Zhrnutie
- Pri supervidovanom učení trénujete stroj pomocou údajov, ktoré sú dobre „označené“.
- Učenie bez dozoru je technika strojového učenia, pri ktorej nemusíte dohliadať na model.
- Učenie pod dohľadom vám umožňuje zhromažďovať údaje alebo vytvárať výstupné údaje z predchádzajúcich skúseností.
- Strojové učenie bez dozoru vám pomôže nájsť v dátach všetky druhy neznámych vzorcov.
- Napríklad budete schopní určiť čas potrebný na návrat späť na základe poveternostných podmienok, denných časov a sviatkov.
- Napríklad Baby môže identifikovať iných psov na základe učenia pod dohľadom v minulosti.
- Regresia a klasifikácia sú dva typy techník strojového učenia pod dohľadom.
- Klastrovanie a združovanie sú dva typy učenia bez dozoru.
- V modeli učenia pod dohľadom sa budú dávať vstupné a výstupné premenné, zatiaľ čo pri modeli učenia bez dozoru sa budú dávať iba vstupné údaje