50 najlepších otázok na pohovor so strojovým učením a Odpovede

Anonim

Stiahnite si PDF

1) Čo je to strojové učenie?

Strojové učenie je odvetvie informatiky, ktoré sa zaoberá programovaním systému s cieľom automaticky sa učiť a zdokonaľovať so skúsenosťami. Napríklad: Roboty sú naprogramované tak, aby mohli vykonávať úlohy na základe údajov zhromaždených zo senzorov. Automaticky sa učí programy z údajov.

2) Uveďte rozdiel medzi dolovaním dát a strojovým učením?

Strojové učenie súvisí so štúdiom, návrhom a vývojom algoritmov, ktoré počítačom umožňujú učiť sa bez výslovného programovania. Zatiaľ čo dolovanie dát možno definovať ako proces, v ktorom sa neštruktúrované dáta snažia extrahovať vedomosti alebo neznáme zaujímavé vzory. Počas tohto procesného stroja sa používajú algoritmy učenia.

3) Čo je to „nadmerné vybavenie“ v strojovom učení?

V strojovom učení, keď štatistický model popisuje náhodnú chybu alebo šum namiesto základnej súvislosti, dôjde k „preplneniu“. Ak je model príliš zložitý, zvyčajne sa pozoruje nadmerné vybavenie, pretože má príliš veľa parametrov vzhľadom na počet typov tréningových údajov. Model vykazuje zlý výkon, ktorý bol príliš vysoký.

4) Prečo sa stáva overfitting?

Existuje možnosť nadmerného vybavenia, pretože kritériá použité na trénovanie modelu nie sú rovnaké ako kritériá použité na posúdenie účinnosti modelu.

5) Ako sa môžete vyhnúť preťaženiu?

Použitím veľkého množstva údajov sa dá vyhnúť preplneniu, preplnenie sa stane relatívne, pretože máte malý súbor údajov a snažíte sa z neho poučiť. Ale ak máte malú databázu a ste nútení prísť s modelom na základe toho. V takejto situácii môžete použiť techniku ​​známu ako krížová validácia . V tejto metóde sa dataset rozdeľuje na dve sekcie, testovacie a tréningové dátové súbory, testovací dátový súbor bude testovať iba model, zatiaľ čo v tréningovom dátovom súbore prídu datapoints s modelom.

V tejto technike sa modelu zvyčajne dáva dataset známych údajov, na ktorých sa uskutočňuje školenie (súbor tréningových údajov), a dataset neznámych údajov, proti ktorým sa model testuje. Myšlienkou krížovej validácie je definovanie súboru údajov na „otestovanie“ modelu vo fáze školenia.

6) Čo je to indukčné strojové učenie?

Induktívne strojové učenie zahŕňa proces učenia sa na príkladoch, kde sa systém z množiny pozorovaných prípadov snaží vyvolať všeobecné pravidlo.

7) Čo je päť populárnych algoritmov strojového učenia?

  • Rozhodovacie stromy
  • Neurónové siete (spätné šírenie)
  • Pravdepodobnostné siete
  • Najbližší sused
  • Podporujte vektorové stroje

8) Aké sú rôzne techniky algoritmov v strojovom učení?

Existujú rôzne typy techník v strojovom učení

  • Učenie pod dohľadom
  • Učenie bez dozoru
  • Učenie s čiastočným dohľadom
  • Výučba posilňovania
  • Transdukcia
  • Učiť sa učiť

9) Aké sú tri fázy zostavovania hypotéz alebo modelu v strojovom učení?

  • Budova modelu
  • Testovanie modelu
  • Uplatňovanie modelu

10) Aký je štandardný prístup k výučbe pod dohľadom?

Štandardným prístupom k učeniu pod dohľadom je rozdelenie množiny príkladov na cvičnú súpravu a test.

11) Čo je to „Tréningová sada“ a „Testovacia sada“?

V rôznych oblastiach informačnej vedy, ako je strojové učenie, sa sada údajov používa na objavenie potenciálne prediktívneho vzťahu známeho ako „Training Set“. Sada školení je príkladom pre učiaceho sa, zatiaľ čo sada testov sa používa na testovanie presnosti hypotéz generovaných študentom a je to súbor príkladov zadržiavaných učiacim sa. Tréningová sada sa líši od Testovacej sady.

12) Uveďte zoznam rôznych prístupov k strojovému učeniu?

Rôzne prístupy v strojovom učení sú

  • Učenie klasifikácie konceptu vs.
  • Symbolické vs. štatistické učenie
  • Induktívne vs. Analytické učenie

13) Čo nie je strojové učenie?

  • Umela inteligencia
  • Odvodenie založené na pravidle

14) Vysvetlite, čo je funkciou „učenia bez dozoru“?

  • Nájdite zhluky údajov
  • Nájdite nízkodimenzionálne znázornenia údajov
  • Nájdite zaujímavé pokyny v dátach
  • Zaujímavé súradnice a korelácie
  • Nájdite nové pozorovania / čistenie databázy

15) Vysvetlite, aká je funkcia učenia sa pod dohľadom?

  • Klasifikácie
  • Rozpoznávanie reči
  • Regresia
  • Predpovedajte časové rady
  • Poznámky k reťazcom

16) Čo je to strojové učenie nezávislé od algoritmu?

Strojové učenie, pri ktorom sú matematické základy nezávislé od konkrétneho klasifikátora alebo sa algoritmus učenia označuje ako strojové učenie nezávislé od algoritmu?

17) Aký je rozdiel medzi umelým učením a strojovým učením?

Navrhovanie a vývoj algoritmov podľa správania založeného na empirických dátach je známe ako Machine Learning. Zatiaľ čo umelá inteligencia okrem strojového učenia zahŕňa aj ďalšie aspekty, ako napríklad reprezentáciu vedomostí, spracovanie prirodzeného jazyka, plánovanie, robotiku atď.

18) Čo je klasifikátor v strojovom učení?

Klasifikátor v strojovom učení je systém, ktorý vstupuje do vektora diskrétnych alebo spojitých hodnôt funkcií a vydáva jednu diskrétnu hodnotu, triedu.

19) Aké sú výhody Naive Bayes?

V Naive Bayes bude klasifikátor konvergovať rýchlejšie ako diskriminačné modely, ako je logistická regresia, takže potrebujete menej tréningových údajov. Hlavnou výhodou je, že sa nedokáže naučiť interakcie medzi funkciami.

20) V ktorých oblastiach sa používa rozpoznávanie vzorov?

Rozpoznávanie vzorov je možné použiť v

  • Počítačové videnie
  • Rozpoznávanie reči
  • Dolovanie dát
  • Štatistika
  • Neformálne načítanie
  • Bio-informatika

21) Čo je to genetické programovanie?

Genetické programovanie je jednou z dvoch techník používaných v strojovom učení. Model je založený na testovaní a výbere najlepšej voľby zo súboru výsledkov.

22) Čo je to induktívne logické programovanie v strojovom učení?

Induktívne logické programovanie (ILP) je podpole strojového učenia, ktoré využíva logické programovanie predstavujúce základné znalosti a príklady.

23) Čo je výber modelu v strojovom učení?

Proces výberu modelov z rôznych matematických modelov, ktoré sa používajú na popis toho istého súboru údajov, je známy ako výber modelu. Výber modelu sa aplikuje na oblasti štatistiky, strojového učenia a ťažby dát.

24) Aké sú dve metódy použité na kalibráciu v supervíznom učení?

Dve metódy používané na predpovedanie dobrých pravdepodobností v rámci supervízneho učenia sú

  • Plattova kalibrácia
  • Izotonická regresia

Tieto metódy sú určené na binárnu klasifikáciu a nie sú to nijaké maličkosti.

25) Ktorá metóda sa často používa na zabránenie preťaženia?

Ak je dostatok údajov, použije sa „izotonická regresia“, aby sa zabránilo problémom s nadmerným vybavením.

26) Aký je rozdiel medzi heuristikou pre učenie sa pravidiel a heuristikou pre rozhodovacie stromy?

Rozdiel je v tom, že heuristika rozhodovacích stromov hodnotí priemernú kvalitu niekoľkých nesúrodých množín, zatiaľ čo učiaci sa pravidiel hodnotia iba kvalitu množiny inštancií, na ktoré sa vzťahuje pravidlo kandidáta.

27) Čo je Perceptron v strojovom učení?

V strojovom učení je Perceptron algoritmus na kontrolovanú klasifikáciu vstupu do jedného z niekoľkých možných nebinárnych výstupov.

28) Vysvetlite dve zložky Bayesovho logického programu?

Bayesovský logický program sa skladá z dvoch komponentov. Prvý komponent je logický; pozostáva zo súboru Bayesovských klauzúl, ktoré zachytávajú kvalitatívnu štruktúru domény. Druhá zložka je kvantitatívna, kóduje kvantitatívne informácie o doméne.

29) Čo sú Bayesian Networks (BN)?

Bayesova sieť sa používa na znázornenie grafického modelu vzťahu pravdepodobnosti medzi množinou premenných.

30) Prečo sa inštitucionálny výučbový algoritmus niekedy označuje ako Lazy Learning Algoritmus?

Algoritmus učenia založený na inštanciách sa tiež označuje ako algoritmus lenivého učenia, pretože oneskoruje proces indukcie alebo generalizácie, kým sa nevykoná klasifikácia.

31) Aké sú dve metódy klasifikácie, ktoré dokáže spracovať SVM (Support Vector Machine)?

  • Kombinácia binárnych klasifikátorov
  • Úprava binárneho kódu tak, aby zahŕňal učenie sa vo viacerých triedach

32) Čo je to súborové učenie?

Na riešenie konkrétneho výpočtového programu sa strategicky vygeneruje a skombinuje viac modelov, ako sú klasifikátory alebo odborníci. Tento proces je známy ako súborové učenie.

33) Prečo sa používa ansámblové učenie?

Učenie sa súboru sa používa na zlepšenie klasifikácie, predikcie, aproximácie funkcií atď. Modelu.

34) Kedy použiť ansámblové učenie?

Učenie súboru sa používa, keď zostavujete klasifikátory komponentov, ktoré sú presnejšie a navzájom nezávislé.

35) Aké sú dve paradigmy súborových metód?

Dve paradigmy súborových metód sú

  • Postupné súborové metódy
  • Metódy paralelného súboru

36) Aký je všeobecný princíp ansámblovej metódy a čo je zabalenie a podpora v ansámblovej metóde?

Všeobecným princípom ansámblovej metódy je spojiť predpovede niekoľkých modelov zostavených s daným algoritmom učenia s cieľom zlepšiť robustnosť nad jedným modelom. Pytliačenie je súborová metóda na vylepšenie nestabilných odhadov alebo klasifikačných schém. Zatiaľ čo metóda zosilnenia sa postupne používa na zníženie zaujatosti kombinovaného modelu. Boosting a Bagging môžu znížiť chyby zmenšením termínu odchýlky.

37) Čo je rozklad odchýlky odchýlky od chyby klasifikácie v súborovej metóde?

Očakávanú chybu algoritmu učenia je možné rozložiť na skreslenie a odchýlku. Predpätie vyjadruje, ako blízko sa priemerný klasifikátor produkovaný algoritmom učenia zhoduje s cieľovou funkciou. Termín odchýlky meria to, ako veľmi kolíše predpoveď učiaceho sa algoritmu pre rôzne tréningové skupiny.

38) Čo je to algoritmus prírastkového učenia v súbore?

Metóda prírastkového učenia je schopnosť algoritmu učiť sa z nových údajov, ktoré môžu byť dostupné potom, čo už bol klasifikátor vygenerovaný z už dostupnej množiny údajov.

39) Na čo sa používajú PCA, KPCA a ICA?

PCA (Analýza hlavných komponentov), ​​KPCA (Analýza základných komponentov na jadre) a ICA (Analýza nezávislých komponentov) sú dôležité techniky extrakcie prvkov používané na zníženie rozmerov.

40) Čo je redukcia dimenzií v strojovom učení?

V strojovom učení a štatistikách je redukcia dimenzie procesom znižovania počtu náhodných premenných, ktorý je potrebné zohľadniť, a možno ho rozdeliť na výber a extrakciu prvkov.

41) Čo sú to podporné vektorové stroje?

Podporné vektorové stroje sú dohliadané algoritmy učenia používané na klasifikáciu a regresnú analýzu.

42) Aké sú zložky techník relačného hodnotenia?

Dôležitými zložkami techník relačného hodnotenia sú

  • Zber dát
  • Získavanie pozemskej pravdy
  • Technika krížovej validácie
  • Typ dopytu
  • Bodová metrika
  • Test dôležitosti

43) Aké sú rôzne metódy postupného učenia sa pod dohľadom?

Rôzne metódy na riešenie problémov so sekvenčným učením sú

  • Metódy posuvného okna
  • Opakované posuvné okná
  • Skryté modely Markow
  • Modely Markow s maximálnou entropiou
  • Podmienené náhodné polia
  • Siete grafových transformátorov

44) Aké sú oblasti v robotike a spracovaní informácií, kde vzniká problém so sekvenčnou predikciou?

Oblasti v robotike a spracovaní informácií, kde vzniká problém so sekvenčnou predikciou, sú

  • Napodobňovanie učenia
  • Štruktúrovaná predpoveď
  • Modelové zosilňovacie učenie

45) Čo je to dávkové štatistické učenie?

Štatistické techniky učenia umožňujú učiť sa funkciu alebo prediktor zo súboru pozorovaných údajov, ktoré umožňujú predpovedať neviditeľné alebo budúce údaje. Tieto techniky poskytujú záruky výkonnosti naučeného prediktora budúcich neviditeľných údajov na základe štatistického predpokladu procesu generovania údajov.

46) Čo je to PAC učenie?

Učenie PAC (pravdepodobne približne správne) je vzdelávací rámec, ktorý bol zavedený na analýzu učebných algoritmov a ich štatistickej efektívnosti.

47) Aké sú rôzne kategórie, ktoré môžete zaradiť do procesu sekvenčného učenia?

  • Predikcia postupnosti
  • Generovanie sekvencie
  • Rozpoznávanie sekvencií
  • Postupné rozhodnutie

48) Čo je to sekvenčné učenie?

Sekvenčné učenie je metóda výučby a učenia sa logickým spôsobom.

49) Čo sú dve techniky strojového učenia?

Dve techniky strojového učenia sú

  • Genetické programovanie
  • Induktívne učenie
50) Dáte populárnu aplikáciu strojového učenia, ktorú vidíte každý deň?

Motor odporúčaní implementovaný hlavnými webovými stránkami elektronického obchodu využíva Machine Learning.