Prístup na Internet v Pythone pomocou Urllib.Request a urlopen ()

Obsah:

Anonim

Čo je urllib?

urllib je modul Pythonu, ktorý sa dá použiť na otváranie adries URL. Definuje funkcie a triedy, ktoré uľahčujú akcie URL.

S Pythonom môžete tiež pristupovať a získavať dáta z internetu, ako sú XML, HTML, JSON atď. Môžete tiež použiť Python na priamu prácu s týmito dátami. V tomto výučbe sa dozvieme, ako môžeme načítať údaje z webu. Napríklad tu sme použili adresu URL videa guru99 a k tejto adrese URL videa pristúpime pomocou jazyka Python a vytlačíme súbor HTML tejto adresy URL.

V tomto návode sa naučíme

  • Ako otvoriť URL pomocou Urllib
  • Ako čítať súbor HTML pre vašu adresu URL v Pythone

Ako otvoriť URL pomocou Urllib

Pred spustením kódu na pripojenie k internetovým údajom musíme importovať vyhlásenie pre modul knižnice URL alebo „urllib“.

  • Importovať urllib
  • Definujte svoju hlavnú funkciu
  • Deklarujte premennú webUrl
  • Potom zavolajte funkciu urlopen v knižnici URL lib
  • URL, ktorú otvárame, je tutoriál guru99 na youtube
  • Ďalej si vytlačíme výsledný kód
  • Výsledný kód sa získa vyvolaním funkcie getcode v premennej webUrl, ktorú sme vytvorili
  • Prevedieme to na reťazec, aby ho bolo možné zreťaziť pomocou nášho reťazca „výsledný kód“
  • Bude to bežný kód HTTP „200“, čo naznačuje, že požiadavka http bola úspešne spracovaná

Ako získať adresu URL súboru HTML vo formáte Python

Súbor HTML môžete tiež prečítať pomocou funkcie „čítať“ v Pythone a po spustení kódu sa súbor HTML zobrazí v konzole.

  • Zavolajte funkciu čítania na premennej webURL
  • Premenná Čítať umožňuje čítať obsah dátových súborov
  • Načítajte celý obsah adresy URL do premennej nazývanej údaje
  • Spustiť kód - Vytlačí údaje do formátu HTML

Tu je celý kód

Príklad v jazyku Python 2

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Príklad v jazyku Python 3

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)