Python 06d scrap

 0    6 fiche    swiatangielskiego
Télécharger mP3 Imprimer jouer consultez
 
question réponse
instalacja webscraping
commencer à apprendre
pip install beautifulsoup4
import webscraping oraz urllib oraz lxml
commencer à apprendre
import bs4 as bs import urllib. request import lxml
pobranie html z url
commencer à apprendre
url_content = urllib. request. urlopen('url'). read()
ekstrakcja linków do stron filmów
commencer à apprendre
find_url = bs. BeautifulSoup(url_content, 'lxml')
wyodrębnić wszystkie wystąpienia określonego tagu
commencer à apprendre
find_url_tds = find_url. findAll('td', {'class': 'titleColumn'})
jeśli wielokrotnie wyodrębniasz linki, możesz użyć poniższej funkcji:
commencer à apprendre
base_url + find_url_td. find('a'). attrs['href']

Vous devez vous connecter pour poster un commentaire.