Hacer Webscrapping es una de las tareas más comunes que sea realizan en Python.
Con el uso de librerías podemos acceder a información dentro de las páginas web y extraer sólo lo que necesitamos de forma automática.
Aquí te muestro cómo este Script en Python usa la librería BeautifulSoup para obtener los tags de HTML buscados.
import requests
from bs4 import BeautifulSoup
def get_titulares(url):
#Obtener la página
response = requests.get(url)
# Si requests temirna cortrectamente = status 200(El estatus 200 nos asegura que una petición fue correcta)
if response.status_code == 200:
soup = BeautifulSoup(response.text, 'html.parser')
#lOCALIZAR LOS ELEMENTOS QUE CONTIENEN LOS TÍTULOS EN LAS PÁGINAS, EN CADA PÁGINA ES DIFERENTE
titulos = soup.select('.bbc-1i4ie53') # <-Coleccion
#Extraemos cada título en la colección de titulos
for titulo in titulos:
print(titulo.text)
print("\n")
print("--------------------------------------------")
print("\n")
else:
print(f"ocurrió un error durante la petición {response.status_code}")
get_titulares('https://www.bbc.com/mundo')
Comentarios