Automatização da Extração de Comentários e Informações de Hotéis (Booking.com) – Universidade do Porto
Desenvolvimento de um scraper em Python para recolha de dados de hotéis e reviews no Booking.com, aplicado a estudos académicos na área do turismo.
O sistema integra Selenium WebDriver para navegação automática, BeautifulSoup para parsing de HTML, e Pandas/OpenPyXL para processamento e exportação de dados em Excel. A arquitetura inclui checkpointing com JSON, garantindo a continuidade do processo após falhas.
Foram extraídos mais de 120.000 comentários de 124 hotéis, com dados estruturados: nome, nacionalidade, tipo de quarto, nº de noites, data da estadia, pontuação, título, comentário positivo/negativo e categorias avaliadas.
Outputs principais:
– hotel_info.xlsx: informações gerais de cada hotel.
– comentarios_final.xlsx: base de dados de reviews completas.
Projeto demonstrou competências em Python, Web Scraping, Selenium, BeautifulSoup, Pandas, automação de processos e gestão de grandes volumes de dados.
Desenvolvimento de um scraper em Python para recolha de dados de hotéis e reviews no Booking.com, aplicado a estudos académicos na área do turismo.
O sistema integra Selenium WebDriver para navegação automática, BeautifulSoup para parsing de HTML, e Pandas/OpenPyXL para processamento e exportação de dados em Excel. A arquitetura inclui checkpointing com JSON, garantindo a continuidade do processo após falhas.
Foram extraídos mais de 120.000 comentários de 124 hotéis, com dados estruturados: nome, nacionalidade, tipo de quarto, nº de noites, data da estadia, pontuação, título, comentário positivo/negativo e categorias avaliadas.
Outputs principais:
– hotel_info.xlsx: informações gerais de cada hotel.
– comentarios_final.xlsx: base de dados de reviews completas.
Projeto demonstrou competências em Python, Web Scraping, Selenium, BeautifulSoup, Pandas, automação de processos e gestão de grandes volumes de dados.
PT
EN
FR
DE
IT
ES