Este projeto contém um web scraper desenvolvido em Python para coletar dados de anúncios de imóveis da OLX em uma região específica. Os dados coletados são salvos em arquivos .csv e .xlsx.
- Coleta de Dados: O scraper recolhe dados de anúncios de imóveis na plataforma OLX.
- Exportação de Dados: Os dados coletados são guardados em formatos .csv e .xlsx.
- Configuração Regional: Permite configurar uma URL base da OLX para uma região e categoria de imóveis específica, como "imóveis à venda em São Paulo - SP"
O projeto é desenvolvido em Python e utiliza as seguintes bibliotecas:
- cloudscraper
- requests
- beautifulsoup4
- pandas
- openpyxl
- lxml
-
Crie e Ative um Ambiente Virtual:
python -m venv venv # Windows .\venv\Scripts\activate # macOS/Linux source venv/bin/activate
-
Instale as Dependências:
pip install -r requirements.txt
-
Configure a Região:
- Abra o arquivo
src/config.py. - Atualize a
BASE_URL_OLXpara a URL da OLX da sua região e categoria de imóveis (ex: imóveis à venda em São Paulo - SP).
- Abra o arquivo
-
Crie a Pasta de Dados:
- Crie uma pasta chamada
datana raiz do projeto. Os arquivos.csve.xlsxserão salvos aqui.
- Crie uma pasta chamada
- Certifique-se de que o ambiente virtual está ativado e as configurações em
src/config.pyestão corretas. - Execute o script principal:
python main.py
- Os dados serão salvos na pasta
data/e um log será gerado emscraper.log.