🌐 Previsão de Tráfego Web com Séries Temporais

Este projeto utiliza modelagem com XGBoost para prever o volume de visitas diarias em um site. O objetivo é estimar a quantidade de acessos futuros, fornecendo insights para o planejamento de marketing e infraestrutura.

🚀 Objetivos

Construir um pipeline de dados utilizando Python para manipulação e feature engineering de séries temporais.
Treinar um modelo de regressão com XGBoost, usando lags como preditores para capturar dependências temporais.
Prever o número de visitas diárias ao site para períodos futuros.

🗂️ Dados

Fonte: Dados simulados para fins didáticos.
Período: Diario.
Variáveis principais:
- Visits: número total de visitas no mês.

🔍 Metodologia

🛠️ Análise Exploratória do projeto

Conversão do CSV em DataFrame final para pandas DataFrame.
Análise de Distribuição dos Dados, Taxa Média de Conversão, Verificação da Relação de Dia e Campanhas com o número de visitas.
Análise de Correlação entre as variáveis.
Teste de Estacionariedade e Médias Móveis.

🛠️ Pipeline do projeto

Preparação para modelagem:
- Conversão do CSV em DataFrame final para pandas DataFrame.
- Criação de variáveis de defasagem (lags de 1, 2 e 3 períodos).
- Remoção de linhas com valores nulos gerados pelos lags.
- Featuring Engineering para criação de variáveis para análise.
- Pre-processamento dos dados com sklearn ColumTransform.
- Separação entre conjuntos de treino e previsão com sklearn train_test_split.
Modelagem com XGBoost:
- Treinamento do modelo XGBRegressor utilizando os lags como features.
- Previsão do número de visitas para um horizonte futuro.
Avaliação da Modelagem Preditiva:
- RMSE (mean_squared_error)
Exportação do modelo:
- Serialização do modelo treinado com joblib para reutilização.

📈 Resultados

Foram geradas previsões diárias do tráfego web para o horizonte desejado, demonstrando a capacidade do modelo de capturar a dinâmica temporal.
O modelo e o pipeline permitem facilmente atualizar previsões com novos dados históricos.

📈 Considerações:

O modelo é capaz de capturar o comportamento do tráfego com um nível de erro que pode ser considerado adequado para previsões de curto prazo, mas abre espaço para melhorias, como inclusão de novas variáveis explicativas ou testes com abordagens híbridas (ex.: XGBoost + variáveis sazonais ou lags adicionais).

📚 Tecnologias e bibliotecas utilizadas

pandas & numpy: apoio no tratamento final dos dados.
XGBoost (XGBRegressor): algoritmo de boosting para regressão.
joblib: para salvar e carregar o modelo treinado.
sklearn: para métricas, pré-processamento(ColumnTransformer)
stastmodels: para teste estatístico adfuller
matplotlib, pyplot e seaborn: visualizações gráficas do forecast.

⚙️ Como executar

Clone o repositório:

git clone https://github.com/jaquelinesfernandes/Predicting_WebTraficc_TimeSeries.git

✍️ Autora | Jaqueline Fernandes |

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
dataset		dataset
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
data_generate.py		data_generate.py
image-1.png		image-1.png
image-2.png		image-2.png
image.png		image.png
modelo_projeto_webtraffic.pkl		modelo_projeto_webtraffic.pkl
new_data_generate.py		new_data_generate.py
previsoes.csv		previsoes.csv
project_webtraficc_ts.ipynb		project_webtraficc_ts.ipynb
realtime_data_generate.py		realtime_data_generate.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🌐 Previsão de Tráfego Web com Séries Temporais

🚀 Objetivos

🗂️ Dados

🔍 Metodologia

🛠️ Análise Exploratória do projeto

🛠️ Pipeline do projeto

📈 Resultados

📈 Considerações:

📚 Tecnologias e bibliotecas utilizadas

⚙️ Como executar

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🌐 Previsão de Tráfego Web com Séries Temporais

🚀 Objetivos

🗂️ Dados

🔍 Metodologia

🛠️ Análise Exploratória do projeto

🛠️ Pipeline do projeto

📈 Resultados

📈 Considerações:

📚 Tecnologias e bibliotecas utilizadas

⚙️ Como executar

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages