Este repositório, studies-industrial_processes, é dedicado à exploração e aplicação de técnicas de Análise de Dados (Advanced Analytics) no contexto de processos industriais. O objetivo principal é centralizar estudos, códigos, notebooks e datasets que demonstrem como a ciência de dados pode ser utilizada para otimizar, monitorar e prever o comportamento de sistemas complexos de manufatura e produção.
Aqui, você encontrará abordagens para transformar dados brutos de processo (coletados de sensores, CLPs, sistemas SCADA, etc.) em insights para a melhoria contínua, redução de custos e aumento da eficiência operacional.
As análises e estudos contidos neste repositório abordarão uma variedade de técnicas e metodologias, incluindo, mas não se limitando a:
- Controle Estatístico de Processo (CEP): Monitoramento da estabilidade e capacidade dos processos.
- Manutenção Preditiva (PdM): Modelos para prever falhas em equipamentos antes que ocorram, utilizando dados de vibração, temperatura, pressão, etc.
- Otimização de Processos: Identificação dos parâmetros operacionais ótimos para maximizar a produção, minimizar o consumo de energia ou melhorar a qualidade do produto.
- Detecção de Anomalias: Técnicas para identificar comportamentos inesperados ou falhas em tempo real.
- Análise de Causa Raiz (RCA): Métodos estatísticos e de machine learning para determinar as causas fundamentais de problemas de produção.
- Análise de Causalidade: Aplicação de técnicas como Causalidade de Granger e Do-Calculus para entender as relações de causa e efeito entre as variáveis do processo.
- Modelagem e Simulação: Criação de modelos que simulam o comportamento do processo para testes e otimizações.
Os estudos e implementações neste repositório utilizarão principalmente o ecossistema Python para ciência de dados. As principais bibliotecas incluem:
- Pandas: Para manipulação e análise de dados.
- NumPy: Para computação numérica.
- Scikit-learn: Para modelos de machine learning tradicionais.
- TensorFlow / Keras / PyTorch: Para modelos de deep learning.
- Statsmodels: Para modelos estatísticos e séries temporais.
- Plotly / Matplotlib / Seaborn: Para visualização de dados.
O arquivo environment.yml detalha todas as dependências.
Para explorar os estudos:
- Clone o repositório:
git clone git@github.com:thiagoneye/studies-industrial_processes.git
- Navegue até a pasta do projeto:
cd studies-industrial_processes