Como usar o aprendizado de máquina para detecção de anomalias e monitoramento de condições

Caso de uso concreto para aprendizado de máquina e análise estatística

Vegard Flovik Blocked Desbloquear Seguir Seguindo 31 de dezembro

Neste artigo, apresentarei algumas técnicas e aplicativos diferentes de aprendizado de máquina e análise estatística e mostrarei como aplicar essas abordagens para resolver um caso de uso específico para detecção de anomalias e monitoramento de condições.

Transformação digital, digitalização, Indústria 4.0, etc…

Estes são todos os termos que você provavelmente já ouviu ou leu antes. No entanto, por trás de todas essas palavras-chave, o principal objetivo é o uso de tecnologia e dados para aumentar a produtividade e a eficiência. A conectividade e o fluxo de informações e dados entre dispositivos e sensores permitem uma abundância de dados disponíveis. O principal facilitador é, então, poder usar essas vastas quantidades de dados disponíveis e, na verdade, extrair informações úteis, possibilitando a redução de custos, a otimização da capacidade e a redução do tempo de inatividade ao mínimo. É aqui que o burburinho recente em torno de aprendizado de máquina e análise de dados entra em cena.

Detecção de anomalia

A detecção de anomalias (ou detecção de outliers) é a identificação de itens, eventos ou observações raros que levantam suspeitas diferindo significativamente da maioria dos dados. Normalmente, os dados anômalos podem ser conectados a algum tipo de problema ou evento raro, como por exemplo, fraude bancária, problemas médicos, defeitos estruturais, equipamentos com defeito etc. Essa conexão torna muito interessante poder escolher quais pontos de dados podem ser considerados anomalias. , como identificar esses eventos são tipicamente muito interessantes do ponto de vista de negócios.

Isso nos leva a um dos principais objetivos: Como identificamos se os pontos de dados são normais ou anômalos? Em alguns casos simples, como na figura abaixo, a visualização de dados pode nos fornecer informações importantes.

Figura 1: Detecção de anomalia para duas variáveis

Neste caso de dados bidimensionais ( X e Y ), torna-se bastante fácil identificar anomalias visualmente através de pontos de dados localizados fora da distribuição típica. No entanto, olhando para os números à direita, não é possível identificar o outlier diretamente da investigação de uma variável no momento: É a combinação da variável X e Y que nos permite identificar facilmente a anomalia. Isso complica substancialmente o assunto quando aumentamos de duas variáveis para 10–100s de variáveis, o que é frequentemente o caso em aplicações práticas de detecção de anomalias.

Conexão ao monitoramento de condições

Qualquer máquina, seja ela uma máquina rotativa (bomba, compressor, turbina a gás ou a vapor, etc.) ou uma máquina não rotativa (trocador de calor, coluna de destilação, válvula, etc.) acabará por atingir um ponto de má saúde. Esse ponto pode não ser o de uma falha ou desligamento real, mas aquele em que o equipamento não está mais atuando em seu estado ideal. Isso sinaliza que pode haver necessidade de alguma atividade de manutenção para restaurar todo o potencial operacional. Em termos simples, identificar o “estado de saúde” de nossos equipamentos é o domínio do monitoramento de condições .

A maneira mais comum de realizar o monitoramento de condições é observar a medição de cada sensor da máquina e impor um limite de valor mínimo e máximo a ela. Se o valor atual estiver dentro dos limites, a máquina estará íntegra. Se o valor atual estiver fora dos limites, a máquina não estará íntegra e um alarme será enviado.

Este procedimento de imposição de limites de alarme codificados é conhecido por enviar um grande número de falsos alarmes, isto é, alarmes para situações que são realmente estados saudáveis para a máquina. Também faltam alarmes, ou seja, situações que são problemáticas, mas não são alarmadas. O primeiro problema não só desperdiça tempo e esforço, mas também a disponibilidade do equipamento. O segundo problema é mais crucial, pois leva a danos reais com o custo de reparo associado e perda de produção.

Ambos os problemas resultam da mesma causa: A integridade de um equipamento complexo não pode ser julgada de forma confiável com base na análise de cada medição por conta própria (como também ilustrado na figura 1 na seção acima, na detecção de anomalias). Devemos considerar uma combinação das várias medições para obter uma indicação verdadeira da situação