Tecnologia de Inspeção Visual da Aparência de Latas de Alumínio: Uma Análise Abrangente da Imagem Ótica à Aprendizagem Profunda
Tecnologia de Inspeção Visual da Aparência de Latas de Alumínio: Uma Análise Abrangente da Imagem Ótica à Aprendizagem Profunda
1. Introdução: Desafios técnicos e importância da inspeção visual de latas de alumínio
Com o rápido desenvolvimento da indústria alimentar e das bebidas, a procura de latas de alumínio como embalagem convencional continua a crescer. As latas de alumínio comuns, produzidas a alta velocidade (até 15 latas por segundo), apresentam diversos riscos de defeitos estéticos, incluindo riscos, amolgadelas, deformações e estufamento do corpo da lata; defeitos na impressão do fundo; e aplicação irregular do selante na tampa e deformação do anel de abertura. Estes defeitos não só afetam a estética do produto, como também podem causar fugas ou contaminação do conteúdo, representando sérios riscos para a segurança alimentar.
A inspeção do aspeto das latas de alumínio enfrenta múltiplos desafios técnicos: as fortes propriedades refletoras da superfície metálica podem mascarar defeitos reais; a estrutura cilíndrica e curva da superfície torna a imagem propensa a distorções; as linhas de produção de alta velocidade exigem que o sistema de deteção tome decisões em milissegundos; e a diversidade de tipos de defeitos requer algoritmos com elevada adaptabilidade. Os métodos tradicionais de inspeção manual sofrem de baixa eficiência, subjetividade e fadiga, não atendendo às exigências industriais modernas. Por conseguinte, a tecnologia de inspeção automatizada baseada em visão por computador tornou-se uma escolha inevitável para o setor. Permite a deteção rápida e precisa da aparência das latas de alumínio através da aquisição, processamento e análise de imagens de alta precisão.
Este artigo analisará sistematicamente o sistema técnico de inspeção visual do aspeto das latas de alumínio, incluindo o design do sistema de imagem, os algoritmos de deteção de defeitos, o desenvolvimento da plataforma de software e as aplicações industriais práticas, fornecendo uma referência abrangente para os profissionais técnicos em áreas afins.
2. Projeto de hardware do sistema de inspeção visual
2.1 Configuração do Sistema de Imagem e da Fonte de Luz
O sistema de imagem é a base da inspeção visual, e o seu design determina diretamente a qualidade da imagem. Para a estrutura especial das latas de alumínio, é geralmente adotada uma arquitetura distribuída, onde são configuradas múltiplas estações de inspeção independentes para inspecionar, respetivamente, o fundo, o corpo e a tampa da lata. A estação de inspeção do fundo utiliza uma câmara de varrimento de área de alta resolução com uma fonte de luz circular, controlando com precisão o ângulo de incidência da luz para aumentar o contraste dos caracteres impressos a laser; a estação de inspeção do corpo da lata está configurada com três conjuntos de módulos de aquisição de fusão 2D-3D acionados sincronicamente, cada módulo contendo uma câmara de varrimento linear e um perfilómetro laser linear, instalados a intervalos de 120 graus para obter a varredura completa do corpo da lata.
O design da fonte de luz é fundamental para a resolução do problema da reflexão nos metais. Devido às fortes propriedades reflexivas das latas de alumínio para bebidas, diversas fontes de luz especiais são amplamente utilizadas: uma fonte de luz com esfera integradora utiliza uma parede interna hemisférica com efeito integrador para refletir uniformemente a luz emitida pela parte inferior em 360 graus, resultando numa imagem muito uniforme do fundo côncavo da lata; um sistema de fonte de luz LED composto consiste numa luz sem sombras de três anéis, uma luz sem sombras em forma de cúpula, uma luz de anel de baixo ângulo e uma luz coaxial. Controlando a combinação destas fontes de luz compostas, é possível obter contornos nítidos e imagens de alto contraste da tampa da lata; uma fonte de luz de área cónica dupla consiste em duas fontes de luz de área cónica posicionadas concentricamente, sendo que a fonte de luz superior ilumina o painel central e a fonte de luz inferior ilumina a área periférica. Os campos de luz sobrepostos melhoram significativamente a uniformidade da iluminação.
2.2 Hardware para Aquisição e Processamento de Imagens
As linhas de produção de alta velocidade têm requisitos rigorosos para o hardware de aquisição de imagens. As câmaras industriais inteligentes, como a Cognex In-Sight Micro 1400, são amplamente utilizadas devido ao seu tamanho compacto (30 mm x 30 mm x 60 mm) e às poderosas capacidades de processamento, permitindo a sua utilização em linhas de produção de altíssima velocidade com o mínimo de espaço ocupado. Estas câmaras possuem frequentemente algoritmos de visão computacional integrados e consolidados, que suportam funções como o julgamento, a inspeção de defeitos superficiais, a medição de dimensões e o reconhecimento OCR, melhorando significativamente a velocidade de desenvolvimento do sistema.
O módulo de processamento está geralmente centrado num computador industrial, equipado com um processador de alto desempenho e memória suficiente. Quando a lata de bebida é transportada para a estação de imagem, é acionado um transcetor fotoelétrico, enviando um sinal para a placa de entrada/saída do computador industrial. O computador controla então a fonte de luz para ligar e comanda a câmara para captar uma imagem. A imagem captada é transmitida para o computador industrial através de uma interface 1394 para análise e processamento.
3 Algoritmos de Detecção de Defeitos e Implementação Técnica
3.1 Detecção de defeitos de caracteres na parte inferior da lata
A deteção de caracteres impressos no fundo da lata enfrenta o desafio do baixo contraste, dado que os caracteres impressos a laser são de material semelhante ao do fundo metálico da lata, resultando em características pouco nítidas. Para resolver este problema, um método baseado na segmentação semântica saliente apresenta um excelente desempenho. A rede Res18-UNet utiliza a ResNet18 como estrutura básica do codificador, incorporando um módulo de atenção de bloco de características melhorado em cada fase de subamostragem. Ao realizar o agrupamento espacial e a recalibração de canais dos mapas de características, a capacidade do modelo de se focar na área dos caracteres é melhorada. A parte do descodificador adota uma estratégia de sobreamostragem progressiva, introduzindo um mecanismo de aprendizagem residual em cada ligação de salto, mitigando eficazmente o problema do desaparecimento do gradiente. Para lidar com a questão da orientação inconsistente dos caracteres causada pela rotação aleatória das latas, é amplamente utilizado um algoritmo de correcção de rotação baseado na transformação de coordenadas polares. Este algoritmo localiza primeiro o centroide da região do caractere através da análise de componentes ligados, calcula o ângulo relativo entre o centroide e o centro da imagem e, em seguida, realiza uma transformação afim para corrigir a orientação do caractere. Uma estrutura de rede convolucional leve é utilizada para a classificação de caracteres individuais. Convoluções separáveis em profundidade reduzem o número de parâmetros, e as operações de embaralhamento de canais melhoram a reutilização de recursos, atingindo uma velocidade de processamento de 300 caracteres por segundo, mantendo uma precisão de classificação de 99,5%.
3.2 Detecção de defeitos no corpo da lata
Os defeitos na lata incluem principalmente riscos, mossas e deformações. Os desafios na deteção destes defeitos residem na distorção da imagem causada pela superfície cilíndrica curva e na interferência de padrões de fundo complexos. Um método de melhoramento de imagem de defeitos na lata, auxiliado por informação de profundidade, melhora a taxa de deteção de defeitos convexos e côncavos através da fusão de dados multimodais. Este método constrói inicialmente um sistema de aquisição de visão trinocular, realiza a calibração conjunta utilizando uma placa de calibração de alta precisão e estabelece uma relação de mapeamento entre as coordenadas dos pixéis da imagem 2D e as coordenadas espaciais da nuvem de pontos 3D.
Para lidar com as características de aquisição de dados das latas cilíndricas, propõe-se um modelo melhorado de retroprojeção cilíndrica. Este modelo mapeia os dados da nuvem de pontos para um sistema de coordenadas cilíndricas parametrizado, eliminando a distorção de projeção causada por erros de instalação, resolvendo o ajuste ideal da nuvem de pontos ao modelo cilíndrico. Na etapa de melhoramento da imagem, uma estratégia de fusão de características multiescala realiza a fusão ponderada de imagens de textura 2D e mapas de profundidade em diferentes resoluções. Realça as descontinuidades de profundidade nos defeitos de amassamento e reforça as características de gradiente de aresta nos defeitos de arranhão.
O algoritmo HPFST-YOLOv5 melhora a precisão da deteção em fundos complexos através de uma estrutura inovadora de rede neural. Um mecanismo de atenção híbrido é projetado na estrutura principal da rede, incorporando o módulo de autoatenção multi-cabeças do Swin Transformer em camadas de extração de características em diferentes escalas. A atenção de janela local é utilizada em redes rasas para capturar características subtis de defeitos, enquanto a atenção global é utilizada em redes profundas para modelar dependências de longo alcance. Para lidar com o problema da atenuação da informação de bordo causada pelo desfoque de movimento, é adicionado um filtro passa-alto guia à entrada. Um operador diferencial de primeira ordem treinável extrai o mapa de resposta da aresta do defeito, que é depois inserido em paralelo com a imagem original na rede principal.
3.3 Detecção de defeitos na tampa/extremidade da lata
A estrutura da tampa da lata é complexa, incluindo múltiplas partes funcionais, como o painel central, as arestas periféricas, o painel de junção e a curvatura, cada uma das quais pode apresentar defeitos específicos. Para lidar com esta característica, uma estratégia de detecção regional tem-se mostrado eficaz. Uma investigação da Universidade de Hunan propõe dividir a área de deteção da tampa da lata numa região circular e numa região anular. Para a região circular é utilizado um método de deteção de defeitos baseado na análise de blobs, enquanto que para a deteção de defeitos na região anular, é empregado um algoritmo baseado no ajuste por mínimos quadrados da curva de projeção vertical em tons de cinzento.
O algoritmo de agrupamento por taxa de entropia, combinado com restrições de forma prévias, localiza eficazmente a extremidade da lata e divide-a em múltiplas regiões de medição. Este algoritmo baseia-se na representação gráfica da imagem e consegue uma separação precisa da extremidade da lata do fundo, otimizando a função objetivo. Quando o número de clusters é k=2, a extremidade da lata e o fundo são separados com precisão; à medida que k aumenta, o painel central, a borda exterior, o painel da costura e a curvatura são gradualmente extraídos. Para garantir a fiabilidade dos resultados da segmentação, são utilizadas restrições de forma prévias no pós-processamento. Com base na característica de que a extremidade da lata e todas as suas regiões de medição são círculos concêntricos ou anéis, o centro da extremidade da lata c(x,y) e o raio r são calculados através de um algoritmo de ajuste de círculos.
Para a deteção de defeitos na região central do painel, o algoritmo de agrupamento e seleção de superpixéis apresenta um excelente desempenho. Em primeiro lugar, é utilizado o algoritmo de agrupamento por taxa de entropia para gerar um grande número de superpixéis (Ni > 6000). De seguida, é construído um grafo de adjacência ponderado de regiões com cada superpixel Si como um nó, agrupando superpixels semelhantes. É definido um índice específico para avaliar a variação local dos tons de cinzento de cada região, e as regiões com defeito são identificadas através de limiarização.
3.4 Técnicas de Processamento de Reflexão e Melhoria de Imagem
A forte reflexão na superfície das latas metálicas é um importante fator de interferência que afeta a precisão da deteção. Para resolver este problema, uma tecnologia patenteada propõe um método de supressão de reflexos baseado na análise de imagens em tons de cinzento de múltiplos fotogramas. Este método obtém primeiro imagens em tons de cinzento de múltiplos fotogramas da lata de embalagem, realiza a deteção de arestas nessas imagens e utiliza as regiões formadas pelas arestas fechadas detetadas como regiões alvo; em seguida, calcula a probabilidade de a região-alvo ser uma região reflexiva. Esta probabilidade é calculada com base no valor médio dos tons de cinzento, no valor máximo dos tons de cinzento e nas características de reflexão abrangentes de todos os pixéis dentro da região alvo.
A transformação gama adaptativa determina o coeficiente gama com base na probabilidade da região reflexiva. Para cada pixel na região alvo, o valor de escala de cinzentos original correspondente é transformado utilizando a transformação gama para obter o valor de escala de cinzentos mais recente, resultando numa imagem em escala de cinzentos melhorada da embalagem. Esta transformação adapta-se a diferentes condições de iluminação e reflexão. Em áreas com forte reflexão, o coeficiente gama é ajustado em conformidade para reduzir o impacto da reflexão na deteção de defeitos. O cálculo abrangente da característica reflexiva da área alvo considera múltiplos fatores, incluindo o primeiro indicador (variação média da escala de cinzentos), o segundo indicador (consistência da direção do gradiente) e a semelhança entre múltiplos fotogramas (consistência da área alvo entre diferentes fotogramas). Ao analisar estes indicadores de forma abrangente, o sistema consegue distinguir com precisão entre defeitos reais e pseudodefeitos causados por reflexos, melhorando significativamente a precisão da deteção.
4. Plataforma de Software e Implementação do Sistema de Detecção
4.1 Arquitetura de Software e Workflow
O sistema de inspeção visual de latas de bebidas adota tecnologia de processamento paralelo multithread, com um thread de controlo principal, um thread de aquisição de imagem, um thread de processamento de algoritmo e um thread de saída de resultados. O thread de controlo principal é responsável por coordenar o fluxo de trabalho de cada módulo; o thread de aquisição de imagem adquire dados de duas estações em simultâneo através de sinais de disparo externos; o thread de processamento de algoritmos executa simultaneamente algoritmos de reconhecimento de caracteres e de deteção de defeitos; e o thread de saída de resultados integra os resultados da deteção e controla o dispositivo de rastreio.
Para garantir o desempenho em tempo real do sistema, é utilizado um mecanismo de interrupção por temporizador para restringir rigorosamente o ciclo de deteção de uma única lata, a tecnologia de mapeamento de memória é utilizada para realizar a troca rápida de dados de imagem de grande capacidade e a tecnologia de aceleração por GPU é utilizada para otimizar e implementar algoritmos de aprendizagem profunda. O sistema também integra uma função de ensino de parâmetros, permitindo aos operadores ajustar os parâmetros de deteção de acordo com as especificações do produto, e estabelece um módulo de base de dados para armazenar os resultados da deteção e as informações do produto, fornecendo suporte de dados para a rastreabilidade da qualidade.
O software de visão por computador Maotong In-Sight oferece praticidade no desenvolvimento de sistemas. O seu design baseado em algoritmos de folhas de cálculo permite aos utilizadores criar algoritmos de script utilizando folhas de cálculo sem a necessidade de programação avançada, possibilitando funções como o julgamento e o reconhecimento OCR, o que melhora significativamente a velocidade de desenvolvimento do sistema. Com base nas ferramentas inteligentes de processamento de imagem e nas funções de leitura e verificação de caracteres OCR do In-Sight Explorer, é fácil treinar caracteres a partir de imagens e criar uma biblioteca de caracteres.
4.2 Integração do Sistema e Avaliação de Desempenho
O sistema completo de inspeção visual de latas de bebidas integra três componentes principais: dispositivos eletromecânicos, sistema de imagem e módulo de processamento. O dispositivo eletromecânico realiza o controlo automático de movimento e a triagem das latas, incluindo a porta de entrada, o sistema de transporte e o sistema de triagem; o sistema de imagem é responsável pela aquisição de imagens de alta qualidade; e o módulo de processamento analisa e processa as imagens adquiridas.
Em termos de avaliação de desempenho, o sistema de deteção de defeitos em tampas de latas desenvolvido pela Universidade de Hunan consegue uma precisão de deteção superior a 96%, com um tempo médio de deteção de 18,6 ms por tampa, atendendo às necessidades das linhas de produção da indústria de bebidas. Baseada na aprendizagem profunda, a tecnologia de deteção de defeitos em latas obtém bons resultados de reconhecimento após 10 iterações de treino com uma taxa de aprendizagem de 0,0005, resultando numa taxa final de reconhecimento de defeitos por classificação binária de 99,7% e um tempo de execução do algoritmo de 119 ms. O sistema de deteção de extremidades de latas consegue uma precisão de deteção de até 99,48% para diversos formatos de extremidades circulares.
5. Aplicações Industriais e Perspectivas Futuras
5.1 Casos de Aplicação Prática
O sistema de inspeção visual do aspeto das latas foi aplicado com sucesso em diversos cenários industriais. Os sistemas de visão artificial da Cognex atingiram uma velocidade de 72.000 latas por hora e uma precisão de 99,99% na deteção de códigos de fundo em latas de bebidas, superando o estrangulamento técnico enfrentado no aumento da velocidade de produção na indústria alimentar e de bebidas.
O dispositivo de visão artificial para deteção de tampas de latas utiliza um sistema de transporte pneumático e adsorção a vácuo para garantir uma transmissão estável e o posicionamento preciso das tampas. Quando a tampa é transportada para a estação de imagem, é criada uma área de baixa pressão na superfície da passadeira por uma bomba de vácuo. Devido à diferença de pressão, a tampa é adsorvida de forma estável na passadeira e transportada ao longo da mesma por um motor CA. O sistema de triagem classifica as tampas com base nos resultados da inspeção, e as tampas defeituosas são separadas do tapete por um separador acionado por impulsos de ar comprimido.
5.2 Desafios técnicos e tendências de desenvolvimento
Apesar dos avanços significativos nas tecnologias existentes, a inspeção do aspeto das latas ainda enfrenta alguns desafios: detetar defeitos minúsculos é difícil, especialmente identificar microarranhões em fundos complexos; a interferência reflectora não foi completamente resolvida, particularmente em superfícies de alto brilho; o equilíbrio entre o desempenho em tempo real do algoritmo e a precisão precisa de otimização; e a adaptabilidade do sistema é limitada, exigindo ajustes de parâmetros quando o design da lata é alterado.
As tendências de desenvolvimento futuro incluem: a tecnologia de fusão de dados multimodais combinará a textura 2D, a morfologia 3D e a informação espectral para fornecer uma descrição mais abrangente das características dos defeitos; algoritmos de aprendizagem adaptativa irão otimizar continuamente o modelo com base nos dados da linha de produção, reduzindo a carga de trabalho do ajuste manual dos parâmetros; uma arquitetura combinada de computação de bordo e computação em nuvem irá garantir o desempenho em tempo real, utilizando big data baseado na nuvem para treinar modelos mais precisos; e o desenvolvimento de chips de IA embebidos impulsionará o sistema de deteção para um tamanho mais pequeno e um menor consumo de energia. 6. Conclusão
A tecnologia de inspeção visual de latas de bebidas integra avanços de diversas áreas, incluindo ótica, mecânica, eletrónica e visão por computador, e é um importante indicador do nível de automação industrial. Desde o design do sistema de imagem à otimização do algoritmo, desde a seleção de hardware até ao desenvolvimento da plataforma de software, cada etapa afeta diretamente o desempenho final da deteção. Atualmente, os métodos de deteção baseados na aprendizagem profunda superaram os algoritmos tradicionais em muitos aspetos, mas, em aplicações industriais práticas, é geralmente necessário combinar as vantagens dos métodos tradicionais de processamento de imagem com as técnicas de aprendizagem profunda para construir um sistema de deteção híbrido.
Com a implementação aprofundada da estratégia nacional "Made in China 2025", a tecnologia de inspeção visual de latas de bebidas evoluirá para uma direção mais inteligente, eficiente e fiável. Isto não só ajuda os fabricantes de latas a utilizar a tecnologia de IA para promover a produção inteligente e reduzir os custos de mão-de-obra, como também está alinhado com a estratégia nacional de modernização da indústria transformadora, possuindo implicações práticas significativas. No futuro, com o progresso contínuo da tecnologia de sensores, da teoria dos algoritmos e das capacidades computacionais, os sistemas de inspeção visual das latas de bebidas desempenharão, sem dúvida, um papel ainda mais importante na indústria alimentar e das bebidas, salvaguardando a qualidade do produto.

