Radar - Transcrição de áudio e vídeo em tempo real
Agente autônomo (Python/Whisper) para transcrição e monitoramento de áudio 24/7 em tempo real. Otimizado para rodar localmente em hardware modesto, ele automatiza o clipping de notícias gerando alertas com contexto e minutagem exata.
#Telas do Sistema
O Radar é um agente autônomo projetado para atuar como um "hospedeiro do bem" em infraestruturas legadas, atualmente. Ele roda silenciosamente como um serviço do Windows em máquinas de gravação locais, automatizando o monitoramento 24/7, a transcrição de áudio e a clipagem de notícias em tempo real.
O projeto nasceu para resolver um gargalo massivo de operação: a necessidade de analistas ouvirem até 8 horas ininterruptas de programação de rádio e TV para encontrar menções a clientes.
A Solução e Arquitetura
Como a captura de áudio/vídeo já era feita por um sistema de terceiros, o Radar foi arquitetado para monitorar os diretórios de gravação, extrair o áudio e processar a Inteligência Artificial localmente (edge computing), sem depender de APIs em nuvem.
- Processamento Assíncrono: Dividido em 3 módulos independentes — um sincronizador de banco de dados (
sync_db.py), um motor de IA em tempo real (watcher.py) e um mensageiro SMTP (mailer.py). - Transcrição Offline: Utiliza o modelo Whisper (ggml-base) rodando nativamente na CPU, garantindo privacidade total dos dados e custo zero de API.
- Pipeline de Extração: Usa
PollingObserverpara detectar novos arquivos, converte o áudio instantaneamente com FFmpeg (.wav) e gera legendas (SRT). - Filtros de Contexto Inteligentes: O sistema não apenas encontra a palavra-chave via Regex, mas recorta o contexto exato (palavras antes e depois) e calcula a hora absoluta em que o termo foi falado na TV, ignorando palavras curtas ou irrelevantes.
- Infraestrutura Invisível: Empacotado com NSSM para rodar como um serviço imortal no Windows, garantindo que o processamento continue mesmo com o computador bloqueado.
O Impacto
O Radar revolucionou a esteira de clipagem. Ao entregar a minutagem exata e o contexto da notícia no e-mail a cada 2 horas, o analista vai direto ao ponto. O ganho de eficiência foi de 600%: hoje, 1 única pessoa consegue fazer o trabalho que antes exigia 6 analistas.
Além do impacto no negócio, o projeto é um case de otimização extrema de hardware. Mesmo com modelos pesados de IA, a arquitetura permite monitorar, transcrever e cruzar palavras-chave de 4 canais simultâneos (24/7) utilizando apenas uma máquina com processador i5-9400t, GPU integrada e 8GB de RAM.