Radar - Transcrição de áudio e vídeo em tempo real

Agente autônomo (Python/Whisper) para transcrição e monitoramento de áudio 24/7 em tempo real. Otimizado para rodar localmente em hardware modesto, ele automatiza o clipping de notícias gerando alertas com contexto e minutagem exata.

O Radar é um agente autônomo projetado para atuar como um "hospedeiro do bem" em infraestruturas legadas, atualmente. Ele roda silenciosamente como um serviço do Windows em máquinas de gravação locais, automatizando o monitoramento 24/7, a transcrição de áudio e a clipagem de notícias em tempo real.

O projeto nasceu para resolver um gargalo massivo de operação: a necessidade de analistas ouvirem até 8 horas ininterruptas de programação de rádio e TV para encontrar menções a clientes.

A Solução e Arquitetura

Como a captura de áudio/vídeo já era feita por um sistema de terceiros, o Radar foi arquitetado para monitorar os diretórios de gravação, extrair o áudio e processar a Inteligência Artificial localmente (edge computing), sem depender de APIs em nuvem.

Processamento Assíncrono: Dividido em 3 módulos independentes — um sincronizador de banco de dados (sync_db.py), um motor de IA em tempo real (watcher.py) e um mensageiro SMTP (mailer.py).
Transcrição Offline: Utiliza o modelo Whisper (ggml-base) rodando nativamente na CPU, garantindo privacidade total dos dados e custo zero de API.
Pipeline de Extração: Usa PollingObserver para detectar novos arquivos, converte o áudio instantaneamente com FFmpeg (.wav) e gera legendas (SRT).
Filtros de Contexto Inteligentes: O sistema não apenas encontra a palavra-chave via Regex, mas recorta o contexto exato (palavras antes e depois) e calcula a hora absoluta em que o termo foi falado na TV, ignorando palavras curtas ou irrelevantes.
Infraestrutura Invisível: Empacotado com NSSM para rodar como um serviço imortal no Windows, garantindo que o processamento continue mesmo com o computador bloqueado.

O Impacto

O Radar revolucionou a esteira de clipagem. Ao entregar a minutagem exata e o contexto da notícia no e-mail a cada 2 horas, o analista vai direto ao ponto. O ganho de eficiência foi de 600%: hoje, 1 única pessoa consegue fazer o trabalho que antes exigia 6 analistas.

Além do impacto no negócio, o projeto é um case de otimização extrema de hardware. Mesmo com modelos pesados de IA, a arquitetura permite monitorar, transcrever e cruzar palavras-chave de 4 canais simultâneos (24/7) utilizando apenas uma máquina com processador i5-9400t, GPU integrada e 8GB de RAM.

Radar - Transcrição de áudio e vídeo em tempo real

#Telas do Sistema

A Solução e Arquitetura

O Impacto