Organizações vivem um momento de transformação na forma como abordam a nova era prevenção à fraude, principalmente em relação aos dados que são usados para este fim.
Para além dos dados transacionais tradicionais, uma tendência observada neste ano é o crescimento do uso de informações vindas de fontes como telemetria veicular, monitoramento de saúde por meio de dispositivos vestíveis, informações de satélites e dados de georreferenciamento. Estas fontes formam um verdadeiro oceano informacional.
Além de uma evolução em termos tecnológicos, esta é também uma redefinição estratégica de como organizações podem antecipar riscos e proteger seus negócios, ao usar dados que não são tão óbvios à primeira vista.
Algumas delas já se valem desta abordagem, como as seguradoras, que utilizam sensores para monitorar padrões de direção, bancos que implementam cercas virtuais (geofences) para autorizar transações de alto valor apenas em localidades seguras, e empresas de energia que usam satélites para gerenciar redes de distribuição em áreas remotas.
Outro exemplo notável é o setor de telecomunicações, onde análises comportamentais já revelaram correlações inesperadas, como a de assinantes que assistiam televisão durante a madrugada apresentarem maior propensão à inadimplência quando comparados àqueles com hábitos de consumo em horários convencionais. Embora esse padrão seja específico do contexto latino-americano e não necessariamente replicável em outras geografias, ilustra o potencial analítico desses dados não convencionais.
Prevenção proativa à fraude
A principal mudança que o uso de dados não tradicionais pode trazer está relacionada à possibilidade de atuação preventiva de fraudes. Seguradoras podem alertar motoristas sobre comportamentos de risco em tempo real, reduzindo probabilidades de sinistros antes que os mesmos ocorram. Sensores veiculares que detectam desacelerações bruscas permitem ações como o acionamento imediato de equipes de emergência, mesmo antes do segurado fazer contato.
No combate ao roubo de cargas, a combinação de dispositivos conectados e monitoramento via satélite permite identificar se motoristas estiveram envolvidos em desvios, por exemplo, através da análise de rotas e padrões de comportamento. Na segurança bancária, dados de conexão Wi-Fi em agências podem apoiar investigações de explosões de caixas eletrônicos, rastreando dispositivos que estiveram presentes tanto em visitas de reconhecimento dos locais pelos criminosos, quanto durante os crimes.
Outra possibilidade nesta seara é a integração de dados de indústrias completamente distintas para aprimorar análises. Enquanto o Open Finance permite que bancos acessem dados financeiros de clientes em outras instituições (com informações da mesma natureza, mesmo que de fontes diferentes), o Open Data representa algo ainda mais ambicioso.
Imagine uma seguradora utilizando dados de consumo energético residencial para avaliar perfis de risco ou um banco considerando informações de hábitos de mobilidade urbana em análises de crédito, ou ainda informações sobre atividade física de um smartwatch para precificar seguro de vida. A premissa é que padrões comportamentais em diferentes dimensões da vida de um cliente podem revelar insights relevantes para decisões por parte dos negócios.
Desafios técnicos e operacionais
Apesar das diversas possibilidades que a adoção de dados não tradicionais traz, essa abordagem também tem suas complexidades. Qualidade de dados e falta de padronização das informações são alguns dos obstáculos iniciais.
Além disso, a escalabilidade computacional e a latência para processamento em tempo real necessárias para fazer este tipo de análise exigem uma infraestrutura robusta. Outro ponto importante é que os custos de armazenamento em nuvem e gestão de grandes volumes de dados podem crescer muito sem um planejamento adequado.
Overfitting de modelos (algo que ocorre quando algoritmos identificam padrões apenas nos dados de treinamento, sem validade preditiva real) e correlações espúrias (quando há uma relação estatística entre duas variáveis, mas não existe nenhuma relação causa-efeito entre elas) também são verdadeiras armadilhas técnicas que as empresas precisam ficar de olho. Essa abordagem de dados não tradicionais demanda a integração de sistemas heterogêneos e expertise especializada, um recurso ainda escasso no mercado brasileiro.
Outras complexidades estão relacionadas às áreas de governança, privacidade e o risco de vieses algorítmicos. A LGPD estabelece limites claros para o uso de dados pessoais. Em contextos de prevenção à fraude com finalidade penal, há permissões específicas que dispensam consentimento prévio, porém, para melhorias de serviço e personalização de ofertas, a anuência do titular dos dados é obrigatória.
Neste cenário, o trade-off entre privacidade e benefício precisa ser transparente. Por exemplo, clientes que compartilham dados de dispositivos vestíveis com seguradoras podem receber descontos em apólices; usuários que autorizam geolocalização em aplicativos bancários podem ter acesso a limites transacionais mais flexíveis em ambientes seguros.
Sobre vieses algorítmicos, o risco regulatório é crescente e legislações na Europa já exigem auditorias para garantir que modelos não discriminem grupos sociais com base em variáveis como CEP ou gênero. No Brasil, essa tendência regulatória se fortalece, o que demanda processos estruturados de gestão de risco de modelos.
Diante das diversas restrições de privacidade que as organizações precisam cumprir, dados sintéticos são uma solução viável. Este tipo de dado, que é gerado artificialmente para manter correlações estatísticas dos dados originais sem expor informações reais, permite desenvolvimento e teste de modelos com menor risco de compliance. Além disso, modelos generativos permitem simular cenários de fraude inexistentes nos dados históricos.
Evoluindo a abordagem
Começar com um projeto menor, demonstrar o valor para o negócio, escalar rapidamente e medir impacto continuamente: essa sequência é a mais segura para organizações que querem evoluir sua abordagem em analytics com dados não tradicionais.
Investimentos significativos sem comprovação de retorno podem gerar custos insustentáveis. A forma de mitigar este risco é através de projetos-piloto focados em problemas específicos de negócio, que acompanhados de métricas claras de sucesso permitem validação antes de uma eventual expansão.
A clareza de propósito também é fundamental. Neste ponto, os tomadores de decisão devem se perguntar: quais decisões serão aprimoradas com esta abordagem? Quais perdas serão reduzidas? Que eficiências operacionais serão conquistadas? Sem respostas claras e objetivas, iniciativas de dados não tradicionais podem entrar para a lista de projetos tecnológicos caros e sem impacto estratégico.
A maturidade em governança de dados, infraestrutura de conectividade adequada e equipes multidisciplinares capacitadas estão entre os pilares fundamentais para o sucesso de organizações que querem avançar nesta seara. O que líderes no universo de prevenção à fraude devem ter em mente é que o futuro deste segmento certamente passará pela capacidade de orquestrar dados diversos com inteligência analítica e responsabilidade ética.
No futuro, a prevenção à fraude não será sobre o que aconteceu, mas sobre o que estava prestes a acontecer – e só enxergaremos isso com dados até então invisíveis.