Dados sintéticos aceleram nas organizações, mas por que agora?

A abordagem tem ganhado tração nos setores de saúde e serviços financeiros, onde dados sintéticos aceleram sua adoção, com possibilidades interessantes no setor público — e o momento atual é propício para expansão.

A privacidade é um fator essencial na tomada de decisões com base em dados, e atualmente as regulamentações nesta frente têm se tornado cada vez mais rigorosas. Neste contexto, uma abordagem tecnológica, o uso de dados sintéticos, promete mudar a forma como as empresas lidam com informações sensíveis. Dados sintéticos aceleram a capacidade de inovar com segurança, reduzindo os riscos de exposição de informações pessoais e ampliando a disponibilidade de dados para análises e o seu uso por inteligências artificiais.

Uma forma simples de entender dados sintéticos é pensar neles como uma reprodução inteligente de informações reais, em que características estatísticas e padrões originais são mantidos, sem revelar a identidade da pessoa associada àqueles dados. É como ter uma versão anonimizada dos seus dados que preserva toda a utilidade analítica, mitigando os riscos de privacidade. Desta forma, é possível gerar insights que agregam ao negócio sem comprometer a confidencialidade de clientes ou colaboradores.

Os dados sintéticos também buscam tratar o problema da completude dos dados. Muitas vezes, empresas se deparam com lacunas em suas bases de dados, e a abordagem sintética pode preencher esses gaps, gerando informações consistentes com os padrões existentes, Nesse cenário, dados sintéticos aceleram a criação de conjuntos de dados mais robustos para análises e treinamento de modelos de IA.

O que mudou para os dados sintéticos acelerarem agora?

Estudos recentes ilustram um apetite real de mercado por esta nova abordagem. Dados da consultoria Gartner sugerem que cerca de 75% das empresas globais vão utilizar inteligência artificial (IA) generativa para criar dados sintéticos até 2026, frente a um uso de menos de 5% em 2023. É um salto gigantesco de adoção, mas por que esta aceleração no uso de dados sintéticos está acontecendo agora?

Uma possível resposta é o fato de os dados sintéticos serem uma solução elegante, que permite estender o ciclo de vida útil de informações, ao transformá-las em recursos que podem ser utilizados por períodos mais longos sem violar regras de privacidade. Ou seja, as empresas coletam informações de forma constante, mas invariavelmente enfrentam limitações de tempo para o uso delas devido a regulamentações ou políticas internas, restrições essas que também vêm aumentando.

Setores que lideram essa transformação

Os setores de saúde e serviços financeiros aparecem entre os líderes de adoção, apesar de empresas de praticamente todos os segmentos poderem se beneficiar dos dados sintéticos. Na área da saúde, por exemplo, esta abordagem pode ampliar amostras de grupos étnicos sub-representados, melhorando diagnósticos e tratamentos para populações que historicamente receberam menos atenção médica ou temos poucos dados para análise. Imagine poder treinar sistemas de diagnóstico por imagem com dados sintéticos que representam a diversidade da população brasileira de forma adequada e mais próxima da realidade? Isso pode ajudar a obter os melhores tratamentos para todos.

O setor público também tem um potencial imenso. O Reino Unido já desenvolve projetos onde departamentos utilizam ferramentas de IA alimentadas por dados sintéticos para melhor compreender e atender comunidades ou grupos sub-representados. E quando pensamos no potencial em governos no Brasil e na América Latina, essa abordagem poderia revolucionar a prestação de serviços públicos, permitindo que governos locais, estaduais e federais desenvolvam políticas mais inclusivas e eficazes.

Porém, gostaria de reforçar dois pontos importantes. Os dados sintéticos não são “automaticamente privados”. Um é da necessidade de aplicar técnicas e métricas adequadas de avaliação para equilibrar utilidade e privacidade em cada caso de uso, usando fornecedores e serviços confiáveis. O outro é a importância da supervisão humana no processo e validação dos resultados. Órgãos reguladores, como o ICO (Reino Unido), orientam que “privacy‑enhancing technologies” (PETs), incluindo dados sintéticos, podem reduzir riscos e viabilizar um compartilhamento responsável quando bem implementadas.

Para além destes exemplos do mundo corporativo, um caso bem interessante de uso desta tecnologia é o projeto desenvolvido pelo SAS para proteção de baleias no porto de Nova York. Ao utilizar dados sintéticos sobre a movimentação desses mamíferos, foi possível criar sistemas que evitam colisões entre embarcações e baleias, o que ajudou a proteger tanto a vida marinha quanto o patrimônio naval. Essa história ilustra como esta tecnologia também pode gerar um impacto social positivo.

Tudo isso só tem sido possível graças à democratização dessas ferramentas. Plataformas modernas, como o SAS Data Maker, foram desenvolvidas para viabilizar um uso intuitivo e que não exige conhecimento profundo de programação. Isso significa que analistas de negócios podem criar dados sintéticos por meio de interfaces low‑code/no‑code (pouco código ou nenhum código), o que torna essa tecnologia acessível a um público muito mais amplo, gerando impacto para além de times técnicos especializados.

Essa facilidade de uso é crucial: quando apenas especialistas técnicos conseguem operar uma tecnologia, o alcance fica limitado. Quando profissionais de diferentes áreas conseguem empregar os mesmos recursos, as possibilidades de aplicação se multiplicam.

O que vem pela frente

Falando na arte do possível, os próximos anos prometem quando o assunto é dados sintéticos. Empresas que ainda têm projetos engavetados por falta de dados adequados poderão, finalmente, colocar estas ideias em prática. Setores muito regulamentados também devem ter mais flexibilidade para inovar sem comprometer a aderência às regras.

Outro aspecto empolgante da aceleração do uso de dados sintéticos é o potencial de inclusão. Dados sintéticos podem equilibrar amostras e reduzir vieses em bases de dados, garantindo sistemas de IA mais justos e eficazes.

À medida que marcos regulatórios sobre IA se consolidam ao redor do mundo, dados sintéticos se posicionam como uma tecnologia crucial para equilibrar inovação e responsabilidade. Não é só uma questão de ter mais dados, e sim sobre ter dados melhores: mais seguros, mais amplos e mais representativos da diversidade humana.

Conheça também minha visão sobre o impacto da IA nas profissões neste artigo: Em um futuro do trabalho com IA, o diferencial será humano

Blogs

Blogs

Dados sintéticos aceleram nas organizações, mas por que agora?

O que mudou para os dados sintéticos acelerarem agora?

Setores que lideram essa transformação

O que vem pela frente

About Author