Abrir câmera

Milhares de pessoas estão vendendo seus dados para treinar IAs

O boom da inteligência artificial tem gerado uma grande procura por dados. Essas informações são fundamentais no processo de treinamentos das IAs, o que permite que essas tecnologias se tornem cada vez mais avançadas.

Desde gravações de voz até conversas privadas, essa nova economia digital promete dinheiro rápido, com milhares de pessoas aceitando vender seus dados. No entanto, esconde alguns riscos que muitos descobrem tarde demais.

A corrida global pelos dados

Conforme a ‘fome’ do Vale do Silício por informações supera o que pode ser coletado gratuitamente na internet aberta, surgiu toda uma indústria para preencher essa lacuna. As plataformas se multiplicaram rapidamente, oferecendo alguns centavos por cada conversa, por exemplo.

Bouke Klein Teeselink, professor de economia no King’s College London, prevê que o treinamento de IA como trabalho temporário se tornará uma categoria substancialmente maior nos próximos anos. As empresas sabem que pagar pessoas para licenciar seus dados ajuda a evitar disputas de direitos autorais que poderiam enfrentar dependendo exclusivamente de conteúdo extraído da web.

Os modelos de linguagem de IA, como ChatGPT e Gemini, demandam quantidades enormes de material de aprendizado para se aperfeiçoar. O problema é que as fontes de treinamento mais utilizadas – como C4, RefinedWeb e Dolma, que representam um quarto dos conjuntos de dados de mais alta qualidade na web – agora restringem o uso de suas informações para o treinamento das ferramentas.

Dados humanos são fundamentais para aperfeiçoar sistemas de IA (Imagem: Anggalih Prasetya/Shutterstock)

Pesquisadores estimam que as empresas de IA não terão mais de onde tirar dados ainda em 2026. Alguns laboratórios tentaram alimentar seus sistemas com dados sintéticos que a própria inteligência artificial gera, mas esse processo pode levar os modelos a produzir conteúdos cheios de erros.

Veniamin Veselovsky, pesquisador de IA, explica que as empresas precisam de dados de alta qualidade para modelar comportamentos novos e aprimorados em seus sistemas. “Dados humanos, por enquanto, são o padrão ouro para amostrar fora da distribuição do modelo”, afirma.

Leia mais

Nem Claude, nem ChatGPT: Pentágono escolhe IA do exército
CEO da Nvidia propõe pagar funcionários com tokens de IA
Corrida da IA entra na era da inferência; entenda o que é

Os riscos ocultos do negócio

Se, por um lado, vender dados para a IA pode garantir uma grana extra, por outro, há uma série de riscos invisíveis.
Isso acontece porque os usuários aceitam abrir mão daquelas informações.
Dessa forma, uma gravação de voz de 20 minutos poderia servir como base para a criação de uma obra digital, por exemplo, sem que o dono dos dados receba um centavo a mais por isso.
Devido à falta de transparência nesses mercados, o rosto de um usuário poderia acabar em um banco de dados de reconhecimento facial ou em um anúncio do outro lado do mundo.
E não há nada que a pessoa possa fazer legalmente para reverter a situação.
As informações são do The Guardian.

O post Milhares de pessoas estão vendendo seus dados para treinar IAs apareceu primeiro em Olhar Digital.

* Todas as notícias são retiradas de fonte de sites conforme informado na última linha “apareceu primeiro em …”

Compartilhe esta postagem:

Facebook
Twitter
LinkedIn
Pinterest

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Últimas Notícias
Previsão do Tempo
+27
°
C
+28°
+23°
Campos dos Goytacazes
Quinta-Feira, 01
Ver Previsão de 7 Dias
Categorias

Assine nossa newsletter

Queremos oferecer para os ouvintes a playlist das melhores músicas Pop Rock!