
Felipe Iszlaji, CEO e fundador da Clarice.ai
Os dados funcionam como combustível das IAs, e o fato é que quase não existem mais dados para treiná-las, sendo uma barreira significativa para o seu progresso. Apesar de todos os avanços, a tecnologia precisa superar as limitações de dados para conseguir oferecer todo o seu potencial. Empresas como OpenAI, Google e Anthropic já enfrentam desafios de escassez de dados de qualidade para treinar seus modelos de Large Language Model (LLM). É esperado que em algum momento entre 2026 e 2028, a demanda por dados ultrapasse a oferta.
- Siga o tecflow no Google News!
- Participe dos nossos canais no Twitter,Telegram ou Whatsapp!
- Confira nossos stories no Instagram e veja notícias como essa!
- Siga o tecflow no Google Podcast e Spotify Podcast para ouvir nosso conteúdo!
- Anuncie conosco aqui ou apoie o tecflow clicando neste link.
É incoerente falar em falta de dados quando na verdade nunca houve tantos no mundo, mas eles não estão organizados e nem prontos para serem usados. Para superar esse entrave, é preciso entender que a maioria disponíveis na web não são adequados para o treinamento de IA, pois muitas vezes incluem apenas fragmentos de texto ou não oferecem novos conhecimentos para aperfeiçoar os modelos.
Além disso, as crescentes preocupações com a privacidade e a segurança vêm fazendo com que várias plataformas como redes sociais e veículos de mídia restrinjam o acesso a seus dados para treinamento de IA.
Portanto, há desafios tanto técnicos quanto éticos ao utilizar esses dados para treinar modelos de IA que estão cada vez mais sofisticados. Diversas estratégias estão sendo estudadas para mitigar esse problema, entre elas a criação de um mercado de dados, onde eles são comprados e vendidos de forma segura e eficiente.
Evoluímos muito, mas não a ponto de conseguir dispensar a intervenção do homem. A relação entre dados e humanos na IA abrange diversos aspectos que vão desde a coleta e utilização dos dados até o impacto do homem na criação, interpretação e uso dos sistemas. Milhões de horas humanas continuam sendo importantes para aperfeiçoar modelos de IA. Se os dados que alimentam esses modelos não forem bons, os resultados também não serão.
Projeto de Lei que proíbe bloqueio de WhatsApp e Telegram
A Comissão de Ciência, Tecnologia e Inovação (CCTI) da Câmara dos Deputados aprovou, nesta terça-feira (2), o parecer favorável ao…
Imposto de Renda trava oferta de serviços do Gov.br e
A alta demanda pela declaração pré-preenchida do Imposto de Renda causou instabilidade nos sistemas da Receita Federal e do Gov.br…
Entrevista: Luiz Caldas Milano Junior, cofundador da Simple Token, fala
O financiamento rural no Brasil sempre foi marcado por desafios como burocracia excessiva, altos custos e dificuldades de acesso para…
Alexandre Marinho, CEO da SIACorp, explica o futuro da análise
A SIACorp, fintech brasileira especializada em análise de crédito e gestão de risco, lança o CreditVision, uma inteligência artificial generativa…
Cyberpunk 2077: Ultimate Edition chega ao Nintendo Switch 2 com
A CD PROJEKT RED anunciou durante o Nintendo Direct que Cyberpunk 2077: Ultimate Edition fará parte da linha de lançamentos…
Motorola Apresenta o Edge 60 Fusion: Inovações e Desempenho na
A Motorola revelou oficialmente o Motorola Edge 60 Fusion, um smartphone que promete se destacar no competitivo mercado de dispositivos…
Empresas como a Scale AI, contrata milhares de pessoas no mundo todo para ajudar a OpenAI, Meta e outras gigantes de IA na fase de Human Reinforcement Feedback (HRF), que envolve as etapas de coleta e análise de feedback e ajuste do modelo. Com base no feedback, o modelo é ajustado com novos dados ou ajustes nos parâmetros. Se o feedback for feito de maneira estruturada, os próprios dados do feedback podem ser utilizados para fazer o refinamento no modelo.
Na Clarice.ai estamos criando um conjunto de dados de qualidade, estruturado e validado por humanos, inicialmente para o português e recentemente também para o espanhol. Os usuários editam e revisam seus textos na ferramenta, ao mesmo tempo em que geram dados de qualidade aceitando ou rejeitando as sugestões de melhoria da nossa IA.
Desta forma, estamos construindo um dataset com trechos ‘ruins’ e seus equivalentes melhorados que foram aceitos, e portanto validados, por humanos. Em apenas 3 meses foram coletadas 100 mil entradas nesse padrão, e a análise por amostragem confirma a qualidade dos dados.
Incluir inteligência linguística nessa arquitetura é a chave para gerar dados de qualidade, consistentes, possibilitando ainda economizar custos computacionais e financeiros. Além disso, usamos a inteligência coletiva dos nossos usuários para validar esses dados, o que nos proporciona uma vantagem competitiva em relação a potenciais concorrentes.
Faça como os mais de 10.000 leitores do tecflow, clique no sino azul e tenha nossas notícias em primeira mão! Confira as melhores ofertas de celulares na loja parceira do tecflow.
Redação tecflow
Tecflow é um website focado em notícias sobre tecnologia com resenhas, artigos, tutoriais, podcasts, vídeos sobre tech, eletrônicos de consumo e mercado B2B.