Cientistas clonam o ChatGPT gastando apenas R$ 3 mil

24/03/202324/03/2023 alexssandro

Pesquisadores da Universidade de Stanford, nos Estados Unidos, conseguiram clonar o ChatGPT por um custo de apenas US$ 600 (pouco mais de R$ 3 mil na conversão atual). Chamado Alpaca GPT, a tecnologia prova que softwares como os criados pela OpenAI podem ser mais simples de replicar do que se imagina.

Os estudiosos pertencem ao Centro de Pesquisa em Modelos de Fundação de Stanford. Como trabalho acadêmico, resolveram criar um modelo de linguagem próprio a partir da tecnologia da Meta — LLaMA 7B — e integrado com a API GPT da OpenAI.

Como eles não precisaram criar o algoritmo do zero nem investir em máquinas potentes para desenvolver a tecnologia, o custo total foi apenas pago às empresas para fins de licenciamento. Foram US$ 500 para a OpenAI e apenas US$ 100 para a Meta, o que permitiu o uso para a criação do projeto atual.

A quantia é irrisória se comparada aos milhões, talvez bilhões, investidos pelas duas Big Techs na criação de suas ferramentas de IA. A Alpaca GPT exibe comportamento muito semelhante ao GPT-3.5, usado para alimentar a versão inicial do ChatGPT.

Alpaca GPT surpreendeu pela capacidade

Os pesquisadores de Stanford disseram ter ficado muito surpresos quando compararam a Alpaca com outros modelos do mercado. Em alguns casos, disseram que a tecnologia chegou a ser superior, com resultados mais diretos e precisos que o próprio ChatGPT.

Mesmo com o avanço, a IA de Stanford ainda sofre de várias deficiências comuns aos modelos de linguagem, como “alucinação, toxidade e estereótipos”. Esses são problemas que o GPT-4 e sucessores buscam combater, afinal ninguém quer conversar com uma inteligência que começa a “surtar” do nada, dando respostas ríspidas, incoerentes ou totalmente descontextualizadas.

Para chegar ao resultado, a equipe pediu ao GPT que pegasse 175 pares de instruções escritas por humanos e começasse a gerar mais no mesmo estilo e formato, sempre com a apresentação de 20 de cada vez. Esse processo foi automatizado por uma das APIs da OpenAI, o que gerou, em pouco tempo, mais de 52 mil conversas.

Essas interações viraram uma amostra considerável usada no treinamento do modelo LLaMA. O resultado foi a otimização da base de dados da Meta com a capacidade de processamento da solução da OpenAI, criando um terceiro produto (Alpaca) por menos R$ 3,1 mil e mais capacidade que os dois produtos.

IAs em alta e mercado movimentado

As últimas semanas foram movimentadas no terreno das inteligências artificiais. Após a OpenAI lançar sua API para o mercado, a Meta teve a LLaMA vazada na Web e a Microsoft decidiu acabar com a fila de espera para uso do Bing Chat.

Logo em seguida, foi lançado o GPT-4 e o Ernie Bot, da chinesa Baidu, que decepcionou pela simplicidade. Na semana passada, o gerador de imagem a partir de texto Midjourney também ganhou uma versão otimizada para criar fotos e artes ainda melhores.

Fato é que enquanto empresas como Microsoft, OpenAI e Meta torram milhões de dólares para desenvolver modelos de IA, cientistas conseguem criar soluções muito mais baratas. Será que a “pirataria tecnológica” poderia ser uma ameaça ao desenvolvimento das IAs generativas? Esta pode ser uma boa discussão para o futuro.