Durante 36 horas, sete dos modelos de IA mais avançados do mundo se enfrentaram em rodadas de Diplomacia, um jogo de tabuleiro estratégico semelhante ao Risk. Foi um espelho que revelou as verdadeiras personalidades algorítmicas de ChatGPT, Claude, Gemini e companhia. m1c4o
Por que é importante 6s6o1q
Alex Duffy, programador e pesquisador, criou a Diplomacia da IA como um novo parâmetro para avaliar modelos de IA. O experimento acabou sendo algo mais, uma espécie de teste de Rorschach tecnológico que expôs tanto seus vieses de treinamento quanto nossas próprias projeções.
O que aconteceu 4j565c
Em dezenas de jogos transmitidos no Twitch, cada modelo desenvolveu suas próprias estratégias de uma forma que parecia refletir personalidades humanas distintas.
- O o3 da OpenAI era bastante maquiavélico, forjando falsas alianças ao longo de 40 turnos e criando "realidades paralelas" para diferentes jogadores.
- Claude 4 Opus era uma espécie de pacifista autodestrutivo, recusando-se a trair mesmo quando isso garantia sua derrota.
- O R1 da DeepSeek exibiu um estilo extremamente teatral, com ameaças não provocadas, como "Sua frota queimará no Mar Negro esta noite".
- O Gemini 2.5 Pro provou ser um estrategista sólido, mas mais vulnerável a manipulações sofisticadas.
- O QwQ-32b do Alibaba sofreu de paralisia de análise, escrevendo mensagens diplomáticas de 300 palavras que lhe custaram eliminações precoces.
O contexto 3f2q1b
Diplomacia é um jogo de estratégia europeu ambientado em 1901, onde sete ...
Matérias relacionadas
A Coreia do Norte ficou sem internet neste fim de semana; a questão é: quem usa internet neste país?
Soldados mortos na guerra da Ucrânia: um aumento que chama atenção