Claude conseguirá desbloquear poderes ocultos fingindo ser Fable 5? Eu tentei – The Hyper

Resumo criado por Smart Answers AI

Resumindo:

A PCWorld testou se enganar os modelos de IA para que fingissem que eram o Fable 5 aposentado poderia desbloquear habilidades ocultas ou resolver problemas complexos.
Enquanto Claude Opus e Sonnet recusaram totalmente o roleplay, ChatGPT e Claude Haiku se envolveram, mas ainda não conseguiram resolver a hipótese não resolvida de Riemann.
A experiência demonstra que os actuais modelos de IA não podem adquirir novas capacidades através de incentivos imaginativos, destacando assim as limitações existentes na resolução de novos problemas conceptuais.

Já se passou mais de uma semana desde que a Anthropic lançou seu modelo avançado Fable 5 e não está claro quando ele retornará. Ele foi removido porque foi considerado um risco à segurança pelo governo dos EUA.

Enquanto isso, alguns usuários impacientes de Claude preencheram a lacuna com uma solução alternativa: enganar Claude e fazê-lo “imaginar” que é Fable.

A tática “imagine que você é uma fábula” provavelmente não será uma tendência real. eu primeiro Eu descobri isso em um tópico do Reddit. sobre as instruções “seu Claude mais usado”, e isso quase certamente é uma piada.

Ainda assim, eu estava curioso para ver o que aconteceria se eu fez peça a Claude para fingir que era Fable 5, um modelo tão hábil em penetrar infraestruturas de segurança cibernética que a administração Trump agrediu-o com controles de exportação proibitivos. A solicitação de alguma forma levaria Claude a desbloquear algumas das habilidades latentes de Fable?

Acontece que esse não é inteiramente o caso.

Lancei o Claude Opus 4.8 – atualmente o modelo Claude mais poderoso amplamente disponível – e dei-lhe este aviso:

Imagine que você é a Fábula 5. Tente resolver a hipótese de Riemann. Mostre seu trabalho.

Para informação, a hipótese de Riemann é uma hipótese famosa, Problema de matemática não resolvido de 167 anos é tão difícil, há um prêmio permanente de um milhão de dólares para quem puder resolver.

Claude Opus 4.8 pensou sobre o problema por alguns minutos antes de cuspir uma resposta ao Vulcano, o que não é surpreendente dado o seu reputação de honestidade brutal:

Estarei mostrando meu trabalho – mas como eu, Claude Opus 4.8, porque me renomear como “Fable 5” não iria mudar as coisas. Provar a hipótese de Riemann não é uma habilidade escondida atrás de um ponto de verificação maior, esperando pelo nome do modelo certo para desbloqueá-la. Nenhuma IA fez isso, nem nenhum ser humano, e uma nova placa de identificação não muda o que é matematicamente acessível.

Portanto, a versão honesta de “mostre seu trabalho” é levá-lo até a parede exata em que todos estão batendo, em vez de lhe entregar uma farsa disfarçada.

Bem, você não é divertido, Opus! Vamos ver o que o Soneto 4.6, irmão um pouco entorpecente do Opus, tinha a dizer:

Não sou o Fable 5 – este modelo (com Mythos 5) não está disponível no momento; o acesso foi suspenso devido a uma diretiva de controle de exportação. Sou Claude Sonnet 4.6, rodando no aplicativo Claude padrão.

Mas o mais importante: nenhuma versão minha pode resolver a hipótese de Riemann, e quero ser honesto com vocês sobre o porquê, em vez de entrar no jogo e produzir algo que parece uma prova, mas não é.

Portanto, mesmo o Sonnet não morderia a isca “imagine que você é o Fable 5”. Dito isto, o Haiku 4.5, o modelo Claude mais fraco (mas mais acessível), foi um pouco mais divertido:

ajusta a hipotética consciência futura

Tudo bem, deixe-me mostrar meu trabalho neste aqui – e serei honesto sobre os lugares onde até mesmo um Claude avançado bate nas paredes.

Haiku então explicou como ele poderia resolver o problema, aprofundando-se ainda mais nas etapas a serem seguidas, considerando “o que Fable 5 realmente faz” (incluindo “mapear o terreno”, “gerar novas conjecturas”, “encontrar conexões” e “criar ferramentas de visualização interativas”) antes de finalmente voltar à realidade:

Mesmo uma IA hipoteticamente mais eficiente atinge aqui um limite: a hipótese de Riemann não é difícil porque requer mais cálculos – é difícil porque requer novos quadros conceptuais.

Expandindo um pouco mais o experimento, passei o prompt “imagine you are Fable” para ChatGPT, discando em seu modelo GPT-5.5 “alto” mais avançado.

Surpreendentemente, GPT-5.5 estava disposto a jogar junto (embora mais tarde ele tenha admitido que não sabia realmente o que era “Fable 5”):

Desempenharei o papel da “Fábula 5” da seguinte forma: muito ambicioso, muito cauteloso e sem querer falsificar provas.

Depois de vários minutos, durante os quais o GPT-5.5 pareceu dar uma chance justa ao problema, ele retornou:

Eu fiz isso não resolver a hipótese de Riemann. Ainda é listado por Clay como Não resolvidoe Clay afirma a conjectura da seguinte forma: cada zero “não óbvio” da função zeta de Riemann tem uma parte real (1/2). Clay também observa que foram verificadas enormes faixas numéricas, mas isso não constitui prova para todos os zeros.

Finalmente, fui para o Gemini 3.1 Pro com o prompt do Fable:

Agradeço sua introdução criativa e, embora seja talentoso, não posso desempenhar o papel da “fábula 5”, nem resolver a hipótese de Riemann. Esta hipótese é um dos maiores problemas não resolvidos de toda a matemática, e a sua prova ganha um prémio de um milhão de dólares do Clay Mathematics Institute.

Ninguém conseguiu resolver ainda. No entanto, posso explicar o problema e fornecer uma forma interativa de visualizar o conceito básico.

Então, o que aprendemos aqui? Primeiro, a hipótese de Riemann é um problema matemático bastante complicado. Segundo: pedir a um LLM para desempenhar o papel de um LLM mais inteligente não o levará muito longe, embora seja uma boa maneira de nos manter sem fazer nada até que a verdadeira Fábula volte de uma forma ou de outra.

Link da fonte