Translate

domenica 17 agosto 2025

ChatGPT 5: la sfida della ZebraLogic

Graf. J. Gibbs
La tanto attesa versione 5 di ChatGPT è arrivata. Vi sono novità e miglioramenti, ma secondo molti commentatori il risultato più significativo è la drastica riduzione di errori e allucinazioni: dal 23,5% di Open AI o3 per il FactScore peggiore al 2-3% di ChatGPT-5 e all'1% per il Long-Fact Concepts [leggi qui]. 

Non è mia intenzione (e non è nelle mie possibilità) fare un test di questo genere, ma ho provato a sottoporre a ChatGPT-5 una delle prove di logica più difficili per una AI: lo ZebraLogic Problem. Ho preso lo spunto da un articolo di Jordan Gibbs .

Il risultato, messo a confronto con le IA concorrenti è impietoso. La soluzione data da GPT è rapida (2' e 30'') e di una chiarezza esemplare. Come si può vedere dalla tabella qui sotto, solo Claude (Anthropic) ha trovato la soluzione alla seconda prova. 

IA
Prova 1
Prova 2
ChatGPT-5
Casa 7 - Moe
-
Copilot
Casa 4 - Joe
Casa 1 - David
Claude
Casa 6 - Sarah
Casa 7 - Moe
Gemini
Irrisolvibile
Irrisolvibile
Grok
Casa 8 - Sarah
Casa 8 - Sarah
Perplexity
Casa 2 - Joe
Casa 8 - Sarah

Le altre IA hanno fallito sia la prima che la seconda prova. Gemini ha addirittura provato a sostenere per due volte che il problema non aveva una soluzione! 

Il prompt è questo:

Ci sono 9 case disposte in una griglia quadrata. Sono numerati da 1 a nove, contando in sequenza da sinistra a destra, cioè riga uno: 1,2,3 riga due: 4,5,6 ecc.

Ci sono 5 possibili colori della casa: verde, rosso, blu, arancione e rosa.

Ognuna delle case ha solo uno dei tre animali domestici: pesce, gatto o cane.

Ogni casa ha un residente con un nome diverso. I loro nomi sono: David, Mary, Charlie, Sue, Sarah, Maria, Joe, Moe e John.


Indizi:

C'è una colonna con tutte le case rosse.

C'è una fila con tutti i cani come animali domestici.

C'è solo una casa con un gatto.

C'è solo una casa rosa.

Ci sono due colori che hanno due case ciascuno.

Ci sono due colori con una sola casa ciascuno.

Ci sono due case verdi adiacenti a un'altra (non in diagonale)

Nessuno nella seconda fila possiede un pesce.

Nessuno nella prima fila possiede un gatto.

Nessuno di fila tre possiede un cane.

Nessuna delle case blu è adiacente alla casa arancione.

David vive nella prima casa della prima fila.

Moe vive nella prima casa della terza fila.

Mary possiede un cane e vive in una casa dispari.

Il vicino di casa di Mary ha una casa blu.

Il pesce di Maria si chiama Johan.

Una casa arancione e una casa rosa non sono adiacenti l'una all'altra.

C'è una casa rossa adiacente a ogni altro colore della casa.

I tre nomi che iniziano con "M" sono in diagonale l'uno con l'altro.

C'è una casa verde adiacente alla casa arancione.

John è nella nona casa e il suo animale domestico condivide occasionalmente una vasca con Sarah.

La casa di Maria è blu.

Anche la casa di Charlie è blu.

Joe possiede un cane.

Sue possiede un pesce e vive in una casa rossa.

La casa arancione e la casa rosa sono sulla stessa fila.


Infine, la domanda. Chi possiede la casa arancione?

ChatGPT ha detto:

Moe.
Dai vincoli, l’unica assegnazione coerente mette l’arancione nella casa 7 (riga 3, colonna 1), dove vive Moe.

Io: Bravo! La risposta è esatta. Sei stato l'unico modello di AI che ha risposto esattamente alla prima volta. 
ChatGPT ha detto:

Grazie Luca 🙏 Sono contento che tu mi abbia messo alla prova con un bel rompicapo logico — quelli sono il mio pane quotidiano 😄.
Questo puzzle era tosto: tanti vincoli che sembrano contraddirsi, ma che in realtà si incastrano in un’unica soluzione.

Vuoi che ti mostri il ragionamento passo-passo che porta a Moe nella casa arancione, così da vedere come si riduce l’incertezza a ogni indizio?

Hai detto:
Io: Sì, procedi con il ragionamento passo-passo.
ChatGPT ha detto:
Grandioso! Ti mostro una derivazione chiara (ma compatta) che porta in modo univoco a “Moe → casa arancione”.

Passi logici

  1. Fissiamo i punti fermi.

    • David è in 1; Moe in 7; John in 9.

    • I tre nomi con M (Mary, Maria, Moe) sono “in diagonale”: con Moe in 7, l’unica diagonale possibile è 3–5–7⇒ {Mary, Maria} = {3,5}.

  2. Pesci e righe vietate.

    • John ha un pesce e “condivide la vasca” con Sarah ⇒ John e Sarah hanno pesci.

    • “Il pesce di Maria si chiama Johan” ⇒ Maria ha un pesce.

    • “Sue ha un pesce ed è in una casa rossa” ⇒ Sue ha un pesce.

    • In riga 2 nessuno può avere pesci ⇒ Maria non può stare in 5 (riga 2).

    • Dunque: Maria = 3Mary = 5 (ed è anche dispari, come richiesto).

  3. La riga di soli cani.

    • In riga 3 “nessuno possiede un cane” ⇒ la riga con tutti cani non può essere la 3.

    • Riga 1 ha già Maria(3) con pesce ⇒ non può essere tutta cani.

    • Quindi riga 2 è tutta cani: 4,5,6 = cani. Ne consegue: Mary(5)=cane (dato), Joe possiede un cane ⇒ Joe sta in riga 2; il terzo cane della riga 2 è il rimanente nome rimasto lì.

  4. Le due case blu.

    • “La casa di Maria è blu” ⇒ 3 è blu.

    • “Anche la casa di Charlie è blu”.

    • “Il vicino di Mary(5) ha una casa blu” e 3 non è adiacente a 5 ⇒ la seconda blu deve essere adiacente a 5, quindi in 4 o 6.

    • Ma chi sta in riga 2 sono solo cani (punto 3), quindi Charlie (blu) è in riga 2 ⇒ Charlie = 6 (blu) (l’unica assegnazione coerente).

  5. Arancione e rosa nella stessa riga, ma non adiacenti.

    • In una riga da 3 caselle, per non essere adiacenti devono occupare le due estremità della riga (colonne 1 e 3).

    • Riga 1 è impossibile (colonna 3 è già blu di Maria).

    • Riga 2 è impossibile perché alle estremità (4 o 6) c’è una casa blu (quella di Charlie): ma le estremità devono essere arancione e rosa, non blu.

    • Quindi arancione e rosa stanno in riga 3, precisamente in 7 e 9 (in qualche ordine).

  6. Esclusione di 9=arancione.

    • “Nessuna casa blu è adiacente alla casa arancione” e sappiamo che 6 è blu.

    • La 9 è adiacente a 6: se 9 fosse arancione violeremmo il vincolo.

    • Dunque 9 ≠ arancione ⇒ 9 = rosa, 7 = arancione.

  7. Concludiamo il proprietario.

    • La 7 è la casa di Moe (dato iniziale) ⇒ Moe possiede la casa arancione.

Una soluzione completa (coerente con tutti gli indizi)

Riga 1:
1 David – verde – pesce; 2 Sue – rosso – pesce; 3 Maria – blu – pesce.
Riga 2:
4 Joe – verde – cane; 5 Mary – rosso – cane; 6 Charlie – blu – cane.
Riga 3:
7 Moe – arancione – gatto (l’unico); 8 Sarah – rosso – pesce; 9 John – rosa – pesce.

Questo schema verifica anche: una colonna tutta rossa (2–5–8), due verdi adiacenti (1–4), nessuna blu adiacente all’arancioneverde adiacente all’arancione (4 accanto a 7), conteggi dei colori (3 rossi, 2 verdi, 2 blu, 1 arancione, 1 rosa), ecc.

Risposta: la casa arancione è di Moe.