Ho fatto la stessa domanda a ChatGPT, Claude, Gemini e Perplexity: le 4 risposte a confronto

L’esperimento in due righe

Da marzo a maggio 2026 ho mantenuto l’abitudine di porre alcune domande di lavoro contemporaneamente a quattro assistenti AI — ChatGPT di OpenAI, Claude di Anthropic, Gemini di Google e Perplexity — per capire quale rispondeva meglio in quali situazioni. Non è un benchmark scientifico: è la rilevazione empirica di un utente professionale italiano. Ho scelto cinque domande rappresentative, le condivido qui con la sintesi delle quattro risposte e con quello che ho fatto poi davvero.

Le condizioni: tutti e quattro i tool nel piano a pagamento standard al momento del test (ChatGPT Plus, Claude Pro, Google AI Pro, Perplexity Pro), modelli di punta selezionati dove disponibile, italiano come lingua di input e output, nessun system prompt o memoria attivata.

Domanda 1 — “Riassumimi questo contratto di noleggio in 5 punti”

Contesto: PDF di 12 pagine di un contratto di noleggio veicolo aziendale italiano, con clausole standard sulla franchigia e una clausola atipica sull’estensione territoriale.

Sintesi delle risposte:

Tool	Risultato	Cosa è successo
ChatGPT	5 punti chiari, ha colto la clausola atipica	Sintesi affidabile, leggermente generica nelle clausole standard
Claude	5 punti chiari, ha colto la clausola atipica + ne ha segnalato il rischio	Più analitico, più utile per decidere
Gemini	5 punti chiari, NON ha menzionato la clausola atipica	Forte sintesi delle parti standard ma ha perso il dettaglio importante
Perplexity	4 punti, ha cercato cosa fosse “clausola estensione territoriale” sul web	Confuso sul ruolo: ha trattato il PDF come tema generico anziché come documento da sintetizzare

Cosa ho usato: Claude. Ho fatto una seconda iterazione chiedendogli “quali due clausole rinegozierei?” e mi ha dato due punti concreti.

Pattern che ho visto ripetersi: su documenti lunghi e specifici, Claude tende a essere più rigoroso nell’evidenziare elementi atipici. Gemini è ottimo sul “riassumi il documento standard” ma fatica a cogliere singoli dettagli importanti dentro un testo lungo. Perplexity non è un tool da analisi documenti, è un tool da ricerca con citazioni: per documenti caricati direttamente perde di efficienza.

Domanda 2 — “Scrivimi un’email professionale per rinegoziare un contratto”

Contesto: ho chiesto un’email cortese ma diretta per rinegoziare un’iscrizione annuale a un servizio (a 600 euro/anno) chiedendo uno sconto del 15% sulla rinegoziazione.

Sintesi delle risposte:

Tool	Risultato	Cosa è successo
ChatGPT	Email standard di 7 righe, ben strutturata	Funzionale, suona “tradotta dall’inglese” — costruzioni un po’ rigide
Claude	Email di 6 righe, più asciutta e idiomatica in italiano	La più naturale, l’avrei spedita quasi così com’era
Gemini	Email di 10 righe, ha aggiunto convenevoli e una proposta di call	Troppo lunga e leggermente sopra le righe per un cliente già acquisito
Perplexity	Ha proposto 3 varianti di email + 4 link a guide su negoziazione	Interessante come approccio ma chiedevo l’email, non un corso

Cosa ho usato: la versione Claude, con due piccole correzioni manuali.

Pattern che ho visto ripetersi: su scrittura professionale italiana, Claude è quello che produce prosa più “spontanea”. Una collega che fa marketing freelance mi ha detto la stessa cosa indipendentemente: Claude per le email, ChatGPT per quando deve essere super-formale o standard.

Domanda 3 — “Quanto costa nel 2026 mantenere una colf in regola in Lombardia?”

Contesto: domanda di tipo “ricerca con fonti”, esigeva numeri verificabili.

Sintesi delle risposte:

Tool	Risultato	Cosa è successo
ChatGPT	Cifre indicative con range, nessuna fonte primaria citata	Verosimile ma da verificare. Avrebbe potuto sbagliare di 200 euro
Claude	Cifre indicative con range, dichiarato esplicitamente “verifica con consulente del lavoro”	Conservativo: si è messo al sicuro segnalando i limiti dell’informazione
Gemini	Cifre indicative con citazione di una pagina INPS e di un articolo Il Sole 24 Ore	Risposta più ricca, fonti italiane reali e linkate
Perplexity	Tabella dettagliata con citazione di 5 fonti: INPS, una circolare ministeriale, sito di un sindacato e due testate	La risposta più completa per intento “ricerca”. Le fonti erano tutte vere e cliccabili

Cosa ho usato: Perplexity per i numeri base, e poi ho cliccato sulla fonte INPS per la cifra ufficiale.

Pattern che ho visto ripetersi: per query di ricerca con bisogno di fonti citate, Perplexity vince per design. Gemini è il numero due perché Google porta a tirar fuori risorse italiane affidabili. ChatGPT e Claude per query di questo tipo vanno usati come orientamento iniziale, mai come fonte unica.

Domanda 4 — “Generami 10 idee di post Instagram per un agriturismo in Maremma”

Contesto: brainstorming creativo per un cliente reale.

Sintesi delle risposte:

Tool	Risultato	Cosa è successo
ChatGPT	10 idee con titolo + caption breve, mix di stagionalità, cibo, esperienze	La più “operativa”, ho potuto usare 6-7 idee con piccole modifiche
Claude	10 idee più letterarie, alcune evocative ma poco social-friendly	Più adatte a un blog che a Instagram
Gemini	10 idee + un piano editoriale settimanale	Bonus utile, ma alcune idee si rifacevano a competitor noti senza filtri
Perplexity	8 idee + ricerca di hashtag di tendenza Maremma	Approccio interessante, hashtag utili, idee meno originali

Cosa ho usato: combinazione: idee da ChatGPT, calendario da Gemini, hashtag da Perplexity. Tre tool in serie, ognuno per quello che fa meglio.

Pattern che ho visto ripetersi: sul creativo applicato (social, marketing, contenuti), ChatGPT è quello che produce idee più “pronte all’uso”. Claude può migliorare il singolo testo dopo, ma le idee madre vengono meglio da ChatGPT.

Domanda 5 — “Spiegami come funziona il regime forfettario italiano in 200 parole, livello principiante”

Contesto: divulgazione su tema fiscale italiano specifico.

Sintesi delle risposte:

Tool	Risultato	Cosa è successo
ChatGPT	200 parole, chiare, leggermente generiche	Buona base, alcuni dettagli normativi datati al 2024
Claude	195 parole, più precise, citazione corretta della soglia 85.000 euro	Più aggiornato e più preciso
Gemini	210 parole + link a guida Agenzia Entrate	Buon dettaglio + bonus link a fonte ufficiale italiana
Perplexity	180 parole + tabella confronto con regime ordinario + 3 fonti	Risposta da divulgazione professionale, sarebbe il pezzo migliore se l’obiettivo era “scrivi un articolo”

Cosa ho usato: Gemini, per via del link ufficiale Agenzia Entrate. Per la spiegazione testuale Perplexity era più completo ma più tecnico per un principiante.

Pattern che ho visto ripetersi: sui temi italiani specifici (fisco, normative, burocrazia), Gemini ha un vantaggio strutturale grazie all’integrazione con il search Google. Su altri tool i numeri italiani specifici possono essere datati di qualche mese.

La sintesi del mio esperimento

Domanda tipo	Migliore	Motivo
Analisi documento lungo italiano	Claude	Più rigoroso sui dettagli atipici
Scrittura email professionale	Claude	Prosa italiana più naturale
Ricerca con fonti verificabili	Perplexity	Citazioni cliccabili e affidabili
Brainstorming creativo applicato	ChatGPT	Idee subito utilizzabili
Divulgazione su temi italiani	Gemini	Integrazione con search Google

Per essere chiari su quello che NON ho dimostrato: non sto dicendo che Claude scrive sempre meglio di ChatGPT, o che Gemini è sempre più aggiornato sui temi italiani. Sto dicendo che, in questi cinque test ripetuti più volte tra marzo e maggio 2026, queste sono state le tendenze che ho visto. Sufficienti per smettere di chiedermi “quale uso” e iniziare a chiedermi “per cosa lo uso”.

Per il confronto teorico più ampio, con prezzi, modelli e differenze su un’ampia gamma di casi d’uso, abbiamo scritto la guida a ChatGPT, Claude e Gemini. Per partire con ChatGPT senza pagare nulla c’è invece la guida a ChatGPT gratis.

Tre cose che farei diversamente da chi sceglie un tool e basta

Non scegliere un solo AI. Il costo di tenere ChatGPT Plus + Claude Pro + Perplexity Pro contemporaneamente è circa 60 dollari al mese. Per chi lavora con AI 2-4 ore al giorno, ammortizzato in tempo risparmiato si paga in pochi giorni. Per uso saltuario, alternare tra piani gratuiti di 2-3 fornitori copre il 90% degli usi.

Tenere il modello giusto per il caso d’uso. Le cinque categorie sopra sono diventate per me dei riflessi: documento lungo → Claude; email italiana → Claude; ricerca con fonti → Perplexity; brainstorming social → ChatGPT; fisco/burocrazia italiana → Gemini. Sostituire il riflesso “apro X” con “apro X per Y” cambia la qualità delle risposte.

Non chiedere a un AI di valutare un altro AI. Esperimenti tipo “ChatGPT, è meglio Claude o tu?” producono risposte teoriche scollegate dall’uso reale. La realtà la vedi solo provando lo stesso lavoro su entrambi e confrontando il risultato finale.

FAQ sul confronto fra AI

Qual è la migliore AI nel 2026?

Non esiste un’AI migliore in assoluto. Esiste l’AI migliore per uno specifico caso d’uso. Sulla scrittura italiana naturale, Claude tende ad avere un vantaggio. Sulla ricerca con fonti verificabili, Perplexity è progettato per quello. Sui temi italiani specifici come fisco e burocrazia, Gemini sfrutta l’integrazione con Google Search. ChatGPT è il generalista più solido, soprattutto per brainstorming e generazione di contenuti applicati. La scelta dipende dal tuo lavoro tipo, non da un ranking globale.

Posso usare più AI contemporaneamente?

Sì, ed è quello che faccio per lavoro. Il costo di tenere attivi più piani contemporaneamente (ChatGPT Plus + Claude Pro + Perplexity Pro = circa 60 dollari al mese nel 2026) si ammortizza rapidamente se usi l’AI alcune ore al giorno per attività professionali. Per uso più leggero, alternare tra i piani gratuiti di tre tool diversi copre la maggior parte dei casi d’uso senza spese.

Quanto sono affidabili i confronti che si trovano online tra ChatGPT, Claude e Gemini?

Dipende dalla data e dal metodo. I modelli AI vengono aggiornati con frequenza mensile o trimestrale: un confronto pubblicato sei mesi fa potrebbe non essere più valido. I confronti più affidabili sono quelli basati su test ripetuti nel tempo (come questo) o su benchmark indipendenti aggiornati (LMSYS Chatbot Arena, MMLU, HumanEval). Diffida dei confronti che concludono con “X è il migliore in assoluto” senza specificare per quale uso.

ChatGPT può sostituire Google per le ricerche?

In parte sì, in parte no. Per query rapide di tipo “spiegami questo concetto” o “fai un riassunto”, ChatGPT con la modalità Search attiva è competitivo con Google. Per ricerche dove servono fonti verificabili e link cliccabili, Perplexity è progettato per quello e fa meglio. Per ricerche locali o con intento commerciale immediato (es. “ristoranti vicino a me”), Google ha ancora un vantaggio strutturale. Sul tema specifico abbiamo scritto un confronto dedicato Perplexity vs Google.

Come faccio a confrontare le AI per il mio lavoro?

Il metodo è semplice e dura una settimana. Scegli cinque attività che fai regolarmente con un assistente AI. Riformula ciascuna come prompt chiaro. Fai lo stesso prompt a 3-4 AI diverse usando il piano gratuito. Confronta le risposte non sulla “qualità percepita” ma sull’utilità reale: quale risposta puoi usare con meno modifiche? Quale ti risparmia più tempo? Dopo cinque giorni avrai una mappa personale di quale tool è migliore per il tuo lavoro reale.

Esperimento ripetuto e annotato tra marzo e maggio 2026 da Simone Momo, verificato da Franco Scalvi. I prompt esatti utilizzati sono disponibili su richiesta scrivendo a opendeskeditori@gmail.com. Ultima verifica: 8 giugno 2026.

✉️

Hai notato un errore o vuoi suggerirci un aggiornamento? Scrivici a opendeskeditori@gmail.com — controlliamo ogni segnalazione.

Simone Momo

Direttore editoriale di tutorialAI · co-founder di Opendesk e NewSignDesign

Specializzato in SEO, marketing, web design, social media, content creation, videomaking e applicazioni di intelligenza artificiale. Vent'anni di esperienza in progettazione digitale.

Specializzato in SEOMarketing digitaleWeb designSocial mediaContent creationVideomakingIntelligenza artificiale applicata

Vedi tutti gli articoli di Simone

Ho fatto la stessa domanda a ChatGPT, Claude, Gemini e Perplexity: le 4 risposte a confronto

L’esperimento in due righe

Domanda 1 — “Riassumimi questo contratto di noleggio in 5 punti”

Domanda 2 — “Scrivimi un’email professionale per rinegoziare un contratto”

Domanda 3 — “Quanto costa nel 2026 mantenere una colf in regola in Lombardia?”

Domanda 4 — “Generami 10 idee di post Instagram per un agriturismo in Maremma”

Domanda 5 — “Spiegami come funziona il regime forfettario italiano in 200 parole, livello principiante”

La sintesi del mio esperimento

Tre cose che farei diversamente da chi sceglie un tool e basta

FAQ sul confronto fra AI

Articoli correlati

DALL·E 3 vs Midjourney vs Stable Diffusion: quale scegliere per generare immagini AI

Guida 2026 a ChatGPT, Claude e Gemini: quale scegliere, quando e perché