Confronti

Ho fatto la stessa domanda a ChatGPT, Claude, Gemini e Perplexity: le 4 risposte a confronto

Case study: cinque domande tipiche di lavoro italiano poste alle stesse condizioni a ChatGPT, Claude, Gemini e Perplexity. Cosa ho ricevuto, cosa ho scartato, cosa ho usato davvero.

Pubblicato il 7 giugno 2026 · Aggiornato il 8 giugno 2026 · Fact-checked
Livello: Intermedio 11 min di lettura

L’esperimento in due righe

Da marzo a maggio 2026 ho mantenuto l’abitudine di porre alcune domande di lavoro contemporaneamente a quattro assistenti AI — ChatGPT di OpenAI, Claude di Anthropic, Gemini di Google e Perplexity — per capire quale rispondeva meglio in quali situazioni. Non è un benchmark scientifico: è la rilevazione empirica di un utente professionale italiano. Ho scelto cinque domande rappresentative, le condivido qui con la sintesi delle quattro risposte e con quello che ho fatto poi davvero.

Le condizioni: tutti e quattro i tool nel piano a pagamento standard al momento del test (ChatGPT Plus, Claude Pro, Google AI Pro, Perplexity Pro), modelli di punta selezionati dove disponibile, italiano come lingua di input e output, nessun system prompt o memoria attivata.

Domanda 1 — “Riassumimi questo contratto di noleggio in 5 punti”

Contesto: PDF di 12 pagine di un contratto di noleggio veicolo aziendale italiano, con clausole standard sulla franchigia e una clausola atipica sull’estensione territoriale.

Sintesi delle risposte:

ToolRisultatoCosa è successo
ChatGPT5 punti chiari, ha colto la clausola atipicaSintesi affidabile, leggermente generica nelle clausole standard
Claude5 punti chiari, ha colto la clausola atipica + ne ha segnalato il rischioPiù analitico, più utile per decidere
Gemini5 punti chiari, NON ha menzionato la clausola atipicaForte sintesi delle parti standard ma ha perso il dettaglio importante
Perplexity4 punti, ha cercato cosa fosse “clausola estensione territoriale” sul webConfuso sul ruolo: ha trattato il PDF come tema generico anziché come documento da sintetizzare

Cosa ho usato: Claude. Ho fatto una seconda iterazione chiedendogli “quali due clausole rinegozierei?” e mi ha dato due punti concreti.

Pattern che ho visto ripetersi: su documenti lunghi e specifici, Claude tende a essere più rigoroso nell’evidenziare elementi atipici. Gemini è ottimo sul “riassumi il documento standard” ma fatica a cogliere singoli dettagli importanti dentro un testo lungo. Perplexity non è un tool da analisi documenti, è un tool da ricerca con citazioni: per documenti caricati direttamente perde di efficienza.

Domanda 2 — “Scrivimi un’email professionale per rinegoziare un contratto”

Contesto: ho chiesto un’email cortese ma diretta per rinegoziare un’iscrizione annuale a un servizio (a 600 euro/anno) chiedendo uno sconto del 15% sulla rinegoziazione.

Sintesi delle risposte:

ToolRisultatoCosa è successo
ChatGPTEmail standard di 7 righe, ben strutturataFunzionale, suona “tradotta dall’inglese” — costruzioni un po’ rigide
ClaudeEmail di 6 righe, più asciutta e idiomatica in italianoLa più naturale, l’avrei spedita quasi così com’era
GeminiEmail di 10 righe, ha aggiunto convenevoli e una proposta di callTroppo lunga e leggermente sopra le righe per un cliente già acquisito
PerplexityHa proposto 3 varianti di email + 4 link a guide su negoziazioneInteressante come approccio ma chiedevo l’email, non un corso

Cosa ho usato: la versione Claude, con due piccole correzioni manuali.

Pattern che ho visto ripetersi: su scrittura professionale italiana, Claude è quello che produce prosa più “spontanea”. Una collega che fa marketing freelance mi ha detto la stessa cosa indipendentemente: Claude per le email, ChatGPT per quando deve essere super-formale o standard.

Domanda 3 — “Quanto costa nel 2026 mantenere una colf in regola in Lombardia?”

Contesto: domanda di tipo “ricerca con fonti”, esigeva numeri verificabili.

Sintesi delle risposte:

ToolRisultatoCosa è successo
ChatGPTCifre indicative con range, nessuna fonte primaria citataVerosimile ma da verificare. Avrebbe potuto sbagliare di 200 euro
ClaudeCifre indicative con range, dichiarato esplicitamente “verifica con consulente del lavoro”Conservativo: si è messo al sicuro segnalando i limiti dell’informazione
GeminiCifre indicative con citazione di una pagina INPS e di un articolo Il Sole 24 OreRisposta più ricca, fonti italiane reali e linkate
PerplexityTabella dettagliata con citazione di 5 fonti: INPS, una circolare ministeriale, sito di un sindacato e due testateLa risposta più completa per intento “ricerca”. Le fonti erano tutte vere e cliccabili

Cosa ho usato: Perplexity per i numeri base, e poi ho cliccato sulla fonte INPS per la cifra ufficiale.

Pattern che ho visto ripetersi: per query di ricerca con bisogno di fonti citate, Perplexity vince per design. Gemini è il numero due perché Google porta a tirar fuori risorse italiane affidabili. ChatGPT e Claude per query di questo tipo vanno usati come orientamento iniziale, mai come fonte unica.

Domanda 4 — “Generami 10 idee di post Instagram per un agriturismo in Maremma”

Contesto: brainstorming creativo per un cliente reale.

Sintesi delle risposte:

ToolRisultatoCosa è successo
ChatGPT10 idee con titolo + caption breve, mix di stagionalità, cibo, esperienzeLa più “operativa”, ho potuto usare 6-7 idee con piccole modifiche
Claude10 idee più letterarie, alcune evocative ma poco social-friendlyPiù adatte a un blog che a Instagram
Gemini10 idee + un piano editoriale settimanaleBonus utile, ma alcune idee si rifacevano a competitor noti senza filtri
Perplexity8 idee + ricerca di hashtag di tendenza MaremmaApproccio interessante, hashtag utili, idee meno originali

Cosa ho usato: combinazione: idee da ChatGPT, calendario da Gemini, hashtag da Perplexity. Tre tool in serie, ognuno per quello che fa meglio.

Pattern che ho visto ripetersi: sul creativo applicato (social, marketing, contenuti), ChatGPT è quello che produce idee più “pronte all’uso”. Claude può migliorare il singolo testo dopo, ma le idee madre vengono meglio da ChatGPT.

Domanda 5 — “Spiegami come funziona il regime forfettario italiano in 200 parole, livello principiante”

Contesto: divulgazione su tema fiscale italiano specifico.

Sintesi delle risposte:

ToolRisultatoCosa è successo
ChatGPT200 parole, chiare, leggermente genericheBuona base, alcuni dettagli normativi datati al 2024
Claude195 parole, più precise, citazione corretta della soglia 85.000 euroPiù aggiornato e più preciso
Gemini210 parole + link a guida Agenzia EntrateBuon dettaglio + bonus link a fonte ufficiale italiana
Perplexity180 parole + tabella confronto con regime ordinario + 3 fontiRisposta da divulgazione professionale, sarebbe il pezzo migliore se l’obiettivo era “scrivi un articolo”

Cosa ho usato: Gemini, per via del link ufficiale Agenzia Entrate. Per la spiegazione testuale Perplexity era più completo ma più tecnico per un principiante.

Pattern che ho visto ripetersi: sui temi italiani specifici (fisco, normative, burocrazia), Gemini ha un vantaggio strutturale grazie all’integrazione con il search Google. Su altri tool i numeri italiani specifici possono essere datati di qualche mese.

La sintesi del mio esperimento

Domanda tipoMiglioreMotivo
Analisi documento lungo italianoClaudePiù rigoroso sui dettagli atipici
Scrittura email professionaleClaudeProsa italiana più naturale
Ricerca con fonti verificabiliPerplexityCitazioni cliccabili e affidabili
Brainstorming creativo applicatoChatGPTIdee subito utilizzabili
Divulgazione su temi italianiGeminiIntegrazione con search Google

Per essere chiari su quello che NON ho dimostrato: non sto dicendo che Claude scrive sempre meglio di ChatGPT, o che Gemini è sempre più aggiornato sui temi italiani. Sto dicendo che, in questi cinque test ripetuti più volte tra marzo e maggio 2026, queste sono state le tendenze che ho visto. Sufficienti per smettere di chiedermi “quale uso” e iniziare a chiedermi “per cosa lo uso”.

Per il confronto teorico più ampio, con prezzi, modelli e differenze su un’ampia gamma di casi d’uso, abbiamo scritto la guida a ChatGPT, Claude e Gemini. Per partire con ChatGPT senza pagare nulla c’è invece la guida a ChatGPT gratis.

Tre cose che farei diversamente da chi sceglie un tool e basta

Non scegliere un solo AI. Il costo di tenere ChatGPT Plus + Claude Pro + Perplexity Pro contemporaneamente è circa 60 dollari al mese. Per chi lavora con AI 2-4 ore al giorno, ammortizzato in tempo risparmiato si paga in pochi giorni. Per uso saltuario, alternare tra piani gratuiti di 2-3 fornitori copre il 90% degli usi.

Tenere il modello giusto per il caso d’uso. Le cinque categorie sopra sono diventate per me dei riflessi: documento lungo → Claude; email italiana → Claude; ricerca con fonti → Perplexity; brainstorming social → ChatGPT; fisco/burocrazia italiana → Gemini. Sostituire il riflesso “apro X” con “apro X per Y” cambia la qualità delle risposte.

Non chiedere a un AI di valutare un altro AI. Esperimenti tipo “ChatGPT, è meglio Claude o tu?” producono risposte teoriche scollegate dall’uso reale. La realtà la vedi solo provando lo stesso lavoro su entrambi e confrontando il risultato finale.

FAQ sul confronto fra AI

Qual è la migliore AI nel 2026?

Non esiste un’AI migliore in assoluto. Esiste l’AI migliore per uno specifico caso d’uso. Sulla scrittura italiana naturale, Claude tende ad avere un vantaggio. Sulla ricerca con fonti verificabili, Perplexity è progettato per quello. Sui temi italiani specifici come fisco e burocrazia, Gemini sfrutta l’integrazione con Google Search. ChatGPT è il generalista più solido, soprattutto per brainstorming e generazione di contenuti applicati. La scelta dipende dal tuo lavoro tipo, non da un ranking globale.

Posso usare più AI contemporaneamente?

Sì, ed è quello che faccio per lavoro. Il costo di tenere attivi più piani contemporaneamente (ChatGPT Plus + Claude Pro + Perplexity Pro = circa 60 dollari al mese nel 2026) si ammortizza rapidamente se usi l’AI alcune ore al giorno per attività professionali. Per uso più leggero, alternare tra i piani gratuiti di tre tool diversi copre la maggior parte dei casi d’uso senza spese.

Quanto sono affidabili i confronti che si trovano online tra ChatGPT, Claude e Gemini?

Dipende dalla data e dal metodo. I modelli AI vengono aggiornati con frequenza mensile o trimestrale: un confronto pubblicato sei mesi fa potrebbe non essere più valido. I confronti più affidabili sono quelli basati su test ripetuti nel tempo (come questo) o su benchmark indipendenti aggiornati (LMSYS Chatbot Arena, MMLU, HumanEval). Diffida dei confronti che concludono con “X è il migliore in assoluto” senza specificare per quale uso.

ChatGPT può sostituire Google per le ricerche?

In parte sì, in parte no. Per query rapide di tipo “spiegami questo concetto” o “fai un riassunto”, ChatGPT con la modalità Search attiva è competitivo con Google. Per ricerche dove servono fonti verificabili e link cliccabili, Perplexity è progettato per quello e fa meglio. Per ricerche locali o con intento commerciale immediato (es. “ristoranti vicino a me”), Google ha ancora un vantaggio strutturale. Sul tema specifico abbiamo scritto un confronto dedicato Perplexity vs Google.

Come faccio a confrontare le AI per il mio lavoro?

Il metodo è semplice e dura una settimana. Scegli cinque attività che fai regolarmente con un assistente AI. Riformula ciascuna come prompt chiaro. Fai lo stesso prompt a 3-4 AI diverse usando il piano gratuito. Confronta le risposte non sulla “qualità percepita” ma sull’utilità reale: quale risposta puoi usare con meno modifiche? Quale ti risparmia più tempo? Dopo cinque giorni avrai una mappa personale di quale tool è migliore per il tuo lavoro reale.


Esperimento ripetuto e annotato tra marzo e maggio 2026 da Simone Momo, verificato da Franco Scalvi. I prompt esatti utilizzati sono disponibili su richiesta scrivendo a opendeskeditori@gmail.com. Ultima verifica: 8 giugno 2026.

✉️

Hai notato un errore o vuoi suggerirci un aggiornamento? Scrivici a opendeskeditori@gmail.com — controlliamo ogni segnalazione.

Simone Momo
Simone Momo
Direttore editoriale di tutorialAI · co-founder di Opendesk e NewSignDesign

Specializzato in SEO, marketing, web design, social media, content creation, videomaking e applicazioni di intelligenza artificiale. Vent'anni di esperienza in progettazione digitale.

Specializzato in SEOMarketing digitaleWeb designSocial mediaContent creationVideomakingIntelligenza artificiale applicata