Ho fatto la stessa domanda a ChatGPT, Claude, Gemini e Perplexity: le 4 risposte a confronto
Case study: cinque domande tipiche di lavoro italiano poste alle stesse condizioni a ChatGPT, Claude, Gemini e Perplexity. Cosa ho ricevuto, cosa ho scartato, cosa ho usato davvero.
L’esperimento in due righe
Da marzo a maggio 2026 ho mantenuto l’abitudine di porre alcune domande di lavoro contemporaneamente a quattro assistenti AI — ChatGPT di OpenAI, Claude di Anthropic, Gemini di Google e Perplexity — per capire quale rispondeva meglio in quali situazioni. Non è un benchmark scientifico: è la rilevazione empirica di un utente professionale italiano. Ho scelto cinque domande rappresentative, le condivido qui con la sintesi delle quattro risposte e con quello che ho fatto poi davvero.
Le condizioni: tutti e quattro i tool nel piano a pagamento standard al momento del test (ChatGPT Plus, Claude Pro, Google AI Pro, Perplexity Pro), modelli di punta selezionati dove disponibile, italiano come lingua di input e output, nessun system prompt o memoria attivata.
Domanda 1 — “Riassumimi questo contratto di noleggio in 5 punti”
Contesto: PDF di 12 pagine di un contratto di noleggio veicolo aziendale italiano, con clausole standard sulla franchigia e una clausola atipica sull’estensione territoriale.
Sintesi delle risposte:
| Tool | Risultato | Cosa è successo |
|---|---|---|
| ChatGPT | 5 punti chiari, ha colto la clausola atipica | Sintesi affidabile, leggermente generica nelle clausole standard |
| Claude | 5 punti chiari, ha colto la clausola atipica + ne ha segnalato il rischio | Più analitico, più utile per decidere |
| Gemini | 5 punti chiari, NON ha menzionato la clausola atipica | Forte sintesi delle parti standard ma ha perso il dettaglio importante |
| Perplexity | 4 punti, ha cercato cosa fosse “clausola estensione territoriale” sul web | Confuso sul ruolo: ha trattato il PDF come tema generico anziché come documento da sintetizzare |
Cosa ho usato: Claude. Ho fatto una seconda iterazione chiedendogli “quali due clausole rinegozierei?” e mi ha dato due punti concreti.
Pattern che ho visto ripetersi: su documenti lunghi e specifici, Claude tende a essere più rigoroso nell’evidenziare elementi atipici. Gemini è ottimo sul “riassumi il documento standard” ma fatica a cogliere singoli dettagli importanti dentro un testo lungo. Perplexity non è un tool da analisi documenti, è un tool da ricerca con citazioni: per documenti caricati direttamente perde di efficienza.
Domanda 2 — “Scrivimi un’email professionale per rinegoziare un contratto”
Contesto: ho chiesto un’email cortese ma diretta per rinegoziare un’iscrizione annuale a un servizio (a 600 euro/anno) chiedendo uno sconto del 15% sulla rinegoziazione.
Sintesi delle risposte:
| Tool | Risultato | Cosa è successo |
|---|---|---|
| ChatGPT | Email standard di 7 righe, ben strutturata | Funzionale, suona “tradotta dall’inglese” — costruzioni un po’ rigide |
| Claude | Email di 6 righe, più asciutta e idiomatica in italiano | La più naturale, l’avrei spedita quasi così com’era |
| Gemini | Email di 10 righe, ha aggiunto convenevoli e una proposta di call | Troppo lunga e leggermente sopra le righe per un cliente già acquisito |
| Perplexity | Ha proposto 3 varianti di email + 4 link a guide su negoziazione | Interessante come approccio ma chiedevo l’email, non un corso |
Cosa ho usato: la versione Claude, con due piccole correzioni manuali.
Pattern che ho visto ripetersi: su scrittura professionale italiana, Claude è quello che produce prosa più “spontanea”. Una collega che fa marketing freelance mi ha detto la stessa cosa indipendentemente: Claude per le email, ChatGPT per quando deve essere super-formale o standard.
Domanda 3 — “Quanto costa nel 2026 mantenere una colf in regola in Lombardia?”
Contesto: domanda di tipo “ricerca con fonti”, esigeva numeri verificabili.
Sintesi delle risposte:
| Tool | Risultato | Cosa è successo |
|---|---|---|
| ChatGPT | Cifre indicative con range, nessuna fonte primaria citata | Verosimile ma da verificare. Avrebbe potuto sbagliare di 200 euro |
| Claude | Cifre indicative con range, dichiarato esplicitamente “verifica con consulente del lavoro” | Conservativo: si è messo al sicuro segnalando i limiti dell’informazione |
| Gemini | Cifre indicative con citazione di una pagina INPS e di un articolo Il Sole 24 Ore | Risposta più ricca, fonti italiane reali e linkate |
| Perplexity | Tabella dettagliata con citazione di 5 fonti: INPS, una circolare ministeriale, sito di un sindacato e due testate | La risposta più completa per intento “ricerca”. Le fonti erano tutte vere e cliccabili |
Cosa ho usato: Perplexity per i numeri base, e poi ho cliccato sulla fonte INPS per la cifra ufficiale.
Pattern che ho visto ripetersi: per query di ricerca con bisogno di fonti citate, Perplexity vince per design. Gemini è il numero due perché Google porta a tirar fuori risorse italiane affidabili. ChatGPT e Claude per query di questo tipo vanno usati come orientamento iniziale, mai come fonte unica.
Domanda 4 — “Generami 10 idee di post Instagram per un agriturismo in Maremma”
Contesto: brainstorming creativo per un cliente reale.
Sintesi delle risposte:
| Tool | Risultato | Cosa è successo |
|---|---|---|
| ChatGPT | 10 idee con titolo + caption breve, mix di stagionalità, cibo, esperienze | La più “operativa”, ho potuto usare 6-7 idee con piccole modifiche |
| Claude | 10 idee più letterarie, alcune evocative ma poco social-friendly | Più adatte a un blog che a Instagram |
| Gemini | 10 idee + un piano editoriale settimanale | Bonus utile, ma alcune idee si rifacevano a competitor noti senza filtri |
| Perplexity | 8 idee + ricerca di hashtag di tendenza Maremma | Approccio interessante, hashtag utili, idee meno originali |
Cosa ho usato: combinazione: idee da ChatGPT, calendario da Gemini, hashtag da Perplexity. Tre tool in serie, ognuno per quello che fa meglio.
Pattern che ho visto ripetersi: sul creativo applicato (social, marketing, contenuti), ChatGPT è quello che produce idee più “pronte all’uso”. Claude può migliorare il singolo testo dopo, ma le idee madre vengono meglio da ChatGPT.
Domanda 5 — “Spiegami come funziona il regime forfettario italiano in 200 parole, livello principiante”
Contesto: divulgazione su tema fiscale italiano specifico.
Sintesi delle risposte:
| Tool | Risultato | Cosa è successo |
|---|---|---|
| ChatGPT | 200 parole, chiare, leggermente generiche | Buona base, alcuni dettagli normativi datati al 2024 |
| Claude | 195 parole, più precise, citazione corretta della soglia 85.000 euro | Più aggiornato e più preciso |
| Gemini | 210 parole + link a guida Agenzia Entrate | Buon dettaglio + bonus link a fonte ufficiale italiana |
| Perplexity | 180 parole + tabella confronto con regime ordinario + 3 fonti | Risposta da divulgazione professionale, sarebbe il pezzo migliore se l’obiettivo era “scrivi un articolo” |
Cosa ho usato: Gemini, per via del link ufficiale Agenzia Entrate. Per la spiegazione testuale Perplexity era più completo ma più tecnico per un principiante.
Pattern che ho visto ripetersi: sui temi italiani specifici (fisco, normative, burocrazia), Gemini ha un vantaggio strutturale grazie all’integrazione con il search Google. Su altri tool i numeri italiani specifici possono essere datati di qualche mese.
La sintesi del mio esperimento
| Domanda tipo | Migliore | Motivo |
|---|---|---|
| Analisi documento lungo italiano | Claude | Più rigoroso sui dettagli atipici |
| Scrittura email professionale | Claude | Prosa italiana più naturale |
| Ricerca con fonti verificabili | Perplexity | Citazioni cliccabili e affidabili |
| Brainstorming creativo applicato | ChatGPT | Idee subito utilizzabili |
| Divulgazione su temi italiani | Gemini | Integrazione con search Google |
Per essere chiari su quello che NON ho dimostrato: non sto dicendo che Claude scrive sempre meglio di ChatGPT, o che Gemini è sempre più aggiornato sui temi italiani. Sto dicendo che, in questi cinque test ripetuti più volte tra marzo e maggio 2026, queste sono state le tendenze che ho visto. Sufficienti per smettere di chiedermi “quale uso” e iniziare a chiedermi “per cosa lo uso”.
Per il confronto teorico più ampio, con prezzi, modelli e differenze su un’ampia gamma di casi d’uso, abbiamo scritto la guida a ChatGPT, Claude e Gemini. Per partire con ChatGPT senza pagare nulla c’è invece la guida a ChatGPT gratis.
Tre cose che farei diversamente da chi sceglie un tool e basta
Non scegliere un solo AI. Il costo di tenere ChatGPT Plus + Claude Pro + Perplexity Pro contemporaneamente è circa 60 dollari al mese. Per chi lavora con AI 2-4 ore al giorno, ammortizzato in tempo risparmiato si paga in pochi giorni. Per uso saltuario, alternare tra piani gratuiti di 2-3 fornitori copre il 90% degli usi.
Tenere il modello giusto per il caso d’uso. Le cinque categorie sopra sono diventate per me dei riflessi: documento lungo → Claude; email italiana → Claude; ricerca con fonti → Perplexity; brainstorming social → ChatGPT; fisco/burocrazia italiana → Gemini. Sostituire il riflesso “apro X” con “apro X per Y” cambia la qualità delle risposte.
Non chiedere a un AI di valutare un altro AI. Esperimenti tipo “ChatGPT, è meglio Claude o tu?” producono risposte teoriche scollegate dall’uso reale. La realtà la vedi solo provando lo stesso lavoro su entrambi e confrontando il risultato finale.
FAQ sul confronto fra AI
Qual è la migliore AI nel 2026?
Non esiste un’AI migliore in assoluto. Esiste l’AI migliore per uno specifico caso d’uso. Sulla scrittura italiana naturale, Claude tende ad avere un vantaggio. Sulla ricerca con fonti verificabili, Perplexity è progettato per quello. Sui temi italiani specifici come fisco e burocrazia, Gemini sfrutta l’integrazione con Google Search. ChatGPT è il generalista più solido, soprattutto per brainstorming e generazione di contenuti applicati. La scelta dipende dal tuo lavoro tipo, non da un ranking globale.
Posso usare più AI contemporaneamente?
Sì, ed è quello che faccio per lavoro. Il costo di tenere attivi più piani contemporaneamente (ChatGPT Plus + Claude Pro + Perplexity Pro = circa 60 dollari al mese nel 2026) si ammortizza rapidamente se usi l’AI alcune ore al giorno per attività professionali. Per uso più leggero, alternare tra i piani gratuiti di tre tool diversi copre la maggior parte dei casi d’uso senza spese.
Quanto sono affidabili i confronti che si trovano online tra ChatGPT, Claude e Gemini?
Dipende dalla data e dal metodo. I modelli AI vengono aggiornati con frequenza mensile o trimestrale: un confronto pubblicato sei mesi fa potrebbe non essere più valido. I confronti più affidabili sono quelli basati su test ripetuti nel tempo (come questo) o su benchmark indipendenti aggiornati (LMSYS Chatbot Arena, MMLU, HumanEval). Diffida dei confronti che concludono con “X è il migliore in assoluto” senza specificare per quale uso.
ChatGPT può sostituire Google per le ricerche?
In parte sì, in parte no. Per query rapide di tipo “spiegami questo concetto” o “fai un riassunto”, ChatGPT con la modalità Search attiva è competitivo con Google. Per ricerche dove servono fonti verificabili e link cliccabili, Perplexity è progettato per quello e fa meglio. Per ricerche locali o con intento commerciale immediato (es. “ristoranti vicino a me”), Google ha ancora un vantaggio strutturale. Sul tema specifico abbiamo scritto un confronto dedicato Perplexity vs Google.
Come faccio a confrontare le AI per il mio lavoro?
Il metodo è semplice e dura una settimana. Scegli cinque attività che fai regolarmente con un assistente AI. Riformula ciascuna come prompt chiaro. Fai lo stesso prompt a 3-4 AI diverse usando il piano gratuito. Confronta le risposte non sulla “qualità percepita” ma sull’utilità reale: quale risposta puoi usare con meno modifiche? Quale ti risparmia più tempo? Dopo cinque giorni avrai una mappa personale di quale tool è migliore per il tuo lavoro reale.
Esperimento ripetuto e annotato tra marzo e maggio 2026 da Simone Momo, verificato da Franco Scalvi. I prompt esatti utilizzati sono disponibili su richiesta scrivendo a opendeskeditori@gmail.com. Ultima verifica: 8 giugno 2026.
Hai notato un errore o vuoi suggerirci un aggiornamento? Scrivici a opendeskeditori@gmail.com — controlliamo ogni segnalazione.