LatePost esclusiva丨Zhipu si quota in borsa, nella lettera interna Tang Jie chiede un ritorno completo alla ricerca sui modelli di base
Ciò che determina davvero la configurazione della prossima fase rimangono due aspetti fondamentali: l'architettura dei modelli e i paradigmi di apprendimento. Allo stesso tempo, dal lato delle applicazioni potrebbe emergere una direzione chiara: l'anno dell'esplosione dell'AI che sostituisce diverse professioni/compiti.
Articolo丨Shen Yuan
Editore丨Song Wei
Secondo quanto appreso in esclusiva da LatePost, l'8 gennaio, giorno della quotazione di Zhipu, Tang Jie, professore presso il Dipartimento di Informatica della Tsinghua University, fondatore e chief scientist di Zhipu, ha pubblicato una lettera interna annunciando che presto sarà lanciato il nuovo modello di nuova generazione GLM-5.
Tang Jie ha dichiarato che oggi è "un giorno emozionante nella vita di Zhipu". Non ha risposto direttamente alle controversie sul modello di business delle aziende di modelli di grandi dimensioni né ha fissato obiettivi di commercializzazione per Zhipu al 2026, ma ha sottolineato che il vero traguardo sulla strada verso l’AGI è avere "utenti reali" e sviluppare teorie, tecnologie o prodotti che possano aiutare più persone.
DeepSeek ha portato uno shock tra le aziende cinesi di modelli di grandi dimensioni: molti ritengono che il successo fenomenale di DeepSeek abbia innanzitutto intaccato l’ecosistema di Zhipu, poiché entrambi presentano caratteristiche simili nei team accademici e di ricerca, e anche Zhipu ha dato grandi contributi all’ecosistema open source dei grandi modelli.
La lettera interna afferma che nel 2025 Zhipu ha completato con successo la strategia fissata all'inizio dell'anno: ad aprile il lancio di un modello "per mantenere la posizione", a metà anno il lancio di un modello "da tavolo" (diventando one of the best), e alla fine dell'anno un modello Top 1.
Questa strategia di ritorno alla ricerca sui modelli di base rappresenta la risposta di Zhipu all’impatto di DeepSeek. Il 23 dicembre è stato lanciato e reso open source il modello di base GLM-4.7 di Zhipu; secondo l’Artificial Analysis (indice AA), GLM-4.7 si classifica al primo posto tra i modelli cinesi e al sesto posto a livello globale insieme a Claude 4.5 Sonnet.
Oltre al lancio di GLM-5, la lettera interna introduce anche tre direzioni tecnologiche su cui Zhipu si concentrerà nel 2026: la progettazione di una nuova architettura di modello, un paradigma RL (apprendimento per rinforzo) più generale e l’esplorazione dell’apprendimento continuo e dell’evoluzione autonoma del modello. Tutto ruota intorno al miglioramento delle capacità dei modelli di base.
Nel 2025 Zhipu ha inoltre subito una ristrutturazione organizzativa su larga scala, riducendo la dimensione dei team To C, di ricerca e produzione e di generazione video; i risultati, inclusi quelli di AutoGLM, sono stati progressivamente resi open source.
Dalla pubblicazione di ChatGPT, in oltre tre anni di rapido sviluppo dell’AI, "l’industria non ha raggiunto alcun consenso, tutti stanno semplicemente andando avanti." Così ha detto Tang Jie in uno scambio interno.
Segue il testo completo della lettera aperta di Tang Jie, pubblicata in esclusiva da LatePost su autorizzazione di Zhipu.
Fare AGI con lo spirito del "caffè"
Durante una breve visita alla Hong Kong University of Science and Technology, ho incontrato per caso il professor Yang Qiang nella caffetteria al primo piano del laboratorio. Gli ho detto che in quei giorni avevo bevuto troppo caffè, sentivo quasi dipendenza, dovevo disintossicarmi un po'.
Il professor Yang ha risposto: "Perché smettere? La dipendenza non è necessariamente una cosa negativa. Se fare ricerca ci appassionasse come bere caffè, non avremmo nulla di cui preoccuparci!".
In effetti, la "dipendenza" è ciò che rende la vita interessante; che si tratti di ricerca o altro, basta essere concentrati e impegnati e si otterranno risultati.
"Far pensare le macchine come gli esseri umani" è la visione e l’ideale di Zhipu sin dall’inizio, nonché l’unico obiettivo per cui tutti in Zhipu si impegnano con costanza.
Alla fine del 2018, ispirati dalla teoria dei due sistemi cognitivi del cervello umano, abbiamo progettato un sistema di "cognizione" per macchine dotato di pensiero rapido e pensiero lento. Nel 2019 abbiamo fondato ufficialmente Zhipu, iniziando a esplorare l'AGI con l’ambizioso obiettivo di "far pensare le macchine come esseri umani".
La sfida più grande qui è che ancora oggi nessuno, nemmeno noi stessi, è in grado di dare una definizione precisa di AGI, né di stabilire il percorso tecnico per raggiungerla. Forse è proprio questo il fascino della ricerca sull’AGI.
Ci troviamo in un momento storico senza precedenti, in cui una tecnologia sta nuovamente rivoluzionando il mondo. I grandi modelli non sono solo la base chiave dell’intelligenza artificiale generale, ma promettono di diventare anche il motore principale della trasformazione della produttività.
Guardando indietro, uno dei motivi principali per cui siamo arrivati fin qui è che abbiamo sempre puntato a realizzare tecnologie AI realmente utilizzabili dagli utenti. Solo teorie, tecnologie o prodotti utilizzati realmente possono diventare risultati significativi sulla strada verso l’AGI. Certo, non tutte le innovazioni hanno successo: anche noi abbiamo avuto molti progetti rischiosi finiti male, ma questi insuccessi ci hanno insegnato molto, rendendo Zhipu più forte e approfondendo la nostra comprensione dell’AGI. Più importante ancora, ci hanno insegnato a puntare sulla praticità senza fissarci solo sui benefici a breve termine: aiutare gli utenti, il Paese e il progresso scientifico globale è diventato l’obiettivo di lungo termine di Zhipu.
Nel 2020 abbiamo lanciato la nostra architettura algoritmica per grandi modelli, GLM, e iniziato a addestrare un modello di base con 10 miliardi di parametri; il modello ha avuto successo ed è stato testato da molte aziende, tra cui Meituan: un tentativo audace, perché allora dominavano ancora i piccoli modelli come BERT. Tuttavia, il successo di allora era ancora lontano dal nostro sogno di AGI. In parte perché la quantità di conoscenza del modello era ancora insufficiente, ma anche perché il modello non sapeva ancora ragionare come un essere umano.
Dal 2021 al 2022, lo sviluppo dei grandi modelli non è stato facile: la maggior parte delle persone non accettava l’idea di "far pensare le macchine come esseri umani", un progetto folle come andare sulla luna, né riteneva che fosse una grande opportunità di cambiamento tecnologico, o aveva paura di fallire. Abbiamo comunque deciso di rischiare, addestrando con più dati un modello di grandi dimensioni da 130 miliardi di parametri.
Quella decisione è stata difficile, perché non doveva influire sul ritmo generale dell’azienda. Per questo abbiamo creato due team di innovazione separati: uno per l’addestramento dei modelli, diventato poi il trio GLM dell’azienda; l’altro per la costruzione indipendente della piattaforma MaaS. I due piccoli team probabilmente non sapevano nemmeno l’uno dell’altro. A metà 2022, GLM-130B è stato addestrato, e molte scelte progettuali di dettaglio hanno attirato l’attenzione globale; contemporaneamente è stata lanciata la piattaforma MaaS, oggi bigmodel.cn, che ha avuto i primi veri utenti API. Poi abbiamo fondato ufficialmente l’Istituto AI, dedicato allo sviluppo dei grandi modelli di prossima generazione, e il dipartimento MaaS Platform, responsabile dei servizi API dei grandi modelli. A volte serve trovare persone con sogni abbastanza audaci (persino dedicando più energie a cercarle): un obiettivo grande e ambizioso decide già metà del successo.
Nel 2023, parlando con un giovane imprenditore top nazionale (in realtà molto più giovane di me) su come l’AI avrebbe cambiato il futuro, abbiamo convenuto che l’AI avrebbe rivoluzionato la ricerca, i browser, portando a ognuno un nuovo assistente AI; e che, con tale assistente, non avremmo più bisogno di app store, bensì di creare uno "store di API" per l’AI, la cui logica di base sarebbe quella di rivoluzionare i sistemi operativi esistenti; e forse, in futuro, la rivoluzione più grande riguarderà proprio il computer stesso, perché avremo bisogno non più di computer per le persone, ma di computer adatti all’AI.
L’impatto di questa rivoluzione sarà immenso, poiché ridefinirà la logica di base dei computer, sfidando la pietra angolare degli ultimi 80 anni dell’informatica: l’architettura di von Neumann. A questo punto, ci siamo resi conto entrambi che il nostro investimento nell’AI era ancora troppo poco, non abbastanza "all-in".
La realtà è però dura: essere "all-in" richiede non solo una fede incrollabile, ma anche risorse finanziarie e di team molto forti, oltre a una previsione precisa del futuro. Dal 2023 al 2024 è stato l’anno dell’esplosione globale dei grandi modelli: le grandi aziende hanno tutte "puntato tutto" sui grandi modelli, in Cina c’è stata un’ondata di startup e una "battaglia dei cento modelli", con infiniti AI assistant.
Forse anche noi, allora, abbiamo commesso degli errori, sia tecnici sia commerciali. Ora, ripensandoci, forse il motivo era che, nella corsa verso l’AGI, a volte ci siamo persi, distratti dai profitti e dal fermento a breve termine. L’AGI è una rivoluzione tecnologica: la tecnologia è equa, trasparente, deve essere accessibile a tutti e portare benefici a tutti.
L’arrivo di DeepSeek ci ha fatto riflettere: quando Wen Feng ha avviato la sua startup nel 2023 ne abbiamo parlato, ma non mi ero reso conto della sua determinazione sull’AGI. Lo ringrazio per avermi dato molte nuove idee. La scelta di perseguire tenacemente la tecnologia AGI, esplorare costantemente il suo limite superiore e prevedere con precisione il futuro, sarà ciò su cui Zhipu dovrà continuare a migliorare e rafforzarsi. Questi anni ci hanno insegnato molto, soprattutto rafforzando la nostra comprensione di AGI, governance aziendale e concorrenza commerciale grazie al "reinforcement learning".
Nell’ultimo anno, abbiamo fatto un vero e proprio "rafforzamento" sistematico: abbiamo lanciato gli slogan "determinazione" e "realizzazione", chiedendo a tutti di mantenere la calma, evitare arroganza e sottovalutazione, realizzare i propri compiti e realizzare se stessi.
All’inizio dell’anno tutto era difficile: le prestazioni dei modelli non erano all’altezza delle aspettative, in tutto il paese infuriava la guerra dei prezzi, per emergere serviva trovare un punto di svolta preciso.
Abbiamo mantenuto la posizione e finalmente trovato nel Coding la svolta.
Se il lancio di GLM-4.1 ad aprile è stato un tentativo simbolico, quello di GLM-4.5 a fine luglio è stato quasi una battaglia decisiva: tutti i team tecnici, di piattaforma e di business hanno lavorato senza sosta, e finalmente abbiamo ottenuto una vittoria tanto attesa. Poi GLM-4.6 e GLM-4.7 ci hanno permesso di raggiungere i modelli internazionali di punta. Il nostro GLM-4.7 ha ottenuto lo SOTA tra i modelli open source e cinesi sia nell’AA che in altre valutazioni, e la reale esperienza utente di Coding e Agent è stata molto positiva: 150.000 sviluppatori da 184 paesi usano GLM Coding Plan, dopo il lancio di GLM-4.7 il fatturato annualizzato della piattaforma MaaS ha superato i 500 milioni (oltre 200 milioni all’estero), passando da 20 a 500 milioni (25 volte) in soli 10 mesi.
In generale, dal lato dei modelli abbiamo rispettato la strategia fissata: ad aprile un modello per "mantenere la posizione", a metà anno uno "da tavolo" (one of the best), a fine anno un modello Top 1. Questo pone solide basi per continuare la corsa verso l’AGI.
Anche la nostra "AI sovrana" ha registrato nuovi progressi: la piattaforma nazionale MaaS della Malesia è costruita sul modello open source Z.ai, GLM è diventato il modello nazionale malese. L’internazionalizzazione della sovranità AI è nata dall’ispirazione ricevuta dal Segretario Generale durante un incontro: "l’AI cinese deve uscire nel mondo", ma sinceramente non sapevo come fare. Il nostro team internazionale ha avuto il coraggio di lottare e ottenere risultati, portando i grandi modelli cinesi all’estero per la prima volta. In termini di business, siamo riusciti nuovamente a raddoppiare il fatturato annuo.
In un contesto di difficoltà e opportunità, oggi siamo diventati la prima azienda di grandi modelli quotata al mondo, con una posizione quasi impossibile: segno che il mercato riconosce il nostro valore tecnico e commerciale. "Make impossible possible" — ve lo ricordate?
Forse la trasformazione più grande quest’anno non è stata di Zhipu, ma di un gruppo di giovani in prima linea, che hanno reso possibile ciò che sembrava impossibile.
Per il 2026, l’obiettivo aziendale è diventare leader internazionale nel settore dei grandi modelli. Nell’ultimo anno tutti hanno discusso di grandi modelli, applicazioni ed ecosistemi.
Ciò che determina davvero la configurazione della prossima fase rimangono due aspetti fondamentali: l'architettura dei modelli e i paradigmi di apprendimento. Allo stesso tempo, dal lato delle applicazioni potrebbe emergere una direzione chiara: l'anno dell'esplosione dell'AI che sostituisce diverse professioni/compiti.
Sulla base di questa valutazione, nel 2026 ci concentreremo su:
GLM-5. Presto GLM-5 sarà disponibile per tutti: grazie a ulteriori scaling e nuove tecnologie, crediamo che offrirà molte esperienze innovative e aiuterà tutti a portare a termine più compiti reali.
Nuove architetture di modello. L’architettura Transformer, usata ormai da quasi 10 anni, mostra alcune carenze: costi nel calcolo di contesti molto lunghi, meccanismi di memoria e aggiornamento, ecc. Serve esplorare nuove architetture, scoprire nuovi paradigmi di scaling, migliorare l’efficienza tramite co-design chip-algoritmo e altre tecnologie.
RL con maggiore capacità di generalizzazione. Il paradigma RLVR, attualmente dominante, ha avuto successo in matematica e programmazione, ma la sua dipendenza da ambienti verificabili costruiti manualmente ne limita l’applicabilità. Quest’anno occorre esplorare paradigmi RL più generali, affinché l’AI possa non solo svolgere compiti su istruzione umana, ma anche capire ed eseguire compiti di lunga durata, da ore a giorni.
La sfida più grande è aprire la strada all’apprendimento continuo e all’evoluzione autonoma. I modelli AI attuali sono statici dopo la distribuzione: apprendono attraverso un costoso processo di addestramento una tantum e poi diventano obsoleti nelle applicazioni. Al contrario, il cervello umano apprende e si evolve continuamente tramite interazione con il mondo. Occorre pianificare in anticipo per il paradigma di apprendimento di prossima generazione—Online Learning o Continual Learning.
Non siamo un’azienda tradizionale, né vogliamo diventarlo. Vogliamo essere una AI-native company dove tutto è possibile: creare modelli di prossima generazione che superano costantemente i limiti dell’intelligenza, sviluppare prodotti e servizi AI per gli utenti. Vogliamo che l’AI diventi il miglior assistente di ciascuno, aiutandolo a portare a termine i propri compiti. Crediamo anche che l’AI debba essere impiegata nella governance aziendale per ridurre i costi, aumentare l’efficienza e garantire maggiore equità.
Col passare del tempo, spesso un’azienda si abitua a fare sempre le stesse cose e a migliorare solo gradualmente, limitando così la propria capacità innovativa. Ma nell’era dell’AI tutto è rivoluzionario: dobbiamo sentirci un po’ "a disagio" per mantenere l’innovazione e proporre idee dirompenti per guidare la prossima grande crescita.
Per questo, abbiamo creato internamente in Zhipu un nuovo dipartimento, X-Lab, che mira a riunire giovani con uno spirito aperto per esplorazioni d’avanguardia: nuove architetture di modello, nuovi paradigmi cognitivi, incubando anche nuovi progetti, non solo software o hardware. Amplieremo anche gli investimenti esterni: oltre alle aziende già partecipate, esploreremo nuove aree, collegando tutto il settore per una prosperità condivisa. In X-Lab la missione di tutti è fare innovazione completamente dirompente, tornando infine alla linea principale dell’AGI.
Oggi è un giorno emozionante nella vita di Zhipu, una pietra miliare nella nostra storia e soprattutto l’inizio di una nuova era. Mi piace molto il brand Z.ai: Z è l’ultima lettera dell’alfabeto, rappresenta la destinazione finale—vogliamo arrivare all’estremo dell’intelligenza nel percorso di esplorazione dell’AGI, questo è il nostro obiettivo. Siamo molto entusiasti:
- Una causa ambiziosa che può cambiare il mondo
- Focalizzati sugli interessi a lungo termine e sul futuro
- Più concentrati, alla ricerca dell’essenza dell’AGI
- Potenziare grandi imprenditori e aziende con l’AI
- Cogliere le opportunità di sviluppo aziendale con previsioni più accurate
- Infine, speriamo di portare all’umanità una AI diversa, promuovendo davvero il progresso del benessere umano.
Questo è un momento di gioia senza paragoni: non una felicità effimera da dopamina, ma endorfina accumulata lungo il cammino verso l’AGI. Ci rende più concentrati, con i piedi per terra, e ci permette di andare avanti con costanza!
Tang Jie
2026.1.8
Immagine di copertina: "Dune 2"
- FIN -
Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.
Ti potrebbe interessare anche

MixMax collabora con Aylab per stimolare la crescita e il volume di Web3 e DeFi nel 2026
L'audace impennata di prezzo di Cardano: ADA punta al traguardo dei 10 dollari
Mentre Zcash fatica, XRP e Solana registrano boom istituzionali

