Zhipu AI (Z.ai) a lansat oficial pe 11 februarie 2026 modelul GLM-5, un model lingvistic de ultimă generație care marchează o tranziție fundamentală: trecerea de la simpla generare de cod la "agentic engineering" adevărat.
Cu aproximativ 745 miliarde de parametri totali și 44 miliarde de parametri activi, GLM-5 nu este doar cel mai puternic model open-source din China, ci și o declarație de independență tehnologică: a fost antrenat exclusiv pe chip-uri Huawei Ascend, demonstrând decuplarea completă de hardware-ul american.
Arhitectura Tehnică: Mixture of Experts la Scară Maximă
GLM-5 utilizează o arhitectură Mixture of Experts (MoE) cu 256 experți, dintre care 8 sunt activați per token, rezultând o rată de sparsitate de 5.9%. Saltul față de predecesorul său este masiv:
- Parametri: Creștere de la 355 miliarde (GLM-4.7) la 744 miliarde.
- Date de antrenament: Volumul a crescut la 28.5 trilioane de token-uri.
O inovație cheie este adoptarea arhitecturii DeepSeek Sparse Attention, concepută pentru a maximiza eficiența computațională. Context window-ul de 200K token-uri oferă echilibrul necesar între capacitatea de procesare a documentelor lungi și eficiența în inferență.
GameBoy Test și Era "Long-Task"
Una dintre demonstrațiile neconvenționale ale capacităților GLM-5 a fost "GameBoy test". Similar modului în care jocurile vechi cereau jucătorilor să gestioneze resurse și să ia decizii strategice pe parcursul orelor de joc, agenții AI moderni trebuie să mențină starea și să execute planuri complexe fără a pierde firul logic.
Cercetătorii au testat GLM-5 printr-o serie de provocări multi-step extinse, validând capacitatea modelului de a susține un raționament coerent pe orizonturi lungi de timp - o cerință critică pentru aplicațiile agentice reale, nu doar pentru demo-uri.
Cinci Domenii Core de Performanță
GLM-5 excelează în ariile care definesc noua generație de AI:
- Creative Writing - Versatilitate stilistică avansată și generare de conținut original, depășind rigiditatea modelelor anterioare.
- Code Generation - Capacități de debugging și "systems-engineering" comparabile direct cu Claude Opus 4.5. Nu doar scrie funcții, ci înțelege arhitecturi.
- Advanced Multi-Step Reasoning - Raționament logic de nivel frontier pentru dovezi matematice și analiză științifică.
- Agentic Intelligence - Arhitectură built-in pentru planificare autonomă, utilizare de tool-uri și browsing web cu intervenție umană minimă.
- Long-Context Processing - Procesare robustă a documentelor extensive și materialelor de cercetare.
Agent Mode (Beta): De la Conversație la Livrare
GLM-5 introduce Agent Mode, care schimbă paradigma de la chat la delivery-first. Modelul descompune automat task-urile, orchestrează tool-urile necesare și execută workflow-uri complete.
Funcționalitățile cheie includ:
- Data Insights: Upload de date și generare instantă de vizualizări (bar, line, pie) cu export (xlsx/csv/png).
- Smart Writing: De la outline la draft final, cu control step-by-step și export direct în PDF sau Word.
- Full-Stack Development: O înțelegere superioară a instrucțiunilor complexe și execuție multi-step pentru task-uri de engineering.
Benchmark-uri și Impactul în Piață
Poziționat ca un potențial "GPT-5 killer", GLM-5 vizează să egaleze sau să depășească GPT-5.2 și Claude Opus 4.5 în task-uri de raționament. Testele interne indică scoruri leading în industrie pentru modele open-source, depășind chiar Gemini 3 Pro de la Google DeepMind în anumite scenarii.
Un detaliu interesant: modelul misterios "Pony Alpha" care a apărut pe OpenRouter în februarie 2026 și a impresionat comunitatea tech a fost confirmat ca fiind o versiune stealth a GLM-5.
Impactul economic a fost imediat. Lansarea a generat un rally pe bursa din Hong Kong, acțiunile Zhipu AI (Knowledge Atlas Technology) crescând cu aproape 30%, trăgând după ele și alți jucători locali precum MiniMax și SenseTime.
Concluzie: Schimbarea Paradigmei
GLM-5 nu este doar un alt model lingvistic mare. Este o dovadă că "vibe coding"-ul este înlocuit de "agentic engineering". Într-o eră în care modelele nu doar generează text, ci proiectează sisteme, rezolvă bug-uri complexe și gestionează task-uri pe termen lung cu autonomie reală, GLM-5 oferă o alternativă open-source (și independentă de hardware-ul vestic) extrem de puternică.
Modelul este accesibil prin platforma Z.ai și WaveSpeed API, cu un release open-weight sub licență MIT așteptat în curând.
Surse:



