
Image by Matheus Bertelli, from Pexels
DeepSeek’s AI Leert Voor Zichzelf Te Denken
De Chinese startup DeepSeek, in samenwerking met de Tsinghua Universiteit, zegt een slimmere manier ontwikkeld te hebben om kunstmatige intelligentie modellen beter en sneller te laten denken, zonder dat er enorme computers of dure resources nodig zijn.
Heb je haast? Hier zijn de snelle feiten:
- DeepSeek heeft een zelfverbeterende AI gecreëerd met behulp van Self-Principled Critique Tuning (SPCT).
- SPCT leert AI om zijn eigen werk te beoordelen met behulp van zelf gegenereerde regels.
- De methode verbetert de prestaties zonder massale rekenkracht.
De doorbraak komt van een nieuwe techniek genaamd Self-Principled Critique Tuning (SPCT). SPCT verschilt van het simpelweg groter maken van AI-modellen om de prestaties te verbeteren – SPCT vereist niet veel energie en rekenkracht om de AI te leren zijn eigen werk te beoordelen met behulp van een set zelfgemaakte regels.
De manier waarop het werkt is via een ingebouwde “rechter” die verifieert of de AI-reactie zowel voldoet aan de interne redeneerregels, als geschikt lijkt voor menselijke output. Wanneer de AI een solide reactie levert, ontvangt het positieve feedback, wat helpt om zijn vermogen om soortgelijke vragen in toekomstige situaties te beantwoorden te verbeteren.
DeepSeek implementeert deze methode als onderdeel van het DeepSeek-GRM systeem, wat staat voor Generative Reward Modeling. GRM werkt anders dan traditionele methoden omdat het parallelle controles uitvoert om zowel nauwkeurigheid als consistentie te verbeteren.
“We stellen het Zelf-Principiële Kritiekafstemming (ZPK) voor om beloningsgedrag op grote schaal te bevorderen,” schreven de onderzoekers in hun artikel. “ZPK stelt [het model] in staat om adaptief principes en kritiek te formuleren op basis van de invoervraag en reacties, wat leidt tot betere beloningen.”
Met dit systeem beweert DeepSeek dat zijn AI nu beter kan presteren dan concurrenten zoals Google’s Gemini, Meta’s Llama, en OpenAI’s GPT-4o, vooral als het gaat om complexe taken zoals redeneren of besluitvorming, zoals Euronews opmerkte.
Belangrijk is dat DeepSeek aangeeft van plan te zijn deze nieuwe tools vrij te geven als open-source software, hoewel er nog geen releasedatum is gedeeld.
Laat een reactie achter
Annuleer