DeepSeek’s AI Leert Voor Zichzelf Te Denken

Image by Matheus Bertelli, from Pexels

DeepSeek’s AI Leert Voor Zichzelf Te Denken

Leestijd: 2 minuut

De Chinese startup DeepSeek, in samenwerking met de Tsinghua Universiteit, zegt een slimmere manier ontwikkeld te hebben om kunstmatige intelligentie modellen beter en sneller te laten denken, zonder dat er enorme computers of dure resources nodig zijn.

Heb je haast? Hier zijn de snelle feiten:

  • DeepSeek heeft een zelfverbeterende AI gecreëerd met behulp van Self-Principled Critique Tuning (SPCT).
  • SPCT leert AI om zijn eigen werk te beoordelen met behulp van zelf gegenereerde regels.
  • De methode verbetert de prestaties zonder massale rekenkracht.

De doorbraak komt van een nieuwe techniek genaamd Self-Principled Critique Tuning (SPCT). SPCT verschilt van het simpelweg groter maken van AI-modellen om de prestaties te verbeteren – SPCT vereist niet veel energie en rekenkracht om de AI te leren zijn eigen werk te beoordelen met behulp van een set zelfgemaakte regels.

De manier waarop het werkt is via een ingebouwde “rechter” die verifieert of de AI-reactie zowel voldoet aan de interne redeneerregels, als geschikt lijkt voor menselijke output. Wanneer de AI een solide reactie levert, ontvangt het positieve feedback, wat helpt om zijn vermogen om soortgelijke vragen in toekomstige situaties te beantwoorden te verbeteren.

DeepSeek implementeert deze methode als onderdeel van het DeepSeek-GRM systeem, wat staat voor Generative Reward Modeling. GRM werkt anders dan traditionele methoden omdat het parallelle controles uitvoert om zowel nauwkeurigheid als consistentie te verbeteren.

“We stellen het Zelf-Principiële Kritiekafstemming (ZPK) voor om beloningsgedrag op grote schaal te bevorderen,” schreven de onderzoekers in hun artikel. “ZPK stelt [het model] in staat om adaptief principes en kritiek te formuleren op basis van de invoervraag en reacties, wat leidt tot betere beloningen.”

Met dit systeem beweert DeepSeek dat zijn AI nu beter kan presteren dan concurrenten zoals Google’s Gemini, Meta’s Llama, en OpenAI’s GPT-4o, vooral als het gaat om complexe taken zoals redeneren of besluitvorming, zoals Euronews opmerkte.

Belangrijk is dat DeepSeek aangeeft van plan te zijn deze nieuwe tools vrij te geven als open-source software, hoewel er nog geen releasedatum is gedeeld.

Vond je dit artikel leuk?
Geef een beoordeling!
Ik vond het verschrikkelijk Ik vond het echt niet leuk Het was redelijk Best goed! Ik vond het geweldig!

We zijn erg blij dat je van ons werk hebt genoten!

Zou je als gewaardeerde lezer je mening over ons willen delen op Trustpilot? Dit neemt niet veel tijd in beslag en zouden we erg op prijs stellen. Bedankt, je bent geweldig!

Beoordeel ons op Trustpilot
0 Gestemd door 0 gebruikers
Titel
Reactie
Bedankt voor je feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Laat een reactie achter

Loader
Loader Meer weergeven...