
Photo by John Schnobrich on Unsplash
Alibaba Lancering Nieuw Qwen AI Model en Beweert Dat Het DiepZoek-V3 Overpresteert
De Chinese gigant Alibaba lanceerde afgelopen woensdag de nieuwste versie van zijn vlaggenschip AI-model, Qwen. Het bedrijf beweert dat het beter kan presteren dan de populaire DeepSeek-V3.
Haast? Hier zijn de snelle feiten!
- Alibaba heeft afgelopen woensdag haar nieuwste redeneermodel Qwen 2.5-Max uitgebracht.
- De Chinese gigant beweert dat het populaire modellen zoals DeepSeek-V3, GPT-4o en Llama-3.1-405B overtreft.
- Het bedrijf lanceerde ook Qwen2.5-VL deze week, een AI-model dat in staat is om afbeeldingen te verwerken en te fungeren als een AI-agent die computers en mobieltjes gebruikt om taken uit te voeren.
Volgens Reuters, heeft Alibaba tijdens de vakantie van het Chinees Nieuwjaar de nieuwe Qwen 2.5-Max gelanceerd, zoals ze het nieuwe redeneermodel hebben genoemd, om zich te voegen bij de massale AI-ontwikkelingen van de afgelopen dagen en binnenlandse concurrentie toe te voegen.
Op maandag bereikte DeepSeek de eerste plaats in de App Store van Apple in de Verenigde Staten, waarmee het ChatGPT overtrof, andere bedrijven in de AI-industrie zorgen baarde en investeerders alarmeerde—Nvidia aandelen daalden met 17% in slechts één dag.
Nu heeft Alibaba de nieuwste versies van zijn Qwen model aangekondigd—het bracht 100 open-source AI-modellen voor de Qwen suite uit in september vorig jaar—met de belofte van betere resultaten dan populaire grensmodellen.
“Qwen 2.5-Max presteert (…) bijna over de hele linie beter dan GPT-4o, DeepSeek-V3 en Llama-3.1-405B,” schreef het bedrijf op zijn officiële WeChat-account.
De nieuwe redeneermodel Qwen 2.5-Max’s API is beschikbaar via Alibaba’s cloud en gebruikers kunnen het model ook testen op zijn chatpagina.
“We ontwikkelen Qwen2.5-Max, een grootschalig MoE-model dat voorgetraind is op meer dan 20 biljoen tokens en verder nageschoold is met zorgvuldig geselecteerde Supervised Fine-Tuning (SFT) en Reinforcement Learning from Human Feedback (RLHF) methodologieën”, schreef het Qwen Team op Github.
De Chinese gigant lanceerde ook Qwen2.5-VL op maandag, een reeks multimodale AI-modellen die ook afbeeldingen kunnen verwerken en toegang hebben tot mobiele telefoons en computers om taken uit te voeren. OpenAI kondigde een vergelijkbare functie aan, Operator, die ChatGPT in staat stelt om autonoom taken uit te voeren door de controle over de computer van de gebruiker over te nemen.
Volgens het team van Alibaba presteren alle Qwen-modellen beter dan vergelijkbare versies van OpenAI, Microsoft, Google, Meta en DeepSeek.
Laat een reactie achter
Annuleer