AI heeft net goud gewonnen op de Internationale Wiskunde Olympiade 🥇 De modellen van OpenAI en Google hebben 5/6 problemen opgelost met behulp van algemene LLM's onder echte examenregels. Het tijdperk van AGI voor formele wiskunde is begonnen 👇
Goud winnen betekent 35/42 scoren. Het is een niveau dat slechts door een handvol elite middelbare scholieren wereldwijd wordt bereikt. Zowel de modellen van OpenAI als die van Google halen de norm. Geen rekenmachines. Geen zoekopdrachten. Gewoon redeneren in natuurlijke taal.
Google's Gemini 2.5 gebruikte de "Deep Think" modus: - Onderzocht oplossingen parallel - Getraind op bewijsstrategieën en wiskundige corpora - Gebruikte versterkend leren op multi-stap redeneertaken De bewijzen waren zo verfijnd dat IMO-graders ze publiceerbaar noemden.
Het model van OpenAI was niet getraind voor de IMO. Het gebruikte: - Algemene RL-technieken - Geen internet of tools - Natuurlijke taalbewijzen
OpenAI liet elk bewijs onafhankelijk beoordelen door 3 voormalige IMO-medaillewinnaars, met unanieme consensus. Het model wist zelfs wanneer het geen geldig antwoord had voor P6... wat zijn vaardigheden in redeneren, foutcontrole en zelfbewustzijn toont.
Wij geloven dat de grootste impact van AI misschien wel in de wiskunde ligt. Waarom? Omdat wiskunde alles aandrijft, van DeFi-logica tot protocolbeveiliging, en het is verifieerbaar. AI's die redeneren als Fields Medalists zullen de manier waarop we bouwen hervormen.
In de komende jaren verwachten we dat AI: • Hoogwaardige wiskunde op middelbare school en universiteit perfect maakt (IMO, Putnam) • Geavanceerde onderzoeksproblemen oplost • Bijdraagt aan geformaliseerde bewijzen van fundamentele stellingen • Samenwerkende, gedecentraliseerde wiskunde opschaalt
We zien een toekomst waarin wiskunde niet alleen geautomatiseerd is, maar ook gedemocratiseerd, zonder vertrouwen en samenstelbaar. 💙
Origineel weergeven
3,97K
108
De inhoud op deze pagina wordt geleverd door derden. Tenzij anders vermeld, is OKX niet de auteur van het (de) geciteerde artikel(en) en claimt geen auteursrecht op de materialen. De inhoud is alleen bedoeld voor informatieve doeleinden en vertegenwoordigt niet de standpunten van OKX. Het is niet bedoeld als een goedkeuring van welke aard dan ook en mag niet worden beschouwd als beleggingsadvies of een uitnodiging tot het kopen of verkopen van digitale bezittingen. Voor zover generatieve AI wordt gebruikt om samenvattingen of andere informatie te verstrekken, kan deze door AI gegenereerde inhoud onnauwkeurig of inconsistent zijn. Lees het gelinkte artikel voor meer details en informatie. OKX is niet verantwoordelijk voor inhoud gehost op sites van een derde partij. Het bezitten van digitale activa, waaronder stablecoins en NFT's, brengt een hoge mate van risico met zich mee en de waarde van deze activa kan sterk fluctueren. Overweeg zorgvuldig of de handel in of het bezit van digitale activa geschikt voor je is in het licht van je financiële situatie.