AI vant nettopp gull i den internasjonale matematikkolympiaden 🥇 OpenAI og Googles modeller løste 5/6 problemer ved å bruke generelle LLM-er under reelle eksamensregler. Tidsalderen for AGI for formell matematikk har begynt 👇
Å vinne gull betyr å score 35/42. Det er et nivå oppnådd av bare en håndfull eliteelever på videregående skole over hele verden. Både OpenAI og Googles modeller treffer blink. Ingen kalkulatorer. Ingen søk. Bare naturlig språkresonnement.
Googles Gemini 2.5 brukte "Deep Think"-modus: - Utforskede løsninger parallelt - Trent på bevisstrategier og matematiske korpus - Brukt forsterkende læring på flertrinns resonneringsoppgaver Korrekturene var så polerte at IMO-gradere kalte dem publiserbare.
OpenAIs modell ble ikke trent for IMO. Den brukte: - Generelle RL-teknikker - Ingen internett eller verktøy - Bevis på naturlig språk
OpenAI fikk hvert bevis uavhengig gradert av 3 tidligere IMO-medaljevinnere, med enstemmig konsensus. Modellen visste til og med når den ikke hadde et gyldig svar for P6... viser sine ferdigheter i resonnement, feilkontroll og selvbevissthet.
Vi tror AIs største innvirkning kan ligge i matematikk. Hvorfor? Fordi matematikk driver alt fra DeFi-logikk til protokollsikkerhet, og det er verifiserbart. AI-er som resonnerer, som Fields-medaljevinnere, vil omforme hvordan vi bygger.
I årene som kommer forventer vi at AI skal: • Perfekt matematikk på videregående skole og høyskolenivå (IMO, Putnam) • Løse avanserte forskningsproblemer • Bidra til formaliserte bevis for grunnleggende teoremer • Skaler samarbeidende, desentralisert matematikk
Vi ser en fremtid der matematikk ikke bare er automatisert, det er demokratisert, tillitsløst og komponerbart. 💙
Vis originalen
3,97k
108
Innholdet på denne siden er levert av tredjeparter. Med mindre annet er oppgitt, er ikke OKX forfatteren av de siterte artikkelen(e) og krever ingen opphavsrett til materialet. Innholdet er kun gitt for informasjonsformål og representerer ikke synspunktene til OKX. Det er ikke ment å være en anbefaling av noe slag og bør ikke betraktes som investeringsråd eller en oppfordring om å kjøpe eller selge digitale aktiva. I den grad generativ AI brukes til å gi sammendrag eller annen informasjon, kan slikt AI-generert innhold være unøyaktig eller inkonsekvent. Vennligst les den koblede artikkelen for mer detaljer og informasjon. OKX er ikke ansvarlig for innhold som er vert på tredjeparts nettsteder. Beholdning av digitale aktiva, inkludert stablecoins og NFT-er, innebærer en høy grad av risiko og kan svinge mye. Du bør nøye vurdere om handel eller innehav av digitale aktiva passer for deg i lys av din økonomiske tilstand.