OpenAI har i dag præsenteret GPT-5.4, som rulles ud i ChatGPT (som GPT-5.4 Thinking), i API’et (som gpt-5.4) og i Codex. Samtidig kommer en GPT-5.4 Pro-variant til dem, der vil have maksimal performance på komplekse opgaver.
Det er ikke en “ny model der kan alt muligt magisk”. Det er en målrettet opgradering af det, der faktisk fylder i hverdagen, hvis du bruger AI til arbejde: længere leverancer, flere værktøjer, flere iterationer – og en masse småfriktion, man helst vil slippe for.
1) GPT-5.4 Thinking i ChatGPT: du kan styre svaret, mens det bliver skrevet
I ChatGPT kommer den store “bruger-ting” som en ny måde at få lange svar på: GPT-5.4 Thinking kan starte med en kort plan (“preamble”) på komplekse prompts, så du kan rette retningen midt i processen i stedet for at vente på et helt færdigt svar og så starte forfra.
Funktionen er ifølge OpenAI live på chatgpt.com og Android, og på vej til iOS.
OpenAI siger også, at GPT-5.4 Thinking er blevet bedre til dyb web-research og til at holde konteksten stabil i prompts, der kræver længere tænkning.
2) API og Codex: første “general-purpose” model med native computer-use
Den største ændring for udviklere og agent-workflows: GPT-5.4 er OpenAI’s første general-purpose model med native computer-use. Det betyder, at modellen ikke kun “skriver kode”, men også kan operere i software via screenshots og konkrete input (klik, tastetryk, navigation) – og dermed gennemføre længere workflows på tværs af apps.
OpenAI fremhæver, at GPT-5.4 kan arbejde med op til 1M tokens kontekst (langt mere end standarden for mange modeller), så agenter kan planlægge, eksekvere og verificere opgaver over længere “horisonter” uden at miste tråden.
I Codex nævnes der eksperimentel support for 1M context, og at requests over standard 272K tæller 2x mod usage limits.
3) Knowledge work: spreadsheets, slides og docs er ikke “side quests” længere
OpenAI lægger ikke skjul på retningen: GPT-5.4 er designet til professionelt arbejde – altså leverancer, der normalt kræver flere iterationer: dokumenter, præsentationer, regneark, planer, analyser.
På benchmarken GDPval (44 jobfunktioner) rammer GPT-5.4 ifølge OpenAI et nyt topniveau: modellen matcher eller overgår fagfolk i 83,0% af sammenligningerne, mod 70,9% for GPT-5.2.
De peger også på konkrete forbedringer:
- Spreadsheets: På en intern benchmark for IB-agtig modellering scorer GPT-5.4 87,3% mod 68,4% for GPT-5.2.
- Præsentationer: I en eval af slide-prompts foretrækker human raters GPT-5.4’s præsentationer 68% af tiden, bl.a. pga. stærkere æstetik og visuel variation.
- Færre fejl: På prompts hvor brugere tidligere har flagget faktuelle fejl, er GPT-5.4’s individuelle claims ifølge OpenAI 33% mindre tilbøjelige til at være falske – og hele svar 18% mindre tilbøjelige til at indeholde fejl – sammenlignet med GPT-5.2.
Der er også en lille, men vigtig detalje: OpenAI anbefaler Enterprise-kunder at bruge deres nye ChatGPT for Excel add-in, som blev lanceret samme dag.
4) Tool use: “tool search” skal gøre store tool-økosystemer mindre tunge
Hvis du har arbejdet med agent-setup (eller bare tunge “tool prompts”), kender du problemet: hver gang du giver en model adgang til mange værktøjer, vokser prompten – og det koster både tokens og latency.
OpenAI’s svar i GPT-5.4 er tool search: i stedet for at sende alle tool-definitioner med hele tiden, får modellen en letvægtsoversigt og kan slå tool-definitioner op, når den faktisk skal bruge dem.
I OpenAI’s egen demo på MCP Atlas (250 tasks med 36 MCP servers) reducerede tool-search opsætningen samlet tokenforbrug med 47% ved samme accuracy.
5) Kodning: GPT-5.3-Codex’ styrker – i en “mainline” model
GPT-5.4 bygger eksplicit på de coding-forbedringer, OpenAI lancerede med GPT-5.3-Codex. På SWE-Bench Pro (Public) står GPT-5.4 til 57,7% mod 55,6% for GPT-5.2 (og 56,8% for GPT-5.3-Codex i tabellen på release-siden).
I Codex findes også en /fast mode, der ifølge OpenAI giver op til 1,5x hurtigere token velocity på GPT-5.4. I API’et kan man opnå tilsvarende via priority processing.
Som en ekstra “agent”-ting: OpenAI lancerer en eksperimentel Codex-skill, Playwright (Interactive), der kan bruges til at teste og debugge web/Electron apps visuelt, mens agenten bygger.
Pris og tilgængelighed: hvad koster det – og hvem får hvad?
ChatGPT
- GPT-5.4 Thinking ruller ud til Plus, Team og Pro og erstatter GPT-5.2 Thinking.
- GPT-5.2 Thinking bliver liggende under Legacy Models i tre måneder og udfases 5. juni 2026.
- GPT-5.4 Pro er til Pro og Enterprise. Enterprise/Edu kan slå early access til via admin settings.
API
- Model-id’er:
gpt-5.4oggpt-5.4-pro - Pris (per 1M tokens): $2.50 input / $0.25 cached input / $15 output for
gpt-5.4 gpt-5.4-pro: $30 input / $180 output- OpenAI skriver, at Batch og Flex ligger til halv standardrate, mens Priority ligger til dobbelt standardrate.
Hvorfor det her betyder noget (uden at du behøver være udvikler)
Hvis du bruger AI som arbejdsredskab – ikke som legetøj – er GPT-5.4 i praksis et forsøg på at reducere friktion på tre fronter:
- Mindre “prompt-orkestrering”: tool search + bedre tool-calling gør store workflows lettere at sætte op.
- Mere stabilt knowledge work: bedre output på regneark, slides og docs – og færre faktuelle fejl i svar, ifølge OpenAI’s egne målinger.
- Agent-ting der faktisk kan arbejde: native computer-use betyder, at “AI der gør noget” ikke kun er en flot demo, men en mere integreret del af API/Codex.
Det bliver interessant at se, om “preamble”-styringen i ChatGPT ender med at ændre, hvordan man arbejder med lange leverancer i praksis. Det er en lille UI-detalje – men den rammer præcis det punkt, hvor mange ender med at spilde tid: at opdage for sent, at modellen er ved at løbe ned ad en forkert sti.








