GPT-5 za programere: Koliko su realna obećanja o najnaprednijem AI koderu do sada

OpenAI je predstavio GPT-5, model koji bi trebalo da donese velika unapređenja u kodiranju i automatizaciji. Sa 74,9 odsto uspešnosti na testovima realnih softverskih izazova i značajnim poboljšanjima u radu sa alatima, postavlja se pitanje da li je reč o pravoj revoluciji za programere ili samo o još jednoj verziji dobro upakovanog marketinga.

Šta zapravo znače brojke sa testova

Na testu SWE-bench Verified, koji proverava koliko AI uspešno rešava stvarne bagove sa GitHub-a, GPT-5 je ostvario rezultat od 74,9 odsto. GPT-4 je na istom testu imao 52 odsto, a model o3 69,1 odsto. To je primetan skok, ali treba imati na umu da ovaj test meri samo da li predloženi patch radi, a ne i da li je dugoročno održiv ili usklađen sa standardima tima.

Pored boljih rezultata, GPT-5 troši 22 odsto manje tokena i pravi 45 odsto manje poziva alatima nego o3, uz bolji krajnji ishod. U praksi, to znači niže troškove API-ja i brže odgovore za timove koji već koriste ovakve modele.

U zadacima koji zahtevaju izmene postojećeg koda, model je dostigao 88 odsto tačnosti, dok je o3 imao 81 odsto. To je značajno za svakodnevni rad programera, gde se često radi upravo na prilagođavanju i refaktorisanje postojećih rešenja.

Nove mogućnosti za programere

Custom Tools omogućava da se funkcije definišu i u običnom tekstu, bez obavezne upotrebe JSON formata, a input se može oblikovati pomoću regularnih izraza ili formalnih gramatika.
Reasoning Effort Control uvodi kontrolu nivoa promišljanja modela, od minimalnog do visokog, što omogućava izbor između brzine i kvaliteta.
Verbosity Control daje mogućnost da se biraju kraći ili detaljniji odgovori, od samog koda do objašnjenja i konteksta.
Frontend generacija je oblast u kojoj OpenAI tvrdi da GPT-5 dobija prednost u 70 odsto slučajeva tokom poređenja. Ipak, produkcijski rad zahteva mnogo više od generisanja primera; potrebna je responzivnost, pristupačnost i održivost koda.
Napredna automatizacija i rad sa alatima donosi najbolji rezultat na T2-bench testu sa 96,7 odsto uspešnosti, što bi trebalo da ga učini pouzdanijim u kompleksnim zadacima poput deployment skripti i višeslojnih procesa otklanjanja grešaka.

Problemi koji i dalje postoje

Iako su performanse poboljšane, AI asistenti i dalje teško održavaju kontekst u složenim radnim tokovima, imaju poteškoće sa ogromnim enterprise projektima i složenim zavisnostima, ne razumeju u potpunosti poslovnu logiku aplikacija, slabo se snalaze u integracionom testiranju i ne prate timske standarde kodiranja i recenzija.

Za timove koji već koriste AI asistente u radu, GPT-5 može doneti vidljiva poboljšanja, posebno u održavanju konteksta i preciznijem radu sa alatima. Za one koji su i dalje skeptični, ovo je unapređena verzija alata koji ih verovatno neće ubediti da promene mišljenje.

GPT-5 za programere: Koliko su realna obećanja o najnaprednijem AI koderu do sada

Šta zapravo znače brojke sa testova

Nove mogućnosti za programere

Problemi koji i dalje postoje

Iz ove kategorije

Zašto su zaposleni u IT-ju jedini koji bi preporučili svoje kompanije

Agile puni 25 godina: AI bi mogao da učini ovu metodologiju važnijom nego ikada

Istraživanje otkriva: Zaposleni koji veruju korporativnom žargonu donose loši...

Kako je bezbednosna zaštita nenamerno naučila AI model da izmišlja izvršene z...

Microsoft prepisao TypeScript na Go: Nova verzija 7.0 RC ubrzava tsc do deset...

Šta to radi zaposlene? Popuni anketu a mi doniramo NURDOR-u

Arhitektura neuspeha: Zašto najpouzdaniji sistemi današnjice uvek očekuju grešku

Slični poslovi

Povezane kompanije po tagovima