13.08.2025. ·
2 min

GPT-5 za programere: Koliko su realna obećanja o najnaprednijem AI koderu do sada

HelloWorld
0
GPT-5 za programere: Koliko su realna obećanja o najnaprednijem AI koderu do sada

OpenAI je predstavio GPT-5, model koji bi trebalo da donese velika unapređenja u kodiranju i automatizaciji. Sa 74,9 odsto uspešnosti na testovima realnih softverskih izazova i značajnim poboljšanjima u radu sa alatima, postavlja se pitanje da li je reč o pravoj revoluciji za programere ili samo o još jednoj verziji dobro upakovanog marketinga.

Šta zapravo znače brojke sa testova

Na testu SWE-bench Verified, koji proverava koliko AI uspešno rešava stvarne bagove sa GitHub-a, GPT-5 je ostvario rezultat od 74,9 odsto. GPT-4 je na istom testu imao 52 odsto, a model o3 69,1 odsto. To je primetan skok, ali treba imati na umu da ovaj test meri samo da li predloženi patch radi, a ne i da li je dugoročno održiv ili usklađen sa standardima tima.

Pored boljih rezultata, GPT-5 troši 22 odsto manje tokena i pravi 45 odsto manje poziva alatima nego o3, uz bolji krajnji ishod. U praksi, to znači niže troškove API-ja i brže odgovore za timove koji već koriste ovakve modele.

U zadacima koji zahtevaju izmene postojećeg koda, model je dostigao 88 odsto tačnosti, dok je o3 imao 81 odsto. To je značajno za svakodnevni rad programera, gde se često radi upravo na prilagođavanju i refaktorisanje postojećih rešenja.

Nove mogućnosti za programere

  • Custom Tools omogućava da se funkcije definišu i u običnom tekstu, bez obavezne upotrebe JSON formata, a input se može oblikovati pomoću regularnih izraza ili formalnih gramatika.
  • Reasoning Effort Control uvodi kontrolu nivoa promišljanja modela, od minimalnog do visokog, što omogućava izbor između brzine i kvaliteta.
  • Verbosity Control daje mogućnost da se biraju kraći ili detaljniji odgovori, od samog koda do objašnjenja i konteksta.
  • Frontend generacija je oblast u kojoj OpenAI tvrdi da GPT-5 dobija prednost u 70 odsto slučajeva tokom poređenja. Ipak, produkcijski rad zahteva mnogo više od generisanja primera; potrebna je responzivnost, pristupačnost i održivost koda.
  • Napredna automatizacija i rad sa alatima donosi najbolji rezultat na T2-bench testu sa 96,7 odsto uspešnosti, što bi trebalo da ga učini pouzdanijim u kompleksnim zadacima poput deployment skripti i višeslojnih procesa otklanjanja grešaka.

Problemi koji i dalje postoje

Iako su performanse poboljšane, AI asistenti i dalje teško održavaju kontekst u složenim radnim tokovima, imaju poteškoće sa ogromnim enterprise projektima i složenim zavisnostima, ne razumeju u potpunosti poslovnu logiku aplikacija, slabo se snalaze u integracionom testiranju i ne prate timske standarde kodiranja i recenzija.

Za timove koji već koriste AI asistente u radu, GPT-5 može doneti vidljiva poboljšanja, posebno u održavanju konteksta i preciznijem radu sa alatima. Za one koji su i dalje skeptični, ovo je unapređena verzija alata koji ih verovatno neće ubediti da promene mišljenje.

 

Oceni tekst

0

0 komentara

Iz ove kategorije

Svi članci sa Bloga

Slični poslovi

Povezane kompanije po tagovima