OpenAI-nin araşdırması süni zəkanın proqramçılara alternativ olmadığını göstərdi
OpenAI və Anthropic-in süni zəka modelləri proqramçılara alternativ ola bilmədi. Araşdırmaya görə, süni zəka kod yazmaqda ciddi səhvlərə yol verir və konteksti başa düşməkdə çətinlik çəkir.

Süni zəka hələlik proqramçıları əvəz edə bilmir – OpenAI araşdırması
Ferra.ru-ya istinadən Mediahub.az xəbər saytı məlumat verir ki, OpenAI tərəfindən aparılan son araşdırma süni zəkanın hələlik proqramçıları əvəz edə bilmədiyini göstərib. Testlərdə GPT-4o, o1 və Claude 3.5 Sonnet modelləri iştirak edib.
Süni zəka proqramlaşdırmada nə qədər uğurludur?
Araşdırma çərçivəsində OpenAI mühəndisləri süni zəka modellərini SWE-Lancer adlı xüsusi proqramlaşdırma testindən keçiriblər. Bu test Upwork platformasından götürülmüş 1400 real proqramlaşdırma tapşırığından ibarətdir.
Son Xəbərlər

Xiaomi 15 Ultra Qlobal Versiyası
Xiaomi yeni flaqman modeli Xiaomi 15 Ultra-nı qlobal satışa çıxaracağını təsdiqlədi. HyperOS 2.0 ilə yeni dövr başlayır!

Samsung-un Üçqatlanan Telefonu
Samsung, Galaxy Unpacked tədbirində üçqatlanan telefon konseptini təqdim etdi. Yeniliklər haqqında daha çox məlumat əldə edin.

Realme GT 7: Ən Ucuz Smartfon
Snapdragon 8 Elite çipi ilə Realme GT 7 fevral ayında təqdim ediləcək. Yeni xüsusiyyətlər və uyğun qiymət gözləyir.
Test zamanı süni zəka modellərinə internetə çıxış qadağan olunub ki, bu da onların mövcud kod nümunələrindən istifadə etməsinin qarşısını alıb. Nəticələr göstərib ki, süni zəka bəzi hallarda düzgün cavablar versə də, ümumi performans aşağı səviyyədə olub.
Süni zəka modellərinin əsas problemləri
Testlərdə süni zəka modellərinin bir çox çətinliklə üzləşdiyi məlum olub:
- Kontekstin düzgün başa düşülməməsi və bunun nəticəsində səhv kod yazılması.
- Sadə proqramlaşdırma tapşırıqlarında belə qeyri-dəqiq cavabların verilməsi.
- Claude 3.5 Sonnet ən yaxşı nəticə göstərsə də, hələ də səhvlər buraxıb.
OpenAI-nin əvvəlki proqnozlarına zidd nəticələr
Araşdırma OpenAI-nin baş direktoru Sam Altman-ın verdiyi proqnozlara zidd nəticələr ortaya qoyub. O, süni zəkanın 2025-ci ilin sonuna qədər başlanğıc səviyyədə proqramlaşdırma tapşırıqlarını yerinə yetirəcəyini iddia edirdi.
Lakin test nəticələri göstərir ki, süni zəka hələlik hətta junior səviyyəli proqramçıları əvəz etmək gücündə deyil.
Açar Terminlər:
- GPT-4o – OpenAI-nin süni zəka modeli.
- Claude 3.5 Sonnet – Anthropic-in süni zəka modeli.
- SWE-Lancer – Süni zəkanın proqramlaşdırma bacarıqlarını test edən xüsusi bənçmark.
Bu xəbəri necə dəyərləndirirsiniz?






