Ką reikia žinoti apie „Openai“ operatorių

Estimated read time 5 min read

Per pastarąsias kelias savaites Openai padėjo pagrindus. Nors dauguma vartotojų tik pradėjo iš tikrųjų tyrinėti „ChatGpt“ užduotis – naują funkciją, leidžiančią vartotojo tvarkaraštį ir suaktyvinti užduotis – įmonė ruošėsi kažkam kur kas reikšmingesniam.

Vakar vyksiantis operatoriaus išleidimas yra dar vienas aiškus signalas, kur eina dirbtinis intelektas: nuo modelių, kurie tiesiog apdoroja informaciją, iki agentų, kurie galėtų aktyviai dirbti kartu su mumis.

Kiekvieną dieną mes praleidžiame daugybę valandų naršydami svetaines, užpildydami formas, užsisakydami paslaugas ir tvarkydami skaitmenines užduotis. AI dažniausiai stebėjo nuo nuošalės, apsiribojant patarimais ar apdorojimo tekstu. Operatorius kartu su kai kuriais kitais naujausiais agentų pranešimais, tokiais kaip „Anthropic“ kompiuterio naudojimas ir „Google“ projekto „Mariner“, visiškai pakeiskite šią dinamiką.

Techniniai pasiekimai čia yra reikšmingi. „Openai“ sukūrė AI, galintį pamatyti ir sąveikauti su žiniatinklio sąsajomis, kaip tai daro žmogus. Jis fiksuoja ekrano kopijas, supranta vaizdinius išdėstymus ir priima sprendimus, kur spustelėti, ką rašyti ir kaip naršyti.

Štai ką reikia žinoti apie operatoriaus agentą: Nors daugybė AI įrankių iš esmės yra įstrigę už API ir specializuotų integracijų, operatorius dirba su žiniatinkliu tiksliai taip, kaip jūs. Jis mato ekraną, supranta kontekstą ir tiesiogiai imasi veiksmų.

Atidžiau pažvelkite į tikrąjį operatoriaus pasirodymą

Kai AI kompanijos išleidžia etalonus, svarbu atidžiai pažvelgti į tai, ką iš tikrųjų reiškia skaičiai. Operatoriaus pasirodymas pasakoja kitokią istoriją skirtingose ​​bandymo aplinkose.

Įspūdingiausia metrika yra 87% operatoriaus sėkmės procentas „WebVoyager“ etalone. Tai svarbu, nes „WebVoyager“ išbando realaus pasaulio svetaines-tikrasis platformas, kurias naudojame kasdien, pavyzdžiui, „Amazon“ ir „Google Maps“. Tai nėra kontroliuojamas laboratorijos testas. Tai spektaklis gamtoje.

Bet kai žiūrime į kitus etalonus, matome labiau niuansuotą vaizdą:

  • „Webako“ etalonas: 58,1% sėkmės procentas. Testavimas modeliuotoms svetainėms, skirtoms tokioms užduotims kaip apsipirkimas ir turinio valdymas. Mažesnis pasirodymas čia iš tikrųjų atskleidžia ką nors svarbaus apie tai, kaip AI agentai tvarko struktūrizuotą ir nestruktūrizuotą aplinką.
  • „Osworld“ etalonas: 38,1% sėkmės procentas. Tai išbando sudėtingas, daugialypis užduotis, tokias kaip PDF sujungimas iš el. Laiškų. Reikšmingas našumo sumažėjimas parodo mums dabartines AI agentų ribas, kai užduotims reikia kelių konteksto jungiklių.

Mane domina šie skaičiai, kaip jie atspindi žmogaus mokymosi modelius. Paprastai geriau sekasi pažįstamoje, realaus pasaulio aplinkoje nei dirbtiniuose bandymo scenarijuose. Faktas, kad operatorius išsiskiria faktinėmis svetainėmis, kovodamas su imituotais, rodo, kad jo mokymas teikia pirmenybę praktiniam naudingumui, o ne teoriniam veikimui.

Šie etalonai nustatė naujus naršyklės automatizavimo įrašus, tačiau skirtingi skirtingų testų sėkmės procentai mums pasako ką nors esminio „Openai“ strategijoje.

Pagalvokite apie savo naršymą internete. Daugelis užduočių yra paprastos: užpildymo formos, pirkimai, užsakymo susitikimai. Čia šviečia 87% operatoriaus sėkmės procentas. Sudėtingesnės užduotys – kai mažėja našumas – paprastai yra tokios, kur vis tiek yra vertinga žmonių priežiūra.

Šie duomenys rodo, kad „Openai“ apgalvotai pasirinko: pirmiausia tobulinamas bendras užduotis, tada palaipsniui plečiamas į sudėtingesnes operacijas. Tai yra praktinis požiūris, kuris teikia pirmenybę tiesioginiam naudingumui, o ne teorinėms galimybėms.

AI agento etalonai („Openai“)

„Openai“ požiūris su operatoriumi atskleidžia kruopščiai organizuotą strategiją.

Pirmiausia apsvarstykite laiką. Neseniai paskelbtos tokios funkcijos kaip „ChatGPT“ užduotys buvo ne tik apie funkcijų pridėjimą – tai buvo vartotojų paruošimas autonominiams agentams.

Bet štai kas yra tikrai įdomu: „Openai“ planuoja atskleisti CUA modelį per API. Tai reiškia, kad kūrėjai galės sukurti savo kompiuteriu naudojančius agentus.

Tai yra reikšminga: tai yra reikšminga:

  1. Integracijos potencialas
  • Tiesioginis įtraukimas į esamas darbo eigas
  • Pasirinktiniai agentai konkrečiems verslo poreikiams
  • Pramonei būdingi automatizavimo sprendimai
  1. Ateities plėtros kelias
  • Išplėtimas „Plus“, „Team“ ir „Enterprise“ vartotojams
  • Tiesioginė „ChatGPT“ integracija
  • Geografinė plėtra (nors dėl reguliavimo reikalavimų Europa užtruks ilgiau)

Strateginės partnerystės taip pat pasakoja. „Openai“ bando sukurti visą ekosistemą. Jie bendradarbiauja su tokiomis įmonėmis kaip „DoorDash“, „Instacart“ ir „OpenTable“, tačiau taip pat su viešojo sektoriaus organizacijomis, tokiomis kaip Stocktono miestas.

Tai rodo ateitį, kai AI agentai yra ne tik padėjėjai, bet ir neatsiejama dalis to, kaip mes sąveikaujame su skaitmeninėmis sistemomis.

Ką tai iš tikrųjų reiškia jums

Mes pradedame etapą, kai AI ne tik atsako į klausimus – tai tampa aktyviu mūsų skaitmeninio gyvenimo dalyviu.

Pagalvokite apie savo kasdienes užduotis internetu. Ne sudėtingas, strateginis darbas, kuriam reikalinga jūsų patirtis, bet pasikartojančios užduotys. Aš kalbu apie kelionių parinkčių tyrimus keliose svetainėse, užpildydamas standartizuotas formas, rinkti duomenis iš įvairių žiniatinklio šaltinių ir tvarkyti įprastus užsakymus. Čia operatorius iš pradžių pašalina skaitmeninį užimtumą. Bet tai ne ten, kur ji sustos. Laikui bėgant AI agentai galės atlikti vis sudėtingesnes darbo eigas.

Ankstyvieji našumo duomenys mums taip pat nurodo ką nors esminio: operatorius išsiskiria įprastinėmis žiniatinklio užduotimis, kurių sėkmės procentas yra 87%. Ankstyvieji įvaikintojai, kurie išmoksta tai efektyviai integruoti, turės reikšmingą produktyvumo pranašumą.

Integracijos laiko juosta atskleidžia kruopštų Openai požiūrį. Jie pradeda nuo „Pro“ vartotojų JAV, tada plečiasi iki „Plus“, „Team“ ir „Enterprise“ vartotojų, prieš tai galiausiai tiesiogiai integruodamiesi į „ChatGPT“.

Mes stebime esminį AI įrankių veikimo pokytį. Tikrasis klausimas, kurį turėtumėte užduoti sau, yra ne tai, ar prisitaikyti prie šio pokyčio, o kaip tai padaryti strategiškai. Ši technologija vystysis, tačiau išlieka principas: PG pereina nuo atsakymo į klausimus prie veiksmų. Tie, kurie supranta šį poslinkį anksti, turės didelį pranašumą formuodami, kaip šios priemonės integruoja į savo darbo eigą.


Source link

Jums tai gali patikti

Daugiau iš autoriaus