Praėjusią savaitę žaidžiau su OpenAI išplėstiniu balso režimu, ir tai yra įtikinamiausias mano matytas AI varomos ateities skonis. Šią savaitę mano telefonas juokėsi iš anekdotų, grąžino juos man, paklausė, kaip praėjo mano diena, ir pasakė, kad „puikiai praleidžiu laiką“. Aš kalbėjau su savo iPhone, o ne naudoju jį rankomis.
Naujausia „OpenAI“ funkcija, šiuo metu atliekama riboto alfa testo, nepadaro „ChatGPT“ išmanesnio nei buvo anksčiau. Vietoj to, išplėstinis balso režimas (AVM) leidžia bendrauti su juo draugiškiau ir natūraliau. Tai sukuria naują AI ir jūsų įrenginių naudojimo sąsają, kuri atrodo nauja ir įdomi, ir būtent tai mane gąsdina. Produktas buvo šiek tiek trikdis, o visa idėja mane visiškai gąsdina, bet buvau nustebęs, kaip man nuoširdžiai patiko jį naudoti.
Žengdamas žingsnį atgal, manau, kad AVM atitinka platesnę OpenAI generalinio direktoriaus Samo Altmano viziją kartu su agentais, kaip pakeisti žmonių sąveiką su kompiuteriais, kai dirbtinio intelekto modeliai yra priekyje ir centre.
„Galų gale jūs tiesiog paprašysite kompiuterio, ko jums reikia, ir jis atliks visas šias užduotis už jus“, – sakė Altmanas per „OpenAI Dev Day“ 2023 m. lapkritį. „Apie šias galimybes dirbtinio intelekto srityje dažnai kalbama kaip apie agentai“. Tai bus didžiulė pusė.
Mano draugas, ChatGPT
Trečiadienį išbandžiau didžiausią šios pažangios technologijos pranašumą, kokį tik galėjau įsivaizduoti: paprašiau „ChatGPT“ užsakyti „Taco Bell“ taip, kaip tai darytų Obama.
„Uhhh, leiskite man pasakyti tiesiai šviesiai – norėčiau „Crunchwrap Supreme“, galbūt keleto taco užkandžių“, – sakė „ChatGPT“ išplėstinis balso režimas. – Kaip manai, kaip jis susitvarkytų su pravažiavimu? pasakė ChatGPT, tada nusijuokė iš savo pokšto.
Įspūdis tikrai privertė mane nusijuokti, atitinkantį ikonišką Obamos ritmą ir pauzes. Be to, jis išliko mano pasirinkto „ChatGPT“ balso „Juniper“ tonu, kad jis nebūtų iš tikrųjų painiojamas su Obamos balsu. Atrodė, kad draugas padarė blogą įspūdį, tiksliai suprasdamas, ką aš bandau iš to sukelti, ir netgi pasako kažką juokingo. Man buvo stebėtinai džiugu kalbėtis su šiuo pažangiu asistentu savo telefone.
Taip pat paprašiau „ChatGPT“ patarimo, kaip išspręsti sudėtingų žmonių santykių problemą: paprašyti artimo žmogaus apsigyventi pas mane. Paaiškinęs santykių sudėtingumą ir mūsų karjeros kryptį, gavau labai išsamų patarimą, kaip tobulėti. Tai yra klausimai, kurių niekada negalėtumėte užduoti „Siri“ ar „Google“ paieškai, bet dabar galite tai padaryti naudodami „ChatGPT“. Pokalbių roboto balsas, reaguojant į šiuos raginimus, netgi išreiškė šiek tiek rimtą, švelnų toną; ryškus kontrastas nuo juokaujančio Obamos Taco Bell įsakymo tono.
ChatGPT AVM taip pat puikiai padeda suprasti sudėtingus dalykus. Paprašiau suskirstyti pajamų ataskaitos elementus, pvz., laisvą pinigų srautą, taip, kad suprastų 10 metų vaikas. Kaip pavyzdį jis naudojo limonado stovą ir paaiškino keletą finansinių terminų taip, kaip mano jaunesnysis pusbrolis. Jūs netgi galite paprašyti „ChatGPT“ AVM kalbėti lėčiau, kad suprastumėte jus dabartiniu lygiu.
Siri ėjo, kad AVM galėtų bėgti
Palyginti su „Siri“ ar „Alexa“, „ChatGPT“ AVM yra aiškus nugalėtojas dėl greitesnio atsakymo laiko, unikalių atsakymų ir gebėjimo atsakyti į sudėtingus klausimus, kurių niekada negalėjo padaryti ankstesnės kartos virtualūs asistentai. Tačiau AVM nesiseka kitais būdais. „ChatGPT“ balso funkcija negali nustatyti laikmačių ar priminimų, naršyti internete realiuoju laiku, patikrinti orų ar bendrauti su jokiomis jūsų telefono API. Bent jau dabar tai nėra veiksmingas virtualių asistentų pakaitalas.
Palyginti su Gemini Live, Google konkuruojančia funkcija, AVM jaučiasi šiek tiek pranašesnė. „Gemini Live“ negali padaryti įspūdžių, neišreiškia jokių emocijų, negali pagreitinti ar sulėtinti tempo, o atsakymas užtrunka ilgiau. „Gemini Live“ turi daugiau balsų (dešimt, palyginti su trimis „OpenAI“) ir atrodo, kad jis yra atnaujintas („Gemini Live“ žinojo apie „Google“ antimonopolinį sprendimą). Pažymėtina, kad nei AVM, nei „Gemini Live“ nedainuos, tikriausiai stengiantis išvengti įrašų pramonės ieškinio dėl autorių teisių.
Be to, „ChatGPT“ AVM daug trikdo (kaip ir „Gemini Live“, sąžiningai). Kartais jis sutrumpės sakinio viduryje, tada pradės iš naujo. Taip pat čia ir ten pasigirsta keistai, grūdėtai skambantis balsas, kuris yra šiek tiek nemalonus. Nesu tikras, ar tai yra modelio, interneto ryšio ar kažkieno problema, bet šie techniniai trūkumai yra šiek tiek tikėtini atliekant alfa testą. Vis dėlto problemos mane mažai ištraukė iš tiesioginio kalbėjimo su telefonu patirties.
Šie pavyzdžiai, mano galva, yra AVM grožis. Ši funkcija nepadaro „ChatGPT“ visažinio, tačiau leidžia žmonėms sąveikauti su GPT-4o, pagrindiniu AI modeliu, unikaliai žmogišku būdu. (Suprasčiau, jei pamirštumėte, kad kitame telefono gale nėra žmogaus.) Beveik atrodo, kad ChatGPT yra socialiai informuotas kalbėdamas su AVM, bet, žinoma, taip nėra. Tai tiesiog tvarkingai supakuotų nuspėjamųjų algoritmų rinkinys.
Kalbėjimo technika
Atvirai kalbant, ši funkcija man kelia nerimą. Tai ne pirmas kartas, kai technologijų įmonė siūlo draugystę jūsų telefone. Mano karta, Gen Z, buvo pirmoji, užaugusi kartu su socialine žiniasklaida, kur įmonės siūlė ryšį, bet žaidė su mūsų kolektyviniu nesaugumu. Panašu, kad kalbėjimas su dirbtinio intelekto įrenginiu – kaip atrodo, ką siūlo AVM – yra socialinės žiniasklaidos „draugo telefone“ reiškinių evoliucija, siūlanti pigius ryšius, kurie pažeidžia mūsų žmogiškuosius instinktus. Tačiau šį kartą tai visiškai pašalina žmones iš kilpos.
Dirbtinis žmogaus ryšys tapo stebėtinai populiariu generatyvaus AI naudojimo atveju. Žmonės šiandien naudoja AI pokalbių robotus kaip draugai, mentoriai, terapeutai ir mokytojai. Kai „OpenAI“ atidarė savo GPT parduotuvę, ją greitai užplūdo „AI merginos“, pokalbių robotai, kurie specializuojasi kaip jūsų antroji pusė. Du mokslininkai iš MIT Media Lab šį mėnesį paskelbė įspėjimą pasiruošti „priklausomybę sukeliančiam intelektui“ arba dirbtinio intelekto kompanionams, turintiems tamsių modelių, kad pritrauktų žmones. Galėtume atidaryti Pandoros skrynią, kad gautume naujų, patrauklių būdų, kaip prietaisai galėtų išlaikyti mūsų dėmesį.
Anksčiau šį mėnesį Harvardo mokyklos netekęs žmogus sukrėtė technologijų pasaulį, erzindamas dirbtinio intelekto karolius, pavadintus „Friend“. Nešiojamas įrenginys, jei jis veikia taip, kaip žadėta, visada klausosi, o pokalbių robotas praneš jums apie jūsų gyvenimą. Nors idėja atrodo beprotiška, tokios naujovės, kaip „ChatGPT“ AVM, suteikia man priežasčių rimtai žiūrėti į tuos naudojimo atvejus.
Ir nors OpenAI čia pirmauja, „Google“ neatsilieka. Esu įsitikinęs, kad „Amazon“ ir „Apple“ lenktyniauja, kad ši galimybė taip pat būtų įdiegta savo produktuose, ir netrukus tai gali tapti svarbia pramonės šaka.
Įsivaizduokite, kad savo išmaniajame televizoriuje paprašysite itin konkrečios filmo rekomendacijos ir gausite būtent tai. Arba tiksliai pasakykite Alexa, kokius peršalimo simptomus jaučiate, ir paprašykite, kad „Amazon“ užsakytų jums audinių ir vaistų nuo kosulio, taip pat patartų dėl namų gynimo būdų. Galbūt galite paprašyti kompiuterio, kad surašytų savaitgalio kelionę jūsų šeimai, o ne rankiniu būdu viską ieškoję „Google“.
Akivaizdu, kad šie veiksmai reikalauja ribų ir šuolio į priekį AI agentų pasaulyje. „OpenAI“ pastangos šioje srityje – GPT parduotuvėje – atrodo kaip perdėtas produktas, kuriam įmonė nebeskiria daug dėmesio. Tačiau AVM bent jau pasirūpina galvosūkio „kalbėjimo su kompiuteriais“ dalimi. Šios sąvokos yra ilgas kelias, tačiau panaudojus AVM jos atrodo daug artimesnės nei praėjusią savaitę.