A ChatGPT azon képessége, hogy beszélgetős és közvetlen módon válaszol a kérdésekre, egyeseket arra késztetett, hogy kijelentsék, hogy a mesterséges intelligencia chat megöli a hagyományos keresőmotort. A Google komolyan reagál erre, és – abból, amit már bemutatott – több mint képes versenyezni. A kérdés a felhasználói élmény.
Kérdések és válaszok
Alapvetően a Google küldetése „a világ információinak rendszerezése, valamint mindenki számára hozzáférhetővé és hasznossá tétele” két részre osztható.
A felhasználók kérdéseket tesznek fel, a Google pedig választ ad. A lekérdezéseket – először kulcsszavakat, majd természetesen megfogalmazott kérdéseket – eredetileg egy mezőbe írták be, majd később kimondták őket. A válaszok olyan webhelyekre mutató hivatkozásokként indultak, amelyek releváns információkat tartalmazhatnak, de ezek is fejlődtek.
A Google elkezdett azonnali válaszokat adni az egyszerűbb kérdésekre, amelyek többé-kevésbé tények, felhasználva adatbázisokból, listákból és sokszor a Wikipédiából származó információkat. A közvetlen válaszadásra való áttérés egybeesik azzal, hogy az okostelefonok és azok viszonylag kisebb képernyője az elsődleges eszközzé vált. Aztán jöttek a hordható eszközök és más audio-első eszközök, például az intelligens hangszórók és a kijelzők.
Más kérdéseket nem lehet könnyen megválaszolni, de a Google továbbra is megpróbál és használ valamit, amit Kiemelt kivonatnak hívnak, vagy olyan webhelyről származó közvetlen idézeteket, amelyekről úgy gondolja, hogy megválaszolják a kérdést. Az elmúlt években a Google-t minden oldalról kritizálták ezekért a részletekért. Néha úgy dönt, hogy egyértelműen téves forrást idéz , miközben a tartalom tulajdonosai a Google-t hibáztatják, amiért összeesküvően ellopta a kattintásokat, hogy a felhasználókat a Keresésben tartsa.
Ugyanilyen típusú összetett kérdésekben a ChatGPT azzal jeleskedik, hogy sok mindenre képes választ generálni ahelyett, hogy máshová küldené. A korai felhasználók hozzáfogtak ehhez, és úgy gondolják, hogy a keresés jövője az lesz, hogy mindig közvetlen válaszokat kapjunk egy oda-vissza váltáson keresztül, és lehetőség legyen rákérdezni. Valójában a ChatGPT arra is képes, hogy kérdéseket tegyen fel, hogy szükség szerint tisztázza a kérdést. Eközben kódot is hibakereshet, esszéket írhat (bekezdések megadásának lehetőségével), összefoglalhat, magyarázhat és még sok mást.
Amivel a Google rendelkezik
LaMDA
A Google egy ideje ugyanazon a nyelvi modelltechnológián dolgozik, amely a ChatGPT alapját képezi, bár kevésbé feltűnő módon. Ennek ellenére a természetes nyelv megértése (NLU) és a nagy nyelvi modellek központi számlázása terén az I/O-n végzett munkáját már két fejlesztői konferencián végezte egymás után.
A LaMDA (Language Model for Dialog Applications) a Google „eddigi legfejlettebb társalgási AI-ja”. A 2021-es I/O-n mutatták be „bármilyen témáról beszélgetni”, azzal a kitétellel, hogy még K+F fázisban van. A Google példái a Plútó bolygóval és egy papírrepülővel való beszélgetésre azt a célt szolgálták, hogy bemutassák, hogy a LaMDA hogyan „ felkapott néhány olyan árnyalatot, amelyek megkülönböztetik a nyílt végű beszélgetést”, beleértve az értelmes és konkrét válaszokat, amelyek további oda-vissza beszélgetésekre ösztönöznek.
A Google által elvárt további tulajdonságok az „érdekesség” (akár éleslátóak, váratlanok, akár szellemesek) és a „tényszerűség”, vagy a tényekhez való ragaszkodás.
Egy évvel később bejelentették a LaMDA három konkrét példáját engedte meg a nyilvánosságnak a LaMDA 2-t, és a Google az AI Test Kitchen alkalmazással .
MUM
A LaMDA mellett a Google kiemelte azokat a multimodális modelleket, amelyek „lehetővé teszik az embereknek, hogy természetesen kérdéseket tegyenek fel különböző típusú információkkal kapcsolatban” a MUM (Multitask Unified Model) segítségével. Figyelemre méltó a Google által kínált példalekérdezés, amelyre ma már nem tud válaszolni egy keresőmotor, de ez az új technológia képes megbirkózni vele:
Tehát most képzelje el, hogy lefényképezi a túrabakancsát, és megkérdezi: „Használhatom ezt a Fuji-hegy túrázásához?” A MUM képes lesz megérteni a kép tartalmát és a lekérdezés mögött meghúzódó szándékot, tudatja Önnel, hogy a túrabakancsok jól működnek, majd rámutat az ajánlott felszerelések listájára és egy Mt. Fuji blogra.
Ez még csak egy feltáró jellegű lekérdezés volt, de konkrétabban a Google bejelentette, hogyan adja hozzá a MUM-ot a Lenshez , hogy lefényképezhesse a kerékpárja törött alkatrészét (amiről nincs tudomása), és útmutatást kaphat a javításhoz.
PaLM
Ha a MUM lehetővé teszi, hogy kérdéseket tegyenek fel különféle médiumokkal, és a LaMDA folytathatja a beszélgetést, akkor a PaLM (Pathways Language Model) az, amely válaszolni tud a kérdésekre. Áprilisban jelentették be, és az I/O-n színpadi említést kapott. A PaLM a következőkre képes:
Kérdések megválaszolása, szemantikai elemzés, közmondások, számtan, kódkiegészítés, általános ismeretek, szövegértés, összegzés, logikai következtetési láncok, józan ész, mintafelismerés, fordítás, párbeszéd, viccmagyarázatok, fizika QA és nyelvértés.
A Pathways nevű, következő generációs mesterséges intelligencia architektúra hajtja, amely a jelenlegi, erősen egyénre szabott megközelítéshez képest „egyetlen modellt képes megtanítani több ezer vagy millió dolog elvégzésére”.
A termékek letöltése
Amikor a Google 2021-ben bejelentette a LaMDA-t, Sundar Pichai kijelentette, hogy „természetes beszélgetési képességei képesek radikálisan hozzáférhetőbbé és könnyebben használhatóbbá tenni az információkat és a számítástechnikát”.
A Google Asszisztens, a Search és a Workspace kifejezetten névellenőrzést kapott, mint olyan termékeket, amelyekben „jobb társalgási funkciókat kíván beépíteni”. A Google is kínálhat „képességeket a fejlesztők és a vállalati ügyfelek számára”.
Ebben a ChatGPT utáni világban többen is megjegyezték, hogy a közvetlen válaszok károsíthatják a Google hirdetésalapú üzleti modelljét, és azt gondolják, hogy az embereknek már nem kell kattintaniuk a linkekre, ha már megkapták a választ. A Google által megadott példákban semmi sem utal arra, hogy le akarná állítani a tartalomhoz való hivatkozást.
Vannak nagy biztonsági és pontossági aggályok, amelyeket a Google mindig is hangsúlyozott a bemutatók során. tény, hogy ezek a modellek „ kitalálhatnak dolgokat ”. Mindennél nagyobb szűk keresztmetszetnek tűnik az a
Eközben nem világos, hogy az emberek azt akarják, hogy a keresőmotorral folytatott minden interakció beszélgetés legyen. Ennek ellenére a Google belsőleg elismerte, hogy a társalgási megközelítés „valóban olyan szükségletet talál az emberekben, amelyre úgy tűnik, hogy van”.
A Google állítólag „ piros kódban ” van a ChatGPT-vel szemben, és különböző csapatokat rendelt át, hogy a versengő AI-termékeken és demókon dolgozzanak. A technológia újabb bemutatója a 2023-as I/O-n több mint valószínű, de hogy ez azt jelenti-e, hogy a LaMDA, a MUM és a PaLM kiemelkedően beépül a Google legnagyobb termékeibe, az már a levegőben van.
Pichai még májusban megismételte, hogy „a beszélgetés és a természetes nyelvi feldolgozás hatékony módja annak, hogy a számítógépeket mindenki számára hozzáférhetőbbé tegyük”. Mindabból, amit a vállalat előzetesen megtekintett, a végső cél az, hogy a Google Kereső emberként tudjon válaszolni a kérdésekre.
Nem meglepő módon a Google rendelkezik a megfelelő technológiával, de a vállalat örök kihívása a K+F tényleges termékekké való áthelyezése, és a keresőmotor számára nem tűnik bölcsnek, hogy a világnak következetesen helyesnek kell lennie.