Nincs több kínos csend a randin: egy új szemüveg a mesterséges intelligenciával figyeli a beszélgetést, és javasol válaszokat
A Standord hallgatóinak most bemutatott, kiterjesztett valóságra (AR) építő szemüvege meghallgatja a párbeszédet, majd a lencsére vetít egy, csak a viselője által látható javaslatot arra, mit is lenne jó most mondani – ismertette az egyik hallgató, Bryan Hau-Ping Chiang a prototípus működését egy Twitter-bejegyzésben.
Egy videóban be is mutatták a szemüveg képességeit. Az egyik résztvevő ebben kérdéseket tesz fel a másiknak – utóbbi viseli az AR-szemüveget. Az eszköz, csakúgy, mint a ChatGPT, értelmezi a kérdést, majd kis gondolkodást követően megjeleníti a választ – a szemüveg képernyőjén. Ezt aztán annak viselője felolvassa a beszélgetőpartnerének.
Mint az Interesting Engineering írja, az eszköz a ChatGPT-t is fejlesztő OpenAI Whisper nevű beszédfelismerő nyelvi modelljén, valamint a Brilliant Labs által gyártott Monocle AR-szemüvegen alapul. Ezek mellett mikrofonnal, nagyfelbontású kijelzővel és kamerával is szerelve van, tehát gyakorlatilag minden szükséges tudással rendelkezik a szemüveg. Az eszköz mögött a GPT-4 áll, ami a ChatGPT-t és az új Binget is működteti – de nem pont az, ugyanis a stanfordosok rizzGPT néven hozták létre a saját modelljüket.
A szemüveg nem önálló, Bluetooth-on keresztül kommunikál a csatlakoztatott eszközzel, amin egy webes applikáció van megnyitva. Ez akár a felhasználó okostelefonja is lehet. Amikor a szemüveget viselő személy párbeszédbe elegyedik, a hang valós időben válik szöveggé, amit a Whisper eljuttat a chatbotnak, ami aztán visszajuttatja a választ a viselőhöz – aki a szemüvegéről olvashatja le azt.
Azonban még hiába is szeretnénk tárgyalásokra vagy randira menni az MI/AR-szemüveggel: a prototípus még közel sem tökéletes, több ponton is fejleszteni kell rajta. Az üzemideje mellett a tömegét is csökkenteni kell, jelenleg kissé testes is, és még a válaszidején is van mit csiszolni.
Nemrég a Cornell Egyetem kutatói alkottak meg egy olyan okosszemüveget, ami a szájmozgásról képes parancsokat fogadni a viselőjétől, így lehet vele például egy okostelefont irányítani.