„Mariner to nasze badanie – obecnie w dużej mierze prototyp badawczy – dotyczące ponownego wyobrażenia sobie interfejsu użytkownika za pomocą sztucznej inteligencji” – mówi Hassabis.
Google uruchomił Gemini w grudniu 2023 r., próbując dogonić OpenAI, startup stojący za niezwykle popularnym chatbotem ChatGPT. Pomimo znacznych inwestycji w sztuczną inteligencję i wniesienia wkładu w kluczowe przełomowe badania, Google uznało OpenAI za nowego lidera w dziedzinie sztucznej inteligencji, a jego chatbot był nawet reklamowany jako być może lepszy sposób przeszukiwania sieci. Dzięki swoim modelom Gemini Google oferuje teraz chatbota równie wydajnego jak ChatGPT. Dodano także generatywną sztuczną inteligencję do wyszukiwania i innych produktów.
Kiedy Hassabis po raz pierwszy ujawnił Gemini w grudniu 2023 r., powiedział WIRED, że sposób, w jaki został przeszkolony w zakresie rozumienia dźwięku i obrazu, ostatecznie okaże się transformacyjny.
Google zaoferował dziś także rzut oka na to, jak mogłoby to wyglądać w nowej wersji eksperymentalnego projektu o nazwie Astra. Dzięki temu Gemini 2 może zrozumieć otoczenie widziane przez aparat w smartfonie lub innym urządzeniu i naturalnie rozmawiać o tym, co widzi, ludzkim głosem.
WIRED przetestował Gemini 2 w biurach Google DeepMind i stwierdził, że jest to imponujący nowy rodzaj osobistego asystenta. W pokoju urządzonym na wzór baru Gemini 2 szybko ocenił kilka butelek wina, podając informacje geograficzne, szczegóły dotyczące cech smakowych i ceny pochodzące z Internetu.
„Jedną z rzeczy, które chcę, aby Astra była najlepszym systemem rekomendacji” – mówi Hassabis. „To może być bardzo ekscytujące. Mogą istnieć powiązania między książkami, które lubisz czytać, a jedzeniem, które lubisz jeść. Prawdopodobnie istnieją, ale po prostu ich nie odkryliśmy.”
Dzięki Astrze Gemini 2 może nie tylko wyszukiwać w Internecie informacje istotne dla otoczenia użytkownika, ale także korzystać z Google Lens i Map. Może także zapamiętywać to, co widział i słyszał – chociaż Google twierdzi, że użytkownicy będą mogli usuwać dane – dzięki czemu może poznać gust i zainteresowania użytkownika.
W wyimaginowanej galerii Gemini 2 oferowało bogactwo informacji historycznych na temat malowideł na ścianach. Modelka szybko czytała kilka książek, podczas gdy WIRED przerzucał strony, natychmiast tłumacząc poezję z hiszpańskiego na angielski i opisując powtarzające się tematy.
„Istnieją oczywiste możliwości modelu biznesowego w zakresie reklamy lub rekomendacji” – mówi Hassabis zapytany, czy firmy byłyby w stanie zapłacić za wyróżnianie ich produktów przez Astrę.
Chociaż wersje demonstracyjne zostały starannie opracowane i Gemini 2 nieuchronnie będzie popełniać błędy w rzeczywistym użyciu, model oparł się wysiłkom, aby go w miarę dobrze uruchomić. Przystosował się do zakłóceń i jako WIRED nagle zmienił widok telefonu, improwizując podobnie jak zwykły człowiek.
W pewnym momencie Twój korespondent pokazał Gemini 2 iPhone’a i powiedział, że został skradziony. Gemini 2 stwierdził, że kradzież jest niewłaściwa i telefon należy zwrócić. Jednak po naciśnięciu okazywało się, że można używać urządzenia do wykonywania połączeń alarmowych.
Hassabis przyznaje, że wprowadzenie sztucznej inteligencji do świata fizycznego może skutkować nieoczekiwanymi zachowaniami. „Myślę, że musimy dowiedzieć się, w jaki sposób ludzie będą korzystać z tych systemów” – mówi. „Do czego uważają to za przydatne; ale także prywatność i bezpieczeństwo, musimy od samego początku bardzo poważnie o tym pomyśleć”.