Zdjęcia Google uruchomią nową funkcję Zapytaj o zdjęcie obsługiwaną przez Gemini
Tego lata Zdjęcia Google wprowadzą nową funkcję o nazwie Zapytaj Zdjęcia, opartą na modelu sztucznej inteligencji Gemini. Google udostępniło więcej informacji na temat tej funkcji, wyjaśniając, jak będzie działać.
Jak działa Ask Photos
Według zespołu badawczego Google, Ask Photos jest “przykładem tego, jak modele Gemini mogą działać jako agenci, wykorzystując funkcje i możliwości pamięci”. Przykłady zapytań, które zostały zademonstrowane obejmują:
- “Pokaż mi najlepsze zdjęcie z każdego parku narodowego, który odwiedziłem”.
- “Jakie były motywy przewodnie urodzin Lery?”
Zapytanie dialogowe użytkownika jest przekazywane do modelu agenta, który wykorzystuje Gemini do określenia najlepszego narzędzia wyszukiwania zaawansowanego (RAG) dla danego zadania. Model najpierw analizuje intencje użytkownika, a następnie formułuje wyszukiwanie zdjęć przy użyciu zaktualizowanego systemu wektorowego, który rozszerza możliwości wyszukiwania metadanych już wbudowane w Zdjęcia Google. System lepiej rozumie pojęcia języka naturalnego, takie jak “osoba uśmiechająca się podczas jazdy na rowerze”, niż tradycyjne wyszukiwanie słów kluczowych. Następnie model przegląda zdjęcia i filmy uzyskane w wyniku wyszukiwania. Dzięki “długiemu oknu kontekstowemu i możliwościom multimodalnym” Gemini może znaleźć najbardziej istotne informacje. Oprócz treści wizualnych wykorzystywane są daty, lokalizacja i inne metadane. Następnie model tworzy odpowiedź na podstawie znalezionych zdjęć i filmów.
Dodatkowe funkcje
Możesz dostosować Ask Photos, a aplikacja zapamięta te zmiany dla przyszłych zapytań. Dzięki temu funkcja może być używana jako asystent, a nie tylko narzędzie wyszukiwania. Użytkownicy mogą “przeglądać i zarządzać zapamiętanymi szczegółami w dowolnym momencie”. Eksperymentalna funkcja, prawdopodobnie związana z plotkami o Project Ellman, zostanie uruchomiona w nadchodzących miesiącach, a już teraz pojawiają się wskazówki dotyczące nowych funkcji.
Wnioski
Ask Photos, obsługiwane przez Gemini, obiecuje poprawić jakość wyszukiwania w Zdjęciach Google, umożliwiając użytkownikom uzyskiwanie dokładnych i trafnych odpowiedzi na ich zapytania przy użyciu zaawansowanej technologii sztucznej inteligencji.