Google

Google zapowiada przełom. Gemini 2.0 już dostępny

Patryk Koncewicz
Google zapowiada przełom. Gemini 2.0 już dostępny
Reklama

Gemini 2.0 ma według Google namieszać na rynku AI – to „niskie opoźnienia i wysoka wydajność”.

Końcówka roku to znaczny krok naprzód w rozwoju sztucznej inteligencji. Najpierw OpenAI wypuściło długo wyczekiwaną Sorę dla ograniczonej liczby użytkowników, a teraz Google prezentuje nową wersję swojego autorskiego modelu i zapowiada kolejną „rewolucję” w korzystaniu z narzędzi AI. Co potrafi Gemini 2.0?

Reklama

Gemini 2.0 w akcji –multimodalność na wyższym poziomie

Gemini 2.0 to najbardziej zaawansowany model AI od Google, cechujący się głównie nowymi osiągnięciami w zakresie multimodalności. Mowa tutaj o natywnym generowaniu obrazów i dźwięku, a także możliwość wywoływania wyszukiwarki Google, wykonywania kodu oraz uruchamiania zewnętrznych funkcji, określonych przez użytkownika.

Źródło: Depositphotos

Wprowadzona dziś eksperymentalna wersja Gemini 2.0 Flash – dostępna dla developerów w ramach interfejsu Gemini API w Google AI Studio oraz Vertex AI – ma wyróżniać się niskimi opóźnieniami i lepszą wydajnością. Można przetestować ją z poziomu przeglądarkowej wersji, wybierając ją z rozwijanego menu w lewym górnym rogu ekranu – niebawem ta opcja będzie dostępna także w aplikacji mobilnej.

Przyszłość AI od Google prezentuje się jeszcze ciekawiej. Gigant pochwalił się również możliwością opracowywania nowych agentów sztucznej inteligencji, takich jak Project Astra, czyli próba stworzenia narzędzia uniwersalnego – może korzystać z wyszukiwarki Google, Obiektywu oraz Map. Przy użyciu Gemini 2.0 Google rozwija też Project Mariner, czyli wczesny prototyp, badający relacje między człowiekiem a przeglądarką. Jest w stanie zrozumieć i przeanalizować informacje znajdujące się na ekranie przeglądarki, w tym piksele i elementy internetowe, takie jak tekst, kod, obrazy i formularze – dzięki temu może pomóc w szybszym wykonywaniu codziennych zadań. Ciekawie brzmi także projekt Jules, czyli eksperymentalny agent kodujący, zdolny do bezpośredniej integracji z GitHub, co ma docelowo ułatwić developerom rozwiązywanie problemów i opracowywanie planów.

„Dziś z radością wkraczamy w kolejną erę modeli opracowanych z myślą o nowej epoce agentowej: przedstawiamy Gemini 2.0, nasz najbardziej zaawansowany model. Dzięki nowym osiągnięciom w zakresie multimodalności, takim jak natywne generowanie obrazu i dźwięku czy korzystanie z narzędzi natywnych, będziemy mogli tworzyć nowe agenty sztucznej inteligencji, pomagające w realizacji naszej wizji stworzenia uniwersalnego asystenta” – Sundar Pichai, prezes Google i Alphabet

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu

Reklama