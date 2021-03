Znana przede wszystkim z kart graficznych nVidia ma swój własny algorytm przeznaczony do rozmów wideo. Nazywa się Maxine i ma kilka ciekawych funkcji, jak na przykład udawanie, że ktoś uważa na tak zwanym „callu”. Firma poszła o krok dalej i pokazała AI, które tworzy sobowtóra rozmówcy. Serio.

Zamysłem całego projektu jest jak największe zmniejszenie przesyłu danych podczas wideokonferencji, co sprawia, że finalny obraz jest doskonalszy. I algorytm nVidii wywiązuje się z tego zadania podczas korzystania z Zooma czy Skype’a, ciekawy i niecodzienny jest jednak sposób w jaki to osiągnięto.

Algorytm wykonuje pierwsze zdjęcie twarzy rozmówcy. Następnie zamiast transmitować na żywo postać osoby dzwoniącej, wykorzystuje ten obraz i tworzy symulowaną wersję rozmówcy i to właśnie ona, czyli sobowtór, jest widziana po drugiej stronie łącza.

W pewnym sensie można więc powiedzieć, że to deepfake i nie ukrywam, że projekt jest nieco przerażający. Szczególnie, że algorytm potrzebuje tylko wspomnianego wyżej zdjęcia oraz informacji o tym jak porusza się głowa rozmówcy i jak zmienia się ekspresja twarzy. Co więcej, AI jest nawet w stanie poprawić kadrowanie. Firma nie zdradziła czy wdroży ten pomysł do Maxine, ale skoro faktycznie taki system sprawia, że po drugiej stronie rozmowy nie uświadcza się opóźnień czy spadku jakości połączenia, to pewnego dnia może i konsumenci będą mogli z tego sposobu skorzystać. Sami przyznacie, że to dość niecodzienny pomysł, a efekt pracy AI jest praktycznie nie do odróżnienia od faktycznej twarzy rozmówcy.