Internet

Gemini wygeneruje dla ciebie muzykę. Poleciłem stworzenie piosenki o Androidzie i iOS

przeczytasz w 2 min.

Do Gemini trafiła kolejna - po generowaniu tekstu, obrazów i wideo - funkcja. Tym razem chatbotowi można polecić tworzenie piosenek.

Wirtualny Asystent Gemini został zintegrowany z modelem Lyria 3, rozwijanym przez zespół Google DeepMind. Dzięki temu generowanie muzyki jest teraz możliwe bezpośrednio w oknie czatu, nawet w darmowym planie. 

Tworzenie muzyki w Google Gemini

Aby stworzyć piosenkę, wystarczy:

  1. otworzyć Gemini w przeglądarce (na razie funkcja nie jest dostępna w aplikacji),
  2. zalogować się na konto pełnoletniego użytkownika;
  3. wybrać opcję "Twórz muzykę" z panelu narzędzi;
  4. wpisać polecenie opisujące tematykę, gatunek utworu, język, płeć wokalistów i inne wymagania. 

Sztuczna inteligencja sama tworzy teksty, ale opcjonalnie można napisać własny i umieścić go w prompcie. 

Po kilkudziesięciu sekundach użytkownik otrzymuje plik wideo ze statyczną grafiką i podkładem muzycznym. Nowa funkcja znajduje się w fazie beta i ma charakter poglądowy, dlatego wszystkie utwory trwają raptem pół minuty. Model nie stara się nawet tworzyć kompletnych piosenek, bo zdarza się, że refren jest ucinany w połowie. 

Google deklaruje, że utwory można tworzyć w językach angielskim, niemieckim, hiszpańskim, francuskim, hindim, japońskim, koreańskim i portugalskim, ale mi z powodzeniem udało się wygenerować piosenki po polsku. Oto przykładowy utwór o Androidzie i iOS. 

Zamiast polecenia tekstowego można załączyć zdjęcie lub film, ale z moich obserwacji wynika, że sztuczna inteligencja nie stara się tworzyć piosenek szczegółowo opisujących zawartość kadru, a jedynie wygenerować utwór z grubsza dopasowany klimatycznie. Jeśli np. na zdjęciu znajdują się uśmiechnięci ludzie, to Gemini stworzy optymistyczną piosenkę o przyjaźni. 

Google podkreśla, że każdy utwór ma nałożony "niewykrywalny dla ucha, wbudowany znak wodny SynthID". Dzięki temu zewnętrzne aplikacje do udostępniania muzyki będą wiedzieć, że dany utwór został wygenerowany przez AI. 

Czy Gemini i Lyria 3 zagrożą Suno?

Od lat jednym z najpopularniejszych i najbardziej zaawansowanych generatorów muzyki jest Suno. Gemini póki co stanowi dla niego uboższą alternatywę, bo - w przeciwieństwie do Suno - nie ma zaawansowanych opcji konfiguracji, możliwości edytowania gotowych utworów, tworzenia kilkuminutowych piosenek czy generowania plików wideo z tekstem. Gemini odmawia też "tworzenia muzyki na tematy potencjalnie wrażliwe", więc kolejnego "Antycznego Napaleńca" z tego nie będzie. 

Można jednak oczekiwać, że w przyszłości narzędzie Google’a zostanie rozbudowane, podobnie jak wcześniej miało to miejsce z tworzeniem obrazów i wideo.

Komentarze

0
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.

    Nie dodano jeszcze komentarzy. Bądź pierwszy!

Witaj!

Niedługo wyłaczymy stare logowanie.
Logowanie będzie możliwe tylko przez 1Login.

Połącz konto już teraz.

Zaloguj przez 1Login