Startup Runway oznámil nový model: umělá inteligence převodu textu na video se přiblížila

Startup Runway oznámil nový model: umělá inteligence převodu textu na video se přiblížila

Převod textu na video je další hranicí generativní umělé inteligence, i když současné výstupy jsou jen základní. Runway tvrdí, že svůj nový model generativního videa, Gen-2, zpřístupní uživatelům „v příštích týdnech“.

Umělá inteligence převádějící text na obraz je nyní hlavním proudem, ale text na video teprve čeká. Tato technologie spočívá v tom, že budete moci zadat popis a vygenerovat odpovídající video v libovolném stylu. Současné možnosti za tímto snem zaostávají, ale pro ty, kdo sledují pokrok této technologie, je přesto pozoruhodné oznámení startupu Runway, který se zabývá umělou inteligencí, o novém modelu generování videa pomocí umělé inteligence. Runway nabízí webový editor videa, který se specializuje na nástroje AI, jako je odstraňování pozadí a detekce póz. Společnost se podílela na vývoji open-source modelu pro převod textu na obraz Stable Diffusion a v únoru oznámila svůj první model pro úpravu videa s umělou inteligencí, Gen-1.

Gen-1 se zaměřil na transformaci existujících videozáznamů a umožnil uživatelům zadat hrubou 3D animaci nebo roztřesený klip ze smartphonu a použít překryv generovaný umělou inteligencí.

Oproti tomu se zdá, že Gen-2 se více zaměřuje na generování videí od nuly, i když je třeba upozornit na spoustu výhrad. Zaprvé, ukázkové klipy sdílené službou Runway jsou krátké, nestabilní a rozhodně ne fotorealistické, a zadruhé, přístup k nim je omezený.

Přesto jsou výsledky fascinující a vyhlídka na umělou inteligenci pro převod textu na video je jistě opojná – slibuje jak nové tvůrčí příležitosti, tak nové hrozby pro dezinformace apod. Stojí také za to porovnat práci společnosti Runway s výzkumem text-to-video, který sdílejí giganti jako Meta a Google. Práce těchto společností je pokročilejší (jejich klipy generované umělou inteligencí jsou delší a ucelenější), ale ne způsobem, který by nutně odrážel obrovské zdroje těchto firem. Jinými slovy: začínající firmy pokračují v zajímavé práci v oblasti generativní umělé inteligence, včetně dosud neprozkoumané oblasti převodu textu na video.

 

Zdroj, foto: theverge.com

Komentáře

Nahoru