Description
Phenaki est un modèle d'IA pour générer des vidéos qui peuvent durer plusieurs minutes directement du texte. Vous pouvez également générer une vidéo à partir d'une image calme et d'une invite. L'encodeur vidéo proposé dépasse toutes les lignes de base par trame actuellement utilisées dans la littérature en termes de qualité spatio-temporelle et de nombre de jetons par vidéo. Pour générer des jetons vidéo à partir de texte, ils utilisent un transformateur masqué bidirectionnel conditionné sur des jetons de texte pré-calculés. Les jetons vidéo générés sont par la suite détruits pour créer la vidéo réelle.
Contact
Berlin
tags
- video generator
