A inteligência artificial (IA) está revolucionando diversos setores, e a área de criação de vídeos não fica de fora. A startup Stability AI, conhecida por seu modelo de texto para imagem chamado Stable Diffusion, acaba de anunciar uma novidade em código aberto: o Stable Video Diffusion.
O Stable Video Diffusion é um modelo de IA que gera vídeos a partir de imagens existentes, dando vida a fotos estáticas. Diferentemente de muitos modelos de IA generativa disponíveis, o Stable Video Diffusion pode ser utilizado tanto de forma gratuita e aberta, como comercialmente.
No entanto, é importante ressaltar que o Stable Video Diffusion está em fase de pesquisa, sujeito a alguns termos de uso. A Stability AI delimita as aplicações pretendidas do modelo, como ferramentas educacionais e criativas, processos artísticos, entre outros, e alerta para o uso não pretendido, como representações factuais de pessoas ou eventos.
Embora promissor, o Stable Video Diffusion traz consigo alguns desafios e preocupações. A geração de deepfakes não consensuais é uma das principais preocupações, especialmente considerando casos anteriores envolvendo o modelo Stable Diffusion da Stability AI. É fundamental que a empresa implemente um filtro de conteúdo para evitar o mau uso da tecnologia.
O Stable Video Diffusion conta com dois modelos principais: o SVD e o SVD-XT. O primeiro transforma imagens estáticas em vídeos de 576×1024 pixels em 14 frames, enquanto o SVD-XT aumenta para 24 frames. Ambos os modelos podem gerar vídeos com três a 30 frames por segundo.
De acordo com um whitepaper divulgado junto ao Stable Video Diffusion, os modelos foram treinados inicialmente em um conjunto de dados composto por milhões de vídeos e, posteriormente, ajustados com um conjunto menor de centenas de milhares de clipes. A proveniência dos vídeos não está clara, mas a Stability AI indica que grande parte deles provavelmente faz parte de conjuntos de dados de pesquisa pública.
A Stability AI planeja lançar novos modelos que expandam as capacidades do Stable Video Diffusion e uma ferramenta de “texto para vídeo” que permitirá que os usuários tragam elementos de texto para os vídeos gerados. O objetivo final é comercializar o Stable Video Diffusion e suas aplicações nos setores de publicidade, educação, entretenimento e muito mais.
A Stability AI enfrentou recentemente desafios financeiros, mas conseguiu captar um investimento de US$ 25 milhões e está planejando captar mais ainda nos próximos meses. A saída do VP de áudio Ed Newton-Rex trouxe mais polêmica para a empresa, mas mesmo assim, ela continua avançando com suas inovações em IA e aprimorando suas tecnologias para impulsionar a indústria de vídeos.
Referências:
Stability AI gets into the video-generating game
Why one AI executive quit his job to protest creators’ rights
YouTube’s generative music experiments come at a tense …
Graphisoft unveils AI-powered Visualizer for Archicad
OpenAI employees threaten to quit en masse after former CEO Sam Altman joins Microsoft
Journalists turn to AI expert Lyu to spot deepfakes – UBNow …
Deixe um comentário