A nova ferramenta V2A (Video-to-Audio) do DeepMind usa uma combinação de pixels e prompts de texto para gerar automaticamente trilhas sonoras, efeitos sonoros e até mesmo diálogos que, segundo a empr...
Saiba maisO que torna essa ferramenta ainda mais impressionante é a sua capacidade de gerar um "número ilimitado de trilhas sonoras para qualquer entrada de vídeo". Isso significa que os criadores podem ajusta...
Saiba maisO que diferencia a ferramenta V2A do DeepMind das tecnologias rivais é sua capacidade de gerar áudio puramente com base em pixels – o uso de prompts de texto é opcional. Mas a empresa também está cie...
Saiba maisUma cena semelhante ao filme "Blade Runner", com carros derrapando por uma cidade com uma trilha sonora de música eletrônica, também mostra como a ferramenta V2A poderia reduzir drasticamente os orça...
Saiba maisNo entanto, as limitações ainda são evidentes, como demonstrado no vídeo de uma "família em animação de massa de modelar", onde os diálogos gerados deixam a desejar. Mas, se o último ano nos ensinou ...
Saiba maisA OpenAI já anunciou que tem planos de adicionar áudio ao seu gerador de vídeo Sora, que deve ser lançado ainda este ano. Mas a nova ferramenta V2A do DeepMind mostra que a tecnologia já está em um e...
Saiba maisA ferramenta V2A funciona usando um modelo de difusão que combina informações dos pixels do vídeo e dos prompts de texto do usuário, gerando então um áudio comprimido que é decodificado em uma forma ...
Saiba maisNão está claro exatamente qual conteúdo foi usado para treinar a ferramenta V2A, mas o Google claramente tem uma vantagem potencial enorme por ser dono da maior plataforma de compartilhamento de víde...
Saiba maisNão perca nenhuma informação sobre este conteúdo. Clique abaixo e veja a matéria completa.
Saiba maisAcompanhe tecnologia, conteúdo de notícias em nosso blog.
Saiba mais