A Meta, uma empresa de tecnologia, acaba de lançar o seu mais recente produto AI, um gerador de música. Esta é a mais recente inclusão em uma série de produtos baseados em inteligência artificial da empresa.
Na quarta-feira, Meta divulgou a abertura do AudioCraft, uma inteligência artificial criadora de código aberto que produz som e música a partir de prompts de texto. AudioCraft tem três versões, MusicGen para compor músicas, AudioGen para desenvolver sons, e EnCodec, que utiliza AI para aperfeiçoar a compressão de áudio, ultrapassando o formato MP3.
No caso de quaisquer dúvidas sobre direitos autorais, MusicGen está capacitado em meta-propriedade musical e licença.
A Meta tem se empenhado em promover ferramentas de Inteligência Artificial para o grande público, competindo com OpenAI, Google e Microsoft. O mês de julho viu o lançamento da sua Llama 2 de código aberto, a versão mais recente de seu LLM (Modelo de Linguagem Maior).
Em vez do GPT-4 da OpenAI e do Google PaLM 2, o Llama 2 é open-source, o que o torna mais atraente para programadores e defensores da ética que prezam pela transparência na criação de IA. Existe também a fofoca de que a Meta está lançando “personas” de IA (também conhecidas como chatbots) para Instagram, Facebook e WhatsApp.
AudioCraft foi criado com artistas musicais e profissionais de design de som em mente para “proporcionar motivação, apoiar as pessoas a pensar de forma rápida e explorar suas composições de maneiras inovadoras”, de acordo com o anúncio.
Exemplos no post do blog incluem amostras de áudio do prompt “Sopro de vento com assobios” e “Pop pista de dança com melodias cativantes, percussão tropicais e batidas animadas, ideal para a praia”, que… soar com êxito de acordo com estas descrições.
- Não, threads não estabeleceram limites de tal maneira como o Twitter. Esta é a tarefa que o método realizou.
- Sua imagem de personagem virtual agora opera nos aplicativos de mensagens Messenger e Instagram para ligações de vídeo.
- Threads, o rival do Twitter, está monitorando sua atividade de todas as maneiras.
Uma quantidade significativa de inovações na área da inteligência artificial tem se focado na produção de texto e imagem, que é considerado um processo de menor complexidade.
Text-to-audio é um desafio complexo que Meta parece não ter conseguido superar. AudioCraft aprende tokens de áudio de sinais brutos usando seu proprietário codec de áudio neural EnCodec para construir um novo “vocabulário” para o modelo.
Então, ele prepara modelos de linguagem usando esse grupo de sons para que o sistema compreenda a ligação entre áudio e texto. Dado que o AudioCraft é open-source, o seu código está disponível no GitHub para que as pessoas possam investigar e experimentar por conta própria.