29/08/2024

29/08/2024

Gemini ganha geração de imagens melhorada


Com o Imagen 3 passam a estar disponíveis imagens com base em algumas palavras. 

Temos novas funcionalidades que começam a ser disponibilizadas e que mostrámos durante a Google I/O. O nosso novo modelo de geração de imagens, Imagen 3, está agora disponível no Gemini, Gemini Advanced, Business e Enterprise.


Gere imagens de alta qualidade com o Imagen 3


Atualizámos as nossas capacidades criativas de geração de imagens e, ao longo dos próximos dias, iremos levar o nosso modelo de geração de imagens mais recente, o Imagen 3, às Aplicações Gemini e expandir a sua disponibilidade para utilizadores em todos os idiomas.


Imagens geradas utilizando prompts em inglês – os resultados podem variar.



Imagen 3 - Carousel 1.png

Imagen 3 - Carousel 2.jpeg

Imagen 3 - Carousel 3.jpeg

Imagen 3 - Carousel 4.jpeg


  1. Uma imagem animada de um pequeno dragão a sair de um ovo, num prado iluminado pelo sol, rodeado por borboletas brilhantes curiosas. Cores vibrantes, escalas detalhadas.

  2. Imagem de um vestido de baile feito de guardanapos de papel num showroom elegante.

  3. Uma imagem fotorrealista de uma vista de montanha deslumbrante com picos irregulares e cumes cobertos de neve, banhada pelo brilho quente do pôr do sol. Nuvens dramáticas, pintadas em tons vibrantes de laranja, rosa e roxo, cruzam o céu, projetando sombras longas na paisagem acidentada.

  4. Uma pintura abstrata vibrante com as palavras "Dream Big" espalhadas na tela e em cores fortes.


Imagen 3 estabelece um novo padrão na qualidade de imagem, gerando imagens com apenas algumas palavras. Pode até pedir ao Gemini para criar imagens em vários estilos – como paisagens fotorrealistas, pinturas a óleo com textura ou cenas animadas (whimsical claymation).



Legenda: Imagen 2 vs. Imagen 3


O Imagen 3 traz funcionalidades avançadas de geração de imagens que vêm com proteções integradas e em consonância com os nossos princípios de design de produto. Numa vasta gama de benchmarks, o Imagen 3 tem um desempenho favorável em comparação com outros modelos de geração de imagens disponíveis. E tal como acontece com o Imagen 2, utilizamos o SynthID, a nossa ferramenta para assinalar com marcas de água as imagens geradas por IA.


Os nossos princípios de design são claros: do início ao fim, o utilizador mantém o controlo do processo criativo. Se a imagem inicial obtida não corresponder às expectativas, basta pedir ao Gemini o que gostaria de mudar e será gerada uma nova imagem.


Ao longo dos próximos dias, iremos também começar a disponibilizar a geração de imagens de pessoas, com uma versão de acesso prévio para os utilizadores Gemini Advanced, Business e Enterprise, a começar com o inglês. Trabalhámos para fazer melhorias técnicas no produto, bem como com conjuntos de avaliação melhorados, exercícios de red teaming e princípios de produto claros.


Com o Imagen 3, fizemos progressos significativos para proporcionar uma experiência de utilização melhor na geração de imagens de pessoas. Não apoiamos a geração de imagens fotorrealistas de indivíduos identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais. É claro que nem todas as imagens que o Gemini cria serão perfeitas, mas iremos continuar a ouvir o feedback dos utilizadores com acesso prévio no Gemini Advanced à medida que continuamos a melhorar. Iremos implementá-lo gradualmente, com o objetivo de o levar a mais utilizadores e idiomas em breve.


Para estar entre os primeiros a experimentar estas novas funcionalidades, experimente hoje mesmo o Gemini Advanced ou inscreva-se no Gemini for Workspace. 

0 comments:

Enviar um comentário