DALL-E

DALL-E
	DALL-EUma imagem gerada pelo DALL-E 2 de uma mão robótica desenhando
Desenvolvedor	OpenAI
Lançamento	5 de janeiro de 2021 (3 anos)
Página oficial	openai.com/blog/dall-e/

DALL-E (estilizado DALL·E) é um programa de inteligência artificial que cria imagens a partir de descrições textuais.

Factos rápidos

Fechar

Ele usa uma versão de 12 bilhões de parâmetros^[1] do modelo GPT-3 Transformer para interpretar entradas de linguagem natural (como "uma bolsa de couro verde em forma de pentágono" ou "uma visão isométrica de uma capivara triste") e gerar imagens.^[2] Ele pode criar imagens de objetos realistas ("um vitral com a imagem de um morango azul"), bem como objetos que não existem na realidade ("um cubo com a textura de um porco-espinho").^[3]^[4]^[5] Seu nome é uma junção de WALL-E e Salvador Dalí.^[2]^[1]

Muitas redes neurais dos anos 2000 em diante foram capazes de gerar imagens realistas.^[2] O DALL-E, no entanto, é capaz de gerá-las a partir de instruções de linguagem natural, que "entende [...] e raramente falha de forma séria".^[2]

De acordo com a MIT Technology Review, um dos objetivos do OpenAI era "dar aos modelos de linguagem uma melhor compreensão dos conceitos cotidianos que os humanos usam para dar sentido às coisas".^[6]

O DALL-E 3 foi lançado nativamente no ChatGPT para clientes ChatGPT Plus e ChatGPT Enterprise em outubro de 2023, com disponibilidade via API da OpenAI e plataforma "Labs" esperada para o final do ano. A Microsoft implementou o modelo na ferramenta Image Creator do Bing e planeja implementá-lo em seu aplicativo Designer.^[7]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

DALL-E
DALL-E Uma imagem gerada pelo DALL-E 2 de uma mão robótica desenhando
Desenvolvedor	OpenAI
Lançamento	5 de janeiro de 2021 (3 anos)
Página oficial	openai.com/blog/dall-e/