top of page

A INTELIGÊNCIA ARTIFICIAL PROMETE DESTABILIZAR O MUNDO DA FOTOGRAFIA E DA ARTE

A loucura mais recente que explodiu o ano passado, é a ameaça crescente dos geradores de arte automáticos (AI Art Generators) como por exemplo o DALL-E, o Midjourney ou o Stable Diffusion, que prometem destabilizar o mundo da fotografia e da arte em geral, uma vez que conseguem “imaginar” através da introdução de um texto, que depois resulta numa “imagem” totalmente única como por exemplo: “imagem de um elefante a pedalar uma bicicleta em Paris no estilo de Van Gogh”. Ora esta possibilidade aparentemente mágica tem muita tecnologia e particularidades por detrás e não é assim tão simples como parece. O sistema de “inteligência artificial” funciona com base em redes neurais artificiais, que são sistemas especializados de computação com nós interconectados que funcionam como os neurónios do cérebro humano. Usando algoritmos, estas redes podem reconhecer padrões escondidos e correlações por comparação em dados brutos, que depois são agrupados, classificados e com o tempo – aprendem e melhoram continuamente, por isso atenção… estes sistemas não têm nada de inteligente ou consciente, por mais que isso assim se pareça.

Figura 1: Exemplo da arquitetura de várias redes neurais artificiais usadas no treino de diversos modelos de inteligência artificial incluindo o DALL-E, OPEN-AI, ChatGPT, Midjourney ou Stable Diffusion.

Todas estas novas ferramentas ou modelos, incluindo o ChatGPT (modelo de inteligência artificial criado para conversar com pessoas de modo natural) são sistemas que fazem milhões de cálculos matemáticos de comparação que vão essencialmente chegar a um resultado, que pode ser absolutamente correto ou incorreto, o sistema pode dizer-vos algo que demonstre confiança e segurança, mas que poderá não ser verdade, temos sempre que verificar se esse resultado corresponde exatamente à realidade. E isso terá de ser regulado no futuro com indicações ou avisos, uma vez que estes sistemas de redes de inteligência artificial vão dominar e integrar-se a 100% na nossa vida social, exemplos disso são a criação automática de notícias, assistentes virtuais de atendimento no âmbito médico ou de serviços, sistemas operativos dos computadores como por exemplo o Windows e o Office, redes sociais, marketing, carros autónomos e a própria indústria.


Os artistas no campo da arte e da fotografia ficaram particularmente alarmados recentemente porque além de estes modelos gerarem imagens fantásticas em pouco mais de 1 minuto com apenas a introdução de um texto ou “prompt” como é geralmente conhecido, baseiam-se em milhões e milhões de imagens da internet para “aprender” a gerar o resultado final. Ora isto é atualmente um bocado o oeste selvagem dos cowboys, as empresas dizem que se baseiam em bibliotecas de imagens gratuitas de direitos livres, mas os artistas tradicionais dizem que não, além de que o modelo trabalha com muito mais eficácia se for introduzida uma imagem “como base” ou pedir para usar o nome e um estilo de um artista em particular, mas as empresas argumentam que são trabalhos transformativos, coisas que os artistas estão constantemente a fazer, basear-se em trabalhos de outros artistas por isso não existe violação de direitos autorais.


A potencialidade é claramente enorme, mas as verdadeiras consequências são ainda desconhecidas, irão as pessoas comuns deixar de precisar dos serviços dos artistas? A meu ver haverá sempre um período de adaptabilidade das pessoas e dos serviços à tecnologia. De momento confesso que experimentei durante um mês e não fiquei muito impressionado com os resultados. Existem algumas razões para isso. O modelo consegue falhar ainda muito e a percentagem de imperfeições ainda é muito elevada, o suficiente para que uma impressão de alta qualidade seja uma desilusão, basta aumentarmos para os 100% e olharmos com olhos de ver que começamos a identificar essas imperfeições. É muito difícil aperfeiçoar o que realmente queremos, o truque está na escolha e articulação das palavras certas ou “prompt” que informa o modelo onde se basear e o que procurar, ora isto é quase uma arte em si e requer perder bastantes horas a refinar essas mesmas palavras e basicamente temos que perceber muitos termos, conceitos e história usados na arte para os resultados saírem melhor. Os modelos têm particular dificuldade em criar membros, os dedos das mãos, olhos e basicamente muito do detalhe fino e complexo que um ser humano facilmente consegue identificar como podem ver nestes exemplos abaixo, onde o sistema claramente não percebe nada do que está a criar. Quanto mais complexidade e detalhe personalizável tiver a peça de arte, mais difícil será para o sistema gerar algo com sentido.

Figura 2 - Exemplos dos artistas, Henry Chi (direita), Wrap Dine (centro) e Willard Zinyama (esquerda) em que o texto introduzido claramente fez o modelo falhar, este tipo de imperfeições é muito comum e só perdendo algumas horas refinando esse mesmo texto se chega a algo que se possa considerar arte.


Na minha opinião só mesmo pessoas com muita paciência (ou seja, artistas) é que realmente vão explorar devidamente esta nova ferramenta, que é como vejo este novo paradigma, uma nova ferramenta que irá infiltrar-se nas mais diversas formas em muitos programas dedicados ao design, arte e fotografia que irão ajudar no suporte de uma nova geração de criação de nova arte e de novos artistas. Aliás existem já artistas que aproveitam as imagens geradas pelo modelo de inteligência artificial para depois as melhorar ou integrar em trabalhos já existentes. O potencial humano para criar obras de arte absolutamente irreais, personalizáveis e únicas com detalhe impressionante é ainda uma especialidade meramente humana, a criatividade humana é praticamente infinita. Duvido em que a “inteligência artificial” consiga superar este nível de detalhe fino e personalização única, esta tecnologia servirá sempre de suporte ao artista e as pessoas comuns de uma forma ou outra precisarão sempre de alguém especializado para oferecer verdadeiras obras de arte ou serviços mesmo que tenham precisado de ajuda computacional.


A mim o que mais me preocupa é o facto de o ser humano e a nossa sociedade ter uma tendência crescente para descartar a “importância da qualidade inerente das coisas e da cultura, em todas as vertentes” em substituição pelo “consumo fácil, rápido, de menor qualidade e mais barato obviamente”, mas que se assume “simplesmente suficiente”. A qualidade e a excelência têm de ter na minha opinião um peso mais importante na sociedade e as decisões terão de ser feitas com mais consciência, como exemplo simples e prático, mais vale criar um produto orgânico e biodegradável do que taxar outros produtos que não o são, ou então produzir algo que dure e se assegure por muitos e muitos mais anos.

Figura 3 - Jason Allen criou esta imagem de título: Théâtre D'opéra Spatial — que significa "Teatro Operático Espacial" — usando o Midjourney, um programa de inteligência artificial que consegue gerar imagens baseadas na introdução de texto ou “prompts”. Allen venceu na categoria de “artes digitais” com um prémio monetário de 300 dólares à frente de outros artistas tradicionais. Será ele o artista que nada fez além de criar o texto, ou será a inteligência artificial o artista, que criou a imagem baseada em código e algoritmos automáticos.


ESPAÇO ALFA - Artigo de Mauro Rodrigues publicado no Caderno de Artes Cultura.Sul de fevereiro de 2023

bottom of page