25 de jan. de 2022

A IA Substituirá os Redatores? A Evolução e o Futuro da Redação de Conteúdo com IA

À medida que a geração de texto e o aprendizado de máquina avançam, há muito bate-papo sobre se os redatores de conteúdo serão substituídos pela infinidade de ferramentas de redação de IA que oferecem funcionalidade de preenchimento automático.

GPT-3Rytr, Jarvis, Shortly, CopyAI, Frase, etc. - a lista de novos produtos com preenchimento automático que surgem no mercado é interminável. Todos esses produtos possuem um botão "Escreva para mim". Você clica nesse botão, e um parágrafo de texto é gerado.

Quase parece mágica.

Como um pesquisador de inteligência artificial, eu venho acompanhando as inovações nessa área nos últimos 5 anos - e é fascinante como algo que começou como uma forma de preencher automaticamente suas mensagens de texto se tornou uma tecnologia que agora pode quase produzir romances inteiros.

Mas isso significa que a IA pode substituir os redatores - a escrita humana está obsoleta? ‍A resposta é complicada.

Para responder a essa pergunta, primeiro precisamos desvendar o que se passa para ver como o preenchimento automático para a redação de conteúdo realmente funciona. Munidos dessa informação, podemos explorar os trade-offs que essa tecnologia de inteligência artificial traz, e descobrir se os redatores têm algo com que se preocupar com todas essas ferramentas de redação de IA no mercado.

Como o Preenchimento Automático Evoluiu para a Redação de Conteúdo

Com todo o alvoroço em torno das novas inovações em inteligência artificial como o GPT-3, é fácil esquecer como a tecnologia de texto preditivo (preenchimento automático e correção automática) evoluiu ao longo das décadas.

Sim, essa é a funcionalidade em seu antigo iPhone 5 que corrige "iz" para "is", e também é como o Google sugere que você (às vezes de forma hilariante) complete suas buscas.

Contando com N-Gramas para Escrever por Você

Você pode ficar surpreso, mas a tecnologia de preenchimento automático pode ser rastreada até 1948. Desde então, ajudou redatores de conteúdo a revisar e corrigir sua escrita.

Vamos dar uma olhada nas humildes origens do preenchimento automático.

Muitos dos primeiros sistemas de preenchimento automático eram baseados no conceito de um modelo de linguagem. Esse era basicamente um modelo que pode prever a próxima palavra com base em um histórico de palavras.

O primeiro modelo de linguagem, primeiramente referenciado por Claude Shannon, era chamado de modelo de n-gramas. Uma aplicação de n-gramas era prever quão provável era que um conjunto de palavras aparecesse no texto que você está digitando.

Por exemplo, se você digitar "Você pode, por favor, vir" (as palavras do histórico), o modelo de n-gramas preverá que a próxima palavra "aqui" é altamente provável (por exemplo, 80% de chance). Seu telefone oferecerá então completar sua frase com a palavra "aqui".

Como os n-gramas sabem quais palavras são prováveis?

Você pode criar um modelo de n-gramas simplesmente contando o número de vezes que a frase "Você pode, por favor, vir aqui" apareceu em um corpus de texto de alta qualidade (também chamado de dado de treinamento). Se essa frase aparece com frequência, significa que "aqui" é provavelmente uma conclusão correta - caso contrário, é uma formulação improvável.

Essa contagem de ocorrências é aplicada a todas as possíveis frases no corpus, resultando em uma "tabela de contagens".

No exemplo acima, a primeira linha tem a contagem mais alta porque ocorre na linguagem escrita por humanos com mais frequência. A última linha está escrita em inglês esotérico e não aparece frequentemente na linguagem moderna, então tem uma contagem menor.

Com essa tabela, sempre que alguém digita, o programa olha para essa tabela para encontrar a frase que coincida com a contagem mais alta. Essa melhor correspondência é essencialmente uma previsão do que a próxima palavra deve ser. Essa correspondência também permite que o programa forneça uma estimativa de probabilidade (por exemplo, 80% de chance de conclusão correta com base no corpus).

E aí está - a mágica por trás de muitas ferramentas de preenchimento automático se resume a contar palavras!

Em uma explicação excessivamente simplificada, é assim que você constrói um modelo que pode prever a próxima palavra mais provável dada um certo conjunto de palavras do histórico. Essa é a base de como os sistemas de correção automática e preenchimento automático funcionam.

Então, os redatores vão ser substituídos por um modelo de n-gramas?

Definitivamente não.

Há um problema fundamental com os n-gramas - eles representam a linguagem de uma forma esparsa. Para colocar de forma simples, isso significa que se você tem muitos dados, sua tabela se torna muito grande. É aí que as redes neurais como GPT entram em jogo.

Indo além de uma tabela com GPT

O que usamos hoje evoluiu bastante desde o modelo de n-gramas.

A inteligência artificial moderna para preenchimento automático se baseia em redes neurais, que são muito mais poderosas do que os modelos de n-gramas. Embora mais sofisticadas, as redes neurais se baseiam no mesmo princípio fundamental da contagem estatística.

O poderoso GPT-3 (Transformador Generativo Pré-treinado v3) é um grande modelo de linguagem de rede neural desenvolvido pela OpenAI e agora é a espinha dorsal de todas as ferramentas de redação com preenchimento automático recém-lançadas no mercado. O GPT-3 faz parte de uma tendência em processamento de linguagem natural (NLP) de migrar para grandes redes neurais pré-treinadas.

Com o GPT-3, não armazenamos ingenuamente uma tabela para todas as possíveis frases; em vez disso, armazenamos um resumo comprimido disso nos pesos de sua rede neural. Isso nos permite treinar modelos em bilhões de frases e sentenças que seriam inviáveis de inserir em uma única tabela.

Então como o GPT-3 escreve por você?

Assim como os n-gramas, quando você digita uma palavra ou frase, o GPT-3 tentará encontrar a palavra mais provável para completar sua frase com base no corpus de texto com o qual foi treinado.

Mas não para por aí. Assim que ele prevê a próxima palavra que você vai digitar, ele fará isso em um loop e continuará prevendo a próxima palavra até ter escrito um parágrafo. É assim que ele "gera" um parágrafo para você.

Mas espere - se tudo o que o GPT-3 faz é procurar probabilidades derivadas de conteúdo escrito anteriormente, isso significa que o GPT-3 simplesmente repete o que leu, ou é realmente criativo?

Essa é uma questão filosófica difícil que é predominante nas discussões atuais sobre conteúdo gerado por IA.

Equívocos sobre a Redação de Conteúdo por IA

A Redação de Conteúdo por IA Pode Ser Criativa?

Muitos críticos observaram que o GPT-3, como todos os modelos de IA, só pode gerar texto que já viu antes. Eles afirmam que a redação de IA carece de criatividade e que essas ferramentas são boas apenas para enviar conteúdo regurgitado.

Enquanto esse ponto de vista costumava ser válido, não é mais totalmente verdadeiro.

É fácil afirmar que um modelo de n-gramas de 1948 simplesmente repetiria conteúdo existente porque ele literalmente armazenaria todos os seus dados de treinamento em uma tabela e "geraria" texto olhando através das frases que viu.

Mas, como o GPT-3 é um compressor altamente eficiente de seu texto de treinamento, ele é obrigado a desenvolver regras e padrões de conteúdo escrito - ele não sempre se lembra da frase exata de seus dados de treinamento armazenados em sua memória.

Embora algumas frases possam ser geradas palavra por palavra, muitas frases produzidas são novas. Uma pesquisa rápida no Google sobre texto gerado mostrará que a maioria das gerações é original.

Se você acredita ou não que o GPT-3 (ou qualquer modelo de IA e ferramentas de IA) pode produzir escrita original, isso está em debate, e depende de como você define originalidade. Afinal, os humanos aprenderam com grandes obras anteriores e criaram versões inspiradas em Shakespeare, então os humanos realmente são todos tão originais?

Embora a IA moderna produza texto que pode ser semelhante ao que existe, ela também pode produzir texto que pode surpreendê-lo.

Cabe aos redatores humanos e editores de conteúdo aproveitar ao máximo essa surpresa.

Um melhor uso do preenchimento automático deve envolver escritores filtrando e escolhendo o melhor texto gerado por IA, ou usando-o como uma fonte de inspiração para superar o bloqueio criativo.

A Redação de Conteúdo por IA Pode Ter Emoção?

Uma das preocupações em torno da redação de conteúdo por IA é que ela produz texto sem alma, sem emoção.

Esta é outra afirmação ampla que carece de nuances - e talvez derivada da nossa noção de ficção científica de IA sendo robôs sem sentimentos.

Mais uma vez, modelos de IA simples como o n-gram seriam improváveis de produzir texto emocional porque carecem de poder representacional - eles têm um limite prático sobre o quanto podem aprender.

Mas como o GPT-3 aprende a partir de um grande corpus de texto com mais contexto, muitas vezes pode repetir o sentimento e o tom na escrita. Isso significa que se você digitar uma frase como "Estou me sentindo triste hoje", o modelo de IA tentará encontrar as palavras mais apropriadas para refletir esse sentimento no texto gerado.

(O parágrafo que você acabou de ler acima foi totalmente autocompletado pela Jenni AI sem edições. Ela aprendeu a combinar meu tom e estilo de escrita a partir dos parágrafos anteriores.)

Um estudo publicado no ICLR 2020 mostra que geradores de texto neurais podem até repetir frequentemente e começar a se tornar repetitivos. No entanto, repetição não é o mesmo que ter emoção.

Como escritor, você ainda precisará estar no controle do tom geral e da emoção de sua escrita. Embora a IA possa produzir texto que reflete o sentimento humano, não tem experiência empírica do que é ser humano - não é uma inteligência incorporada.

Lembre-se, como modelos de n-gramas, o GPT-3 é treinado em um corpus de texto (principalmente da internet e produzido por um redator humano).

Ele não viu ou experimentou nada mais que um humano típico experimenta - nunca saberá como é o gosto de um cheeseburger, nem pode empatizar totalmente. De acordo com OpenAI, ele não pode responder perguntas com precisão relacionadas ao mundo físico, como "Se eu colocar queijo na geladeira, ele vai derreter?".

Essa é uma limitação inerente dos modernos modelos de linguagem que devem continuar nos próximos anos - pelo menos até que a IA ganhe um corpo físico.

Para a redação de conteúdo, entender essa limitação é fundamental.

Isso significa que, para realmente aproveitar o poder da IA para a redação de conteúdo, precisamos fornecer orientação e feedback ao modelo de IA para direcioná-lo na direção certa.

Por Que IA + Humano É o Futuro da Redação de Conteúdo

Essas desvantagens podem fazer com que muitos sejam céticos sobre os avanços na redação de conteúdo por IA ou temer que nosso futuro esteja cheio de conteúdo de spam.

Pelo contrário, eu prevejo um futuro muito mais brilhante.

Em 1996, quando o sistema de IA da IBM  em um jogo de xadrez, pensava-se que o jogo de xadrez tinha sido resolvido e não haveria mais jogadores de xadrez.

No entanto, o que ocorreu foi um renascimento de pessoas aprendendo novas estratégias de xadrez estudando os movimentos da IA. Um fenômeno semelhante aconteceu depois que AlphaGo da DeepMind derrotou Lee Sedol, o melhor jogador do mundo em Go em 2016.

O sucesso na IA significa que os humanos devem se adaptar e mudar - e essa mudança pode ser desconfortável, mas geralmente é para melhor. Enquanto a IA pode vencer os humanos em certas tarefas, os humanos são melhores generalistas, e podemos aprender a incorporar a IA para aumentar nossa produtividade geral.

Isso se aplica à redação de conteúdo, onde os redatores precisam integrar uma estratégia de conteúdo de alto nível, a visão e a marca de uma empresa, e uma compreensão do público em seu conteúdo.

É por isso que prevejo um futuro em que podemos ter o melhor de ambos os mundos - humanos e IA trabalhando juntos para produzir conteúdo de qualidade ainda maior.

A Redação será Obsoleta Amanhã?

Com o desenvolvimento exponencial da tecnologia, é difícil não se perguntar - o trabalho do redator de conteúdo está em risco no futuro?

Se olharmos a tendência de melhoria do modelo de linguagem ao longo dos anos, é claro que a IA está ficando cada vez melhor em preencher texto automaticamente. A perplexidade (uma medida de erro) da IA em um benchmark comum como WikiText-103 diminuiu de 40 para 10 nos últimos 3 anos - isso é uma melhoria de 4x!

Extrapolando esse crescimento exponencial, nos próximos 5 anos, esperamos uma melhoria adicional de 10x na qualidade da tecnologia de preenchimento automático.

Isso significa que se tudo o que você faz para sua redação de conteúdo SEO é produzir trabalho de baixo valor - reescrevendo conteúdo existente, preenchendo modelos, copiando/colando listas, ou girando o conteúdo de outras pessoas - então a resposta é sim - você está condenado.

Então, o que isso significa para os redatores sérios e apaixonados por sua profissão?

Não

Start Writing With Jenni Today

Sign up for a free Jenni AI account today. Unlock your research potential and experience the difference for yourself. Your journey to academic excellence starts here.