2019. 2. 21.

GPT 3 및 SEO: AI가 당신의 콘텐츠를 영원히 혁신할 이유

우리는 이제 모든 분야에서 떠들썩한 얘기를 들었습니다.

OpenAI는 Generative Pre-trained Transformer 버전 3(줄여서 GPT-3 또는 GPT 3)의 새로운 버전을 출시했습니다. 이는 베타 API 액세스가 가능하며, GPT-3는 이전 모델인 GPT-2와 마찬가지로, 일반인을 속일 만큼의 사실적인 텍스트를 자동으로 생성할 수 있는 대형 심층 신경망입니다. 이는 웹에서 인간 문체를 모방하는 방법을 배우는 고급 AI입니다.

다음은 GPT-3에 의해 생성된 기사의 발췌 입니다:

제2차 세계 대전 이후로, 서구 세계의 경제, 특히 유럽의 경제는 회복을 시작하고 성장세를 보이기 시작했습니다. 공장, 도로와 다리, 도시와 주택, 항구와 공항의 재건이 시작되었습니다. 유럽의 경제는 서구 전체의 성장 엔진이 되었습니다. 국가들과 기업들, 그리고 사람들이 번창하였고, 유럽에서는 경제 성장, 임금 상승, 그리고 생활 수준 향상이라는 위대한 시기가 시작되었습니다. 재건과 새로운 투자의 결합은 유럽을 사업을 하기 매우 좋은 곳으로 만들었습니다. 기업들은 공장을 세우고, 투자하며 새로운 시장을 찾았으며, 이러한 투자는 대부분 부채 자금으로 이루어졌습니다.

이러한 결과는 대중을 분명히 놀라게 했고 많은 과대선전을 야기했습니다. 생성된 텍스트는 품질이 좋고 문법적으로도 맞지만, GPT-3는 단순한 강력한 텍스트 생성기가 아닙니다. 이 기술은 콘텐츠 제작, 마케팅 및 SEO(검색 엔진 최적화)에 대한 우리의 사고 방식을 근본적으로 변화시킵니다. 위에서 보여준 것과 같은 짧은 콘텐츠 조각은 저렴한 비용으로 쉽게 생성할 수 있습니다.

SEO 전문가와 콘텐츠 제작자로서, 우리는 GPT-3를 이해하는 것이 필수적 입니다. 이는 인간의 글쓰기가 구식이라는 것을 의미합니까? 높은 품질의 카피를 생성할 수 있습니까? 이는 SEO 스팸 봇이 무한한 쓰레기를 만들어내는 종말적인 시나리오를 의미합니까?

이러한 감정에는 몇 가지 진실이 있지만, 우리는 GPT-3에 대한 과대선전 가 더 명확하게 설명되어야 한다고 생각합니다. 텍스트 생성 기술이 SEO와 콘텐츠 작성에 미치는 영향을 이해하기 위해, 우리는 먼저 GPT-3의 기능, 그 중요성, 그리고 작동 방식을 분석해야 합니다.

GPT-3의 일반성

GPT-3와 그 이전 기술(GPT 및 GPT-2)은 OpenAI에 의해 개발된 일반 NLP(자연어 처리) 모델에 대한 연구의 일환입니다. 하지만 일반적이라는 것은 무엇을 의미합니까?

기계 학습은 오직 한가지 작업에만 좋은 시스템을 개발하는 오랜 역사를 가지고 있습니다. 이러한 시스템은 좁은 AI라고 불립니다. 만약 아마존 리뷰의 평점을 예측하는 AI가 필요하다면, 충분한 훈련 데이터만 있다면 쉽게 훈련할 수 있습니다. 소셜 미디어 프로필 사진을 보고 그것이 누구인지 알려주는 모델을 개발하고 싶다면, 그 작업을 수행할 또 다른 모델을 훈련할 수 있습니다.

문제는 이러한 작업 중 하나만 훈련한 AI 시스템은 다른 어떤 작업에도 사용할 수 없다는 것입니다. 따라서 좁은 AI라는 용어가 생겼습니다. 그것은 훈련받은 범위에 제한됩니다. 현재 AI 연구의 성배는 보다 일반적인 기술을 찾는 것이며, 여러 작업을 수행할 수 있는 AI입니다. 일반적인 기술이 게임 체인저인 이유는 여기에 있습니다.

왜 AI 일반기를 만들어야 할까요?

일반적으로 사람들은 특화된 전문가가 선호되어야 한다고 생각합니다.

컴퓨터 초기 시대에 사람들은 오직 한 가지 문제만 계산하고 해결할 수 있는 특화된 컴퓨터를 만들었습니다. 더하기만 할 수 있는 특화된 계산기를 생각해보세요, 그 외의 아무것도 할 수 없는 계산기입니다. 물론 더하기에는 뛰어나고 아주 빠르게 계산하지만, 그 외에는 별로 유용하지 않습니다.

반면, 더하고 빼고, 인터넷을 하고, 비디오 게임을 하는 등의 일반적인 기능을 가진 컴퓨터가 훨씬 더 유용합니다. 현재의 폰 노이만 구조 기반의 현대 컴퓨터들은 이러한 일반 기능을 가지고 있습니다. 되돌아보면, 일반-purpose 컴퓨팅은 인류의 가장 영향력 있는 발명품 중 하나라는 것을 쉽게 말할 수 있습니다.

동일한 원리는 GPT-3 같은 AI 기술에도 적용됩니다. 우리는 시스템의 일반성을 원합니다. 이는 우리가 여러 문제를 손윗 작업 없이 더 많은 문제를 해결할 수 있게 해줍니다. 게다가 일반 학습 접근법이 NLP 작업에서 AI 정확성을 최소 60% 증가시키는 것이 입증되었습니다.

결국, 인간은 일반 지능의 한 형태입니다. 일반 지능은 우리가 사전에 유용할지 모를 기술을 획득할 수 있게 해줍니다. 일반 지능이 무엇인지 궁금하신 분들은 Chollet의 논문 On the Measure of Intelligence를 추천합니다.

SEO 마케팅 측면에서 이는 우리가 미리 어떤 유형의 콘텐츠를 제작할 것인지 알 필요가 없다는 것을 의미합니다. 그렇다고 해서 약간 다른 목적을 위해 다른 AI를 만들어야 한다는 것도 아닙니다.

GPT-3는 일반 지능의 특성을 보여주는 AI 시스템입니다(가끔은 프로토-AGI라고 불림). 예를 들어, 우리는 AI에 캐릭터 대화의 예시 로 프롬프트를 주고 이를 완성하도록 요청할 수 있습니다:

렉스는 미래에서 온 시간 여행자입니다. 아다는 19세기 귀부인입니다. 렉스: 내가 시간 기계를 너의 정원에 추락시킨 것 같아. 아다: 뭐라고요? 당신이 방금 뭐라고 했나요?

그것은 또한 다양한 다른 작업을 수행할 수 있으며, 심지어 HTML 코드를 생성할 수도 있습니다. 이는 우리가 콘텐츠 관련 작업을 GPT를 사용하여 해결할 수 있다는 점에서 중요합니다.

그렇다면 GPT-3가 SEO와 관련된 모든 작업을 해결할 수 있다는 의미일까요? 어떤 주제나 카테고리에 대한 블로그 포스트를 생성할 수 있을까요? 그렇지는 않습니다. 그 질문에 답하기 위해 우리는 GPT-3의 작동 방식을 이해해야 합니다.

GPT-3의 학습 방법

빅 데이터 활용하기

기계 학습 모델(특히 심층 신경망)은 데이터에 민감하며, 많은 데이터를 제공해야만 잘 작동합니다. 결국, 데이터는 새로운 석유입니다.

하지만 데이터를 얻는 것은 어렵고 비용이 많이 듭니다. 대부분의 유용한 기계 학습 시스템은 사람들이 각 데이터 포인트에 꼼꼼히 라벨링해야 합니다. 라벨링된 데이터는 수집하기 비용이 들기 때문에 많은 애플리케이션의 주요 병목 현상입니다 - 다양한 작업을 수행하기 위해 많은 인력을 고용하는 비용을 상상해 보세요!  Amazon Turkers!

GPT-3은 자연적으로 발생하는 웹 텍스트를 모델링하여 자체 훈련 신호를 생성함으로써 이러한 문제를 해결합니다. 이는 비지도 학습(또는 자기 감독 학습)이라는 기계 학습 패러다임을 채택합니다. 이를 통해 사람 라벨이 없는 데이터로 배울 수 있습니다. 비지도 학습의 기술적인 세부 사항을 깊이 파고들고 싶은 분들을 위해, 우리의 CTO는 여기에서 심층 분석을 작성했습니다.

하지만 라벨 없이 우리는 여전히 많은 데이터가 필요하죠?

사실 데이터는 바로 우리 눈앞에 있습니다. 인터넷에는 다양한 주제에 대해 많은 양질의 잘 작성된 기사가 있으며, 이 모든 것은 쉽게 접근할 수 있습니다. GPT의 훈련 기술의 아름다움은, 해당 인간이 작성한 기사를 어떻게 예측하는지를 배우기만 하면 잘 수행된다는 것입니다.

하지만 잠깐 - 웹에 쓰레기가 많은 것 아닙니까? GPT-3이 그것도 배워버리면 어쩌죠?

그렇습니다. GPT의 제작자는 크라우드소싱을 사용하여 데이터를 일부 정리하는 방법으로 이러한 문제를 완화했습니다. 이렇게 하려면, 사람들이 레딧에 공유하는 URL을 살펴보고, 레딧에서 많은 추천을 받은 웹사이트의 콘텐츠 및 게시물만 크롤링하면 됩니다.

언어 생성에 의한 학습

데이터가 확보되면 이제 GPT를 훈련할 수 있습니다. 하지만 어떻게 GPT를 훈련하여 우리가 원하는 모든 일반 기능을 얻을 수 있을까요? 한 가지 아이디어는 간단히 텍스트 생성 작업을 수행하는 것입니다. GPT는 이전 단어들로부터 다음 단어를 예측하는 방식으로 자연어 생성을 배우게 됩니다.

GPT가 왼쪽에서 오른쪽으로만 콘텐츠를 생성하는 주된 이유이기도 합니다(역으로는 그렇게 할 수 없습니다). 이러한 방식의 학습을 언어 모델링이라고 합니다.

정말로 그렇게 간단합니다.

문장에서 다음 단어가 무엇인지 예측함으로써 AI는 자신의 문맥에 있는 다른 단어들을 어떻게 활용해야 할지 배우게 됩니다. 이는 GPT가 여러 다른 중요한 일반 지식을 배우도록 사실상 강제합니다.

내가 만들 수 없는 것은, 이해하지 못합니다.

-- 리처드 파인먼

올바른 다음 단어를 예측하려면, 당신은 기본적으로 영어 구문과 문법과 같은 기본 사항 외에도 세계에 대한 일반적인 이해가 필요합니다. 이렇듯 단순히 기사를 예측하는 작업은 GPT가 놀라운 인간과 같은 행동을 학습하게 합니다.

언어 생성 시스템은 기계 학습 분야에서 오랜 역사를 가지고 있으며, GPT는 이 게임에 새로운 것은 아닙니다. 사실, 일부 AI 연구자들은 GPT를 과학적으로 혁신적인 성과라기보다는 인상적인 엔지니어링 성취로 간주합니다. 이는 $4+ 백만 달러를 컴퓨팅 자원에 소모함으로써 얻을 수 있는 것과 얻을 수 없는 것에 대한 중요한 교훈을 가르쳐줍니다.

그렇다면, 판결은 무엇인가요?

OpenAI는 AI 솔루션의 확장이 얼마나 멀리 나아갈 수 있는지를 보여주었습니다. 최대 크기로 확장된 GPT는 인간이 글쓰는 방식을 관찰함으로써 많은 일반 능력을 끌어낼 수 있습니다. 그렇기에 모델에서 상당한 성능을 볼 수 있습니다. 구글은 최근에 GPT-3의 10배 규모로 확장된 스위치 트랜스포머의 버전을 확장했습니다.

이는 많은 AI 연구자들이 경험한 쓴 교훈 으로, 연산과 학습에 의해 이끌려서는 수작업의 인간 노력을 초월합니다. 단순한 생성 프레임워크를 확장함으로써, 우리는 거의 인간처럼 글쓰는 GPT 3를 얻을 수 있습니다.

하지만 GPT 3은 한계가 없지 않습니다. SEO와 콘텐츠 마케팅의 관점에서 이러한 한계를 아는 것은 매우 중요하며, 이는 우리가 어떻게 이 자연어 기술을 활용할 수 있는 것을 영향을 미칩니다.

텍스트 생성의 한계

열악한 세계 모델과 사실성의 정확성

과대선전에도 불구하고, GPT는 우리의 세계를 잘 이해하지 못합니다. 이 세계 모델의 부족을 볼 수 있는 흥미로운 방법은 GPT에게 일반적인 상식 물리학이나 현실 세계와 관련된 어떤 것을 프롬프트하는 것입니다.  OpenAI의 기술 문서에 따르면, "내가 치즈를 냉장고에 넣으면 녹을까요?"와 같은 질문에 대답하기 힘든 것으로 보입니다. 또한, 다른 인간 개념인 말장난도 명백히 이해하지 못합니다.

이 현상의 한 가지 가능한 이유는 AI가 구체화된 인지 가 아니기 때문입니다 - 훈련 데이터에서 여러 번 읽었음에도 불구하고, 역시 냉장고를 제대로 본 적이 없습니다. 만약 당신이 콘텐츠 마케팅을 위해 텍스트 생성을 위해 AI를 맹목적으로 사용한다면, 일부 불일치와 사실적으로 잘못된 항목을 받게 될 것입니다.

원하지 않는 편향

GPT는 웹에 훈련되기 때문에 인터넷 데이터가 제공하는 동일한 편향을 겪습니다. 따라서 GPT를 직접 사용하는 것은 부적절하거나 공격적인 콘텐츠를 생성할 수 있습니다. 이를 완화하기 위한 방법 중 일부는 부적절한 콘텐츠를 거부하는 필터를 포함하는 것입니다. 기계 학습에서 원하지 않는 편향을 줄이는 것은 여전히 활발한 연구 분야입니다.

도메인 적응

GPT가 언어에 대한 일반적인 이해를 학습했지만, 귀하의 도메인에 적합하지 않을 수 있습니다. 최근 연구 에 따르면 GPT 유사 모델을 조정하고 조정하면 훨씬 더 나은 결과를 얻을 수 있습니다.

GPT는 소수의 예시로 작동하지만, 더 많은 데이터를 제공하면 분명 더 나은 결과를 도출할 것입니다. 또한 GPT의 최대 생성 길이도 한계로 작용할 수 있어 긴 문서를 입력으로 사용하는 데 적합하지 않을 수 있습니다.

실용 효율성

아직 결론을 내리기는 이르지만, OpenAI는 프리미엄 가격을 부과할 계획 인 것으로 보입니다. 이 솔루션은 일부 사용 사례에는 비쌀 수 있으며 제공되는 서비스는 SEO를 위해 맞춤화되지 않았습니다. 내부적으로 GPT를 사용하거나 훈련하는 것은 그 엄청난 파라미터 크기 때문에 실용적인 도전입니다.

이 문제는 장기적으로는 덜 걱정할 문제입니다. GPT를 실행하는 더 효율적인 방법들을 가능하게 하는 여러 연구 방향 가 있습니다. 이러한 방향은 최종 비용을 줄일 수 있습니다.

GPT-3 SEO 기회

결국 GPT-3은 강력한 텍스트 생성 시스템입니다 - 그러나 이것이 콘텐츠 마케팅에 대해 의미하는 바는 무엇입니까? SEO를 위한 콘텐츠 마케팅은 여러 단계를 포함합니다. 이는 키워드 연구, 경쟁자 분석, 마지막으로 콘텐츠 생성으로부터 이루어집니다.

우리는 주로 콘텐츠를 생성하기 위해 GPT가 사용되는 것을 봅니다. 그러나 고립된 상태에서 수행할 수 없습니다. 기술의 한계로 인해 알고리즘을 방치하면 뛰어난 결과를 얻지 못하는 것은 자명합니다. 반드시 인간이 개입해야 합니다.

작가가 예술가가 되다

GPT는 사람 작가와 함께 루프에서 사용될 때 최상의 효과를 발휘합니다. 인간 작가는 AI가 할 수 없는 여러 가지 뛰어난 점이 있기 때문입니다. 예를 들어, 인간 작가는 작성할 무엇 인지 파악하는 데 더 좋습니다. AI는 웹사이트의 목록에서 카테고리 페이지를 생성하는 것과 같은 저수준 작업에 매우 능숙한 반면 말입니다.

작업에 많은 노력과 시간이 소요되며, 저수준 문제들인 문법적인 정확성, 어조 및 유창성에 많은 시간을 투자합니다. GPT를 사용하면 인간 작가의 역할은 편집자로 전환됩니다. 캔버스에 넓은 붓질을 하고, AI가 이미지의 세부 사항을 채운 후, 인간이 이 세부 사항들을 완벽하게 만들기 위해 수정하는 듯한 방식입니다.

어떤 면에서 이것은 훌륭합니다. 왜냐하면 작가들은 더 흥미로운 것들에 집중할 수 있기 때문입니다 - 양질의 콘텐츠 아이디어를 구축하고 글쓰기의 더 창의적인 측면에 초점을 맞출 수 있습니다. 이는 카테고리 페이지를 만드는 것보다 낫고, 기사가 최적의 양에 맞게 키워드를 얼마나 많이 삽입할지를 고려하지 않으며, 각 문장이 유창한지를 확인하는 것과 비교해서 더 좋습니다.

인간과 AI를 연결하는 도구

위의 결과적으로, 우리는 인간 작가와 잘 협력할 수 있도록 GPT를 활용하는 훌륭한 사용자 경험과 도구가 필요합니다. 광범위하게 말하자면, GPT 유사 기술을 유용한 콘텐츠 작성 도구로 실현하기 위한 방법이 여러 가지 있습니다. 다음은 여러 도구로 실현된 AI 기술의 몇 가지 예입니다:

가독성 분석

좋은 가독성 는 훌륭한 콘텐츠 개발의 중요한 부분입니다. 이는 사용자가 귀하의 페이지에 머물며 더 많은 시간을 보내도록 도와주며, 이는 Google에서 높은 순위를 차지하는 데 중요한 요소입니다. 그러나 읽기 쉬운 기사를 작성하는 것은 말처럼 쉽지 않습니다.

Jenni에서는 귀하를 위해 작업을 수행할 도구를 개발하였습니다. 우리는 GPT-3와 유사한 기술을 사용했지만, 그것을 자동 문장 재작성용으로 조정하여 더욱 읽기 쉽게 만들었습니다.

스마트 바꾸기

패러프레이징은 원천 자료를 직접 인용하지 않고 사용하는 기술입니다.  다른 자료에서 정보를 가져올 때마다 그 정보의 출처를 명시해야 합니다.

위의 문단은 퍼듀의 정의 에서 패러프레이징됐습니다. 스마트 바꾸기 AI는 어떤 문장을 원본과 다른 방식으로 재작성할 수 있거나, 서로 다른 스타일로 바꿀 수 있습니다.

Jenni에서는 우리의 작가에 대한 연구를 진행하여 바꾸기를 자동화하는 것이 작가의 시간을 최소 30% 절약 할 수 있다는 결과를 찾았습니다. 또한 작가가 문장의 대체 표현을 시도할 수 있게 하여, 원본 글보다 더 매끄럽게 흐르거나 의도를 더 잘 전달할 수 있는 부분검사를 허용합니다.

주제 최적화

많은 SEO 전문가들이 주제 최적화를 사용하여 콘텐츠가 검색 엔진에서 높은 순위를 차지하도록 합니다. 사실, 특정 검색 쿼리에 대해 의미있는 주제를 개발하는 것은 중요하지만, 기사가 모든 주제 요건을 충족하도록 하는 것은 도전적입니다.

우리 편집자들은 1-4시간 수동으로 주제를 최적화하는 데 소요되었습니다. 글이 사실상 주제에 맞는 것을 감지하기 위해 AI 시스템을 사용하면 필요한 경우 수정을 줄일 수 있습니다.

요약

앞서 논의했듯이, AI는 저수준 작업에 능숙하며 요약도 예외는 아닙니다. 콘텐츠 작성과 관련하여 작가들이 수행하는 일반 작업 중 하나는 다른 텍스트를 요약하는 것입니다.

요약 작업은 AI 시스템이 생산 및 상업 시스템에서 잘 수행하는 작업으로 입증되었습니다. 밀도 있는 블록의 텍스트를 읽는 대신, AI가 간결한 요약 리스트를 제공해준다면 어떨까요? 유사한 정신으로 AI를 사용하여 이미 웹사이트를 구축한 경우 색인 또는 카테고리 페이지를 생성할 수 있습니다.

생성된 콘텐츠가 순위에 올릴 수 있을까?

일부 SEO 실무자들은 자동 콘텐츠 생성 사용과 구글에서의 처벌에 대해 우려하고 있습니다.

구글을 비롯한 많은 검색 엔진들은 사용자에게 가장 관련성이 높은 콘텐츠를 제공하고자 합니다. 따라서 생성된 콘텐츠와 관련된 주요 문제는 생성되었다는 점이 아니라, 대개 스팸을 만들려는 의도입니다. 구글은 주장했습니다 정말로 사용자에게 실제 가치를 제공하고 시스템을 조작하는 데 사용되지 않으면, 생성된 콘텐츠는 괜찮다고 합니다.

실제로 Forbes와 같은 많은 대형 뉴스 및 미디어 출처는 이미 콘텐츠 생성 기술을 도움받고 있습니다. 여기서의 핵심은 인간과 인공지능의 장점을 융합하여 매력적인 콘텐츠를 만드는 것입니다. 인터넷에 귀중한 지식을 제공함으로써, 귀하의 콘텐츠가 생성된 일부일지라도 최상위에 랭크될 수 있습니다.

AI와 SEO의 미래

최첨단 AI 모델인 GPT가 출시되면서 과학과 허구의 경계는 계속해서 흐려집니다. 오직 1년 만에 GPT-2와 GPT-3 사이의 품질 개선은 놀랍습니다. 시간이 지나면서, 아침식사 전에 읽던 신문은 아마도 당신이 삶에서 오믈렛을 먹어본 적이 없는 누군가 또는 무언가 에 의해 작성될 가능성이 더 큽니다.

우리는 이러한 이유로 AI 기술에 대한 깊은 이해를 아는 것이 중요하다고 믿습니다, 단순한 과대선전이 아니라는 점입니다. SEO 분야에 있지 않은 사람들은 AI의 발전에 감명받을지도 모르지만, SEO 분야에 있는 사람들과 콘텐츠를 작성하는 사람들은 이러한 도구를 적응해야 최고의 자리를 지킬 수 있습니다.

Profile Picture of Henry Mao

Co-Founder/CTO

Graduated with a Bachelor's Degree in Computer Science and a Master's in Science

오늘 제니와 함께 글작성을 시작하세요

오늘 무료 Jenni AI 계정에 가입하세요. 당신의 연구 잠재력을 열어보고 그 차이를 직접 경험해보세요. 학문적 우수성을 향한 당신의 여정은 여기에서 시작됩니다.