로딩중 . . . 짐을 실은

GPT-4: 새로운 ChatGPT에 대해 알아야 할 사항

채팅GPT OpenAI

사실 확인 보장 (참고자료): [공식 문서: 1 소스] [동료 심사 연구 논문: 1 소스] [학술 웹사이트: 1 소스]

 | 으로 리처드 아헌 - 작년에 ChatGPT는 현존하는 가장 진보된 AI 챗봇 중 하나로 세상을 불태웠지만 이제 Elon Musk의 OpenAI는 다시 한번 기준을 높였습니다.

2022년 XNUMX월에 출시된 Open AI의 챗봇 ChatGPT에 대한 흥분을 경험하셨을 것입니다.

기술 회사들이 신제품을 "차세대 대작"으로 자주 선전하는 동안 Open AI의 GPT 대규모 언어 모델 그룹은 모든 곳에서 주목을 받았습니다.

표면적으로는 컴퓨터가 상대방에게 말을 걸어주는 문자 기반의 메신저 서비스였다. 청각적으로 말하거나 시각적인 피드백을 생성하지 않았습니다. 단지 텍스트를 읽고 내뱉을 뿐입니다.

그렇다면 사람들은 왜 그것에 열광했을까?

그것은 삶을 더 쉽게 만들었기 때문에 일을 완수하고 잘 해냈습니다. 그러나 물론 용도에 따라 다릅니다. 그것은 당신을 위해 빨래를 하거나 요리를 하지는 않을 것입니다 — 하지만 그것은 당신에게 괜찮은 레시피 아이디어를 줄 것입니다!

그러나 작가와 코더에게는 그것이 빛나는 곳이며 어떤 언어로든 컴퓨터 프로그램을 작성하도록 요청하면 꽤 인상적인 작업을 수행합니다.

그 고유성은 매우 단순하거나 불분명한 지침을 제공할 수 있는 방식에 있으며 종종 빈칸을 채우고 올바른 가정을 합니다.

작가의 경우 텍스트 덩어리를 복사하여 붙여넣고 한 단락으로 요약하도록 요청할 수 있습니다. 문제 없습니다. 기본 맞춤법 및 문법 검사기로 사용할 수 있지만 이는 기능을 낭비하는 것입니다. 하이엔드 AI 작문 도우미와 마찬가지로 실수를 수정하고 명확성을 향상시킬 뿐만 아니라 전체 글을 다시 쓰거나 처음부터 전체를 쓰도록 요청할 수도 있습니다(게으른 경우).

우리가 잊지 않도록…

부정 행위와의 전쟁에서 새로운 웜 캔을 열었기 때문에 교사와 시험관에게는 음울한 악몽이었습니다. 그러나 물론 OpenAI가 표준 학교 시험을 제공하여 GPT를 테스트하고 아래에서 볼 수 있듯이 놀라운 결과를 얻은 것은 도움이 되지 않습니다.

그 힘을 진정으로 이해하려면 직접 실험해야 하지만 전체적으로 출력 품질이 인상적입니다. 주로 한두 문장이 아니라 확장되고 상세한 콘텐츠를 생성할 수 있기 때문입니다.

그러나 그것은 단지 GPT-3.5였습니다…

어제 뉴스가 깨졌습니다. GPT-4 준비 완료, 완전히 새로운 괴물입니다.

첫째, 기술 커뮤니티가 간절히 원했던 텍스트뿐만 아니라 이미지 콘텐츠도 처리할 수 있는 것으로 알려졌습니다. 안전은 GPT-4의 초점인 것으로 보이며 "허용되지 않은 콘텐츠에 대한 요청에 응답할 가능성이 82% 적습니다."

한마디로 크다...

GPT는 큰 언어 모델 — 그들은 언어에 대한 거대한 데이터 세트를 받고 확률을 사용하여 단어의 순서를 예측합니다. 프로그램은 언어 구조에 대한 수십억 개의 매개변수를 검사하여 단어 또는 단어 집합을 살펴보고 뒤에 오는 단어의 확률을 계산한 다음 가장 가능성이 높은 것을 선택합니다.

예를 들어, “I ran up the…

직관적으로 우리는 "개"와 "공"이 의미가 없다는 것을 알고 있지만 "계단"과 "언덕"은 모두 실행 가능한 선택입니다. 그러나 딥 러닝 프로그램에는 인간의 직관이 없습니다. 그것은 많은 양의 텍스트를 보고 "I ran up the ..." 문장 다음에 나오는 각 단어의 확률을 계산합니다.

"개"와 "공"이 해당 문장 뒤에 나오는 횟수가 0.001% 미만이고 "계단"이 해당 단어를 따를 확률이 20%이지만 "언덕"이 나올 확률이 21%라고 가정해 보겠습니다. 따라서 기계는 "언덕"을 선택하고 "I run up the hill"을 출력합니다.

잘못되었을 수 있습니까? 물론 맞을 확률이 높지만 데이터가 많을수록 정확할 것입니다.

그렇게 간단하지 않습니다. 모델에 데이터가 있으면 인간 검토자가 정확도를 테스트하고 미세 조정하며 "환각"(잘못된 단어를 선택하는 무의미한 쓰레기를 생성하는 경향)을 최소화합니다!

GPT-4는 파라미터의 정확한 수는 공개되지 않았지만 아직까지 가장 큰 모델입니다. 이전에 GPT-3는 GPT-100보다 2배 이상 컸으며 GPT-175의 2억 매개변수에 대해 1.5억 매개변수가 있었습니다. GPT-4에서도 비슷한 증가를 가정할 수 있습니다. 또한 프로그램이 다음을 사용하여 집중적으로 미세 조정되었음을 알고 있습니다. 강화 학습 인간의 피드백에서. 여기에는 인간에게 챗봇의 응답을 평가하도록 요청하는 것이 포함되며 이러한 점수는 더 나은 결과를 생성하도록 "가르치기" 위해 피드백됩니다.

Open-AI는 GPT-4에 대해 "경쟁 환경과 안전 영향 모두"를 언급하면서 비밀을 유지해 왔습니다. 따라서 정확한 모델 크기, 하드웨어 및 교육 방법은 모두 알 수 없습니다.

그들은 이렇게 말했습니다.

“GPT-4는 더 넓은 일반 지식과 문제 해결 능력 덕분에 어려운 문제를 더 정확하게 풀 수 있습니다.” GPT-82보다 금지된 콘텐츠에 대한 요청에 응답할 가능성이 3.5% 적고 꾸며낼 ​​가능성이 60% 적습니다.

무서운 부분은 다음과 같습니다.

GPT-4는 학교 시험에서 대부분의 인간 시험 응시자와 GPT-3.5보다 훨씬 더 나은 결과를 보였습니다. 예를 들어, 통일 변호사 시험(법률)에서 상위 90%에 해당하는 점수를 받은 반면, GPT-3.5는 하위 10번째 백분위수에 해당하는 초라한 점수를 받았습니다. AP 통계, AP 심리학, AP 생물학 및 AP 예술사(영국의 A 수준 등가물)에서 GPT-4는 80~100백분위수 사이의 점수를 얻었습니다. 즉, 때때로 모든 사람을 이겼습니다!

모든 것이 좋은 것은 아닙니다.

흥미롭게도, 그것은 영문학 및 작문에서 가장 열악(8-22 센타일)했으며 미적분(43-59 센타일)에서 더 인상적일 수 있었습니다.

Twitter에서 일부 사람들은 GPT-4가 냅킨에 휘갈겨 쓴 웹 사이트 개요를 완전한 기능을 갖춘 온라인 애플리케이션으로 바꾸는 방법을 시연했습니다.

전반적으로 OpenAI는 GPT-4의 중요한 개선 사항으로 향상된 정확도와 안전성을 강조했습니다. 예를 들어 폭탄을 만드는 방법을 묻는 사용자에게 응답할 가능성이 훨씬 적습니다. 또한 약 25,000단어에 비해 1,500단어를 처리하여 이전 버전보다 훨씬 더 긴 콘텐츠를 처리할 수 있습니다.

OpenAI에 따르면 GPT-4는 이전보다 더 "창의적"이라고 선전되었습니다.

마지막으로 아마도 가장 큰 것은 이미지의 내용을 분석하고 분류할 수 있는 "비전"이 있다는 것입니다.

AI가 도래했고, 그 진화가 스릴을 느끼든 무섭든, 그것이 여기 남아 있다는 사실을 부인할 수 없습니다. 일부는 교체에 대해 걱정할 수 있지만 잠재력을 수용하는 사람들은 사용 가능한 가장 강력한 도구로 휘두를 것입니다.

우리는 당신의 도움이 필요합니다! 우리는 당신에게 무수정 뉴스를 제공합니다 무료, 그러나 우리는 다음과 같이 충성스러운 독자들의 지원 덕분에 이것을 할 수 있습니다. 당신! 언론의 자유를 믿고 실제 뉴스를 즐기는 경우 후원자가 되다 또는 여기에 일회성 기부. 의 20의 % 모든 재향 군인에게 기금이 기부됩니다!

이 기사는 우리 덕분에 가능합니다. 후원자와 후원자 여러분!

토론에 참여하세요!
확인
통보
0 코멘트
인라인 피드백
모든 댓글보기
0
의견을 부탁드립니다.x