공공정책 위키(Public Policy Wiki)에 오신 것을 환영합니다


공공정책 위키 시작하기

사용자토론:푸른하늘

Public Policy Wiki
푸른하늘 (토론 | 기여)님의 2024년 12월 15일 (일) 22:49 판
둘러보기로 이동 검색으로 이동

ChatGPT

1. 선정배경

ㅇ Open AI가 개발한 ChatGPT가 사람이 원하는 것에 대해 사람이 만든 비슷한 결과물을 제공하면서 그 ‘성능’과 '범용성'에 대해 많은 사람의 관심을 끌고 있고, 과연 ChatGPT가 어떤 정책과 기준에 의해 어떻게 어디까지 진화될 수 있을지 등 많은 화제를 불러일으키고 있으며, 작성자의 잠정 논문연구 주제인 빅테이터(Big Data)와 인공지능(Artificial Intelligence)과도 연관이 있어서 주제로 선정하게 되었습니다.

1-1. 오픈 AI (OPen AI)

ㅇ 설립일 : 2015년 12월 11일
ㅇ 소속 국가 : 미국
ㅇ 설립자 : 샘 올트먼, 일론 머스크, 그렉 브록만 등
ㅇ 경영진 (2024년 11월 30일 기준)
   - CEO : 샘 올트먼 (2015년~ )
   - CFO : 세라 프라이어 (2024년~ )
   - COO : 브래드 라이트캡[3] (2022년~ )
   - CPO : 케빈 웨일 (2024년~ )
   - 사장 : 그렉 브록만 (2015년~ )
   - 수석 : 과학자 제이컵 파호츠키 (2024년~ )
ㅇ 이사회
   - Chairman : 브렛 테일러 (2023년~ )
ㅇ 법인 형태 : 비영리 단체
ㅇ 산업 분류 : IT
ㅇ 상장 거래소 : 비상장 기업 (2024년 11월 30일 기준)
ㅇ 기업 가치 : 1,570억 달러(약 225조) - 2024년 10월 기준
ㅇ 매출 : 13억 달러(약 1조8,670억원) - 2023년 추정치
ㅇ 주소 : 미국 캘리포니아 샌프란시스코 파이오니어 빌딩

2. 대중 공개 당시 현상 및 평가

ㅇ ChatGPT가 혜성처럼 등장하기 전까지 사람들은 인공지능(AI,
   Artificial Intelligence)에 대해 관심이 낮았고, 회의적이었음 
ㅇ 2022년 11월 30일 요란한 광고 없이 조용하게 ChatGPT를
   공개한 오픈AI(Open AI) 기업은 큰 기대를 하지 않았음
ㅇ 오픈AI 직원 중 누구도 ChatGPT가 이렇게 입소문을 타면서
   엄청난 인기를 누릴 줄은 몰랐고 이런 상황에 대비하지도
   못했다고 함 
ㅇ 오픈AI에서 정책을 연구하는 산디니 아가왈(Sandhini Agarwal)은 사내에서 ChatGPT를 ‘연구 미리보기’ 정도로 간주했다고 말함
ㅇ ChatGPT는 2022년 11월 출시한 대형언어모델(Large Language Model) GPT-3.5를 조금 다듬어서 내놓은 ‘맛보기’ 버전에 가까웠고 더 중요하게는 대중의 피드백을 수집해서 대형언어모델의 결함을 일부 해결하려는 시도였음 
ㅇ ChatGPT 개발에 참여한 오픈AI의 과학자 리엄 페두스(Liam Fedus)는 ‘우리는 ChatGPT가 대단히 근본적인 발전인 것처럼 과대평가하고 싶지 않았다’라고 말함

3. 중요성

ㅇ 인공지능(AI) 기술의 발전과 그 실질적 활용을 보여주는 대표적인 사례로 ChatGPT의 중요성이 다양한 분야로   
   지속적으로 확대 및 발전될 가능성이 커지고 있음
ㅇ ChatGPT는 단순한 도구를 넘어, AI와 인간의 상호작용
   방식을 혁신적으로 변화시키고 있음 
ㅇ ChatGPT는 더 나은 의사결정과 문제해결을 가능하게 함

3.1 ChatGPT의 중요성

ㅇ 사용자와 AI 간의 자연스러운 인터페이스
   - ChatGPT는 사람과 유사한 자연스러운 대화를 가능하게 하며
    복잡한 명령어나 기술적 지식 없이도 쉽게 사용할 수 있음
   - 비전문가도 AI 기술을 일상적으로 활용할 수 있게 되어
ㅇ 다목적 도구로의 활용
   - 생산성 향상 : 글쓰기, 요약, 번역, 데이터 분석 등의
       작업에서 시간을 절약할 수 있음
   - 교육 지원 : 복잡한 개념을 쉽게 설명하고 학습 자료를
       생성하는 데 도움을 줌
   - 창의성 도구 : 아이디어 브레인스토밍, 스토리 작성 등
       창의적인 작업에도 활용됨
ㅇ 기술 발전의 촉진
   - ChatGPT는 자연어 처리(NLP)와 생성 AI 기술의 발전을
       상징하며, 다른 기술과 서비스(예: Codex, DALL-E)에도
       영감을 주었음
   - 다양한 산업(의료, 교육, 비즈니스, 고객 서비스 등)에서 
       AI가 혁신적인 변화를 이끌고 있음
ㅇ 인간-기계 협업의 새로운 가능성
   - AI가 단순히 명령을 따르는 수준을 넘어, 인간의 작업을
       보완하고 협업하는 새로운 방식으로 자리 잡았음
   - 사례로 코딩 보조, 문서 작성 지원 등 전문 분야에서도 
       활용 가능성을 열어주었음
ㅇ 사회적, 경제적 영향
   - 사회적 영향 : ChatGPT는 사람들의 일상생활을 개선하고, 
     AI 윤리와 책임감 있는 사용에 대한 논의를 활성화했음
   - 경제적 영향 : 기업들이 비용을 절감하고, 고객 경험을     
     개선하며, 혁신적인 비즈니스 모델을 구축하도록 
     지원하고 있음
ㅇ AI 기술 접근성 향상
   - 과거에는 AI 기술이 전문가들만의 영역이었으나, 
     ChatGPT는 누구나 쉽게 사용할 수 있는 형태로 제공되어
  더 많은 사람이 AI 기술을 접하고 활용할 수 있게 됨

4. 개념 및 원리

ㅇ ChatGPT는 Open AI가 개발한 GPT(Generative Pre-trained Transformer) 기반 대화형 인공지능 챗봇으로 ChatGPT는 Chat과 GPT의 합성어임
ㅇ ChatGPT는 대형언어모델(LLM, Large Language Model)인
   GPT-3를 조금 다듬어서 내놓은 ‘맛보기’ 버전에 가까웠고, 
   더 중요하게는 대중의 피드백을 수집해서 대형언어모델의 
   결함을 해결하려는 시도였음
ㅇ ChatGPT는 2022년 11월 30일에 GPT-3.5 엔진 기반의
   베타 버전을 공개함 
ㅇ ChatGPT는 파이썬 프로그래밍 언어를 사용하고 있음
ㅇ ChatGPT의 주요 기능
   - 자연어 처리(NLP)
     · 인간 언어를 이해하고 해석하여 자연스러운 대화를 
       가능하게 함
   - 맥락 인식 응답
     · 대화의 맥락을 고려하여 관련성 높은 답변을 제공
   - 창의성과 유머
     · 문법적으로 올바른 응답 외에도 창의적이고 유머러스운
       내용을 생성할 수 있음
   - 다국어 지원
     · 여러 언어로 소통할 수 있는 능력을 갖추고 있음
   - 개인화
     · 사용자의 선호에 따라 맞춤형 응답을 제공할 수 있음
ㅇ ChatGPT는 실시간적인 피드백 정도는 가능하지만,
   학습이 필요하여 실시간적으로 검색하는 것도 아니며, 
   학습된 사전 자료를 패턴화한 뒤 이를 최대한 빠르게 짜깁기해
   생성하는 원리이기에 이를 지능에 의한 결과물이라고 할 수는
   없음
ㅇ ChatGPT의 세 단계 학습 원리
   - 지도 학습
     · 사람의 피드백을 기반으로 인공지능 모델을 학습시킴
     · 사람이 직접 작성한 정답을 바탕으로 초기 대화 데이터를
       수집하고, 이를 통해 ChatGPT의 초기 버전을 구축함
   - 보상 모델 학습
     · 초기 모델이 생성한 여러 응답 중에서 사람이 선호하는
       응답을 평가하여 데이터셋을 구축
     · 이를 통해 보상 모델을 학습합니다. 이 모델은 사람이 
       더 나은 응답을 선택할 수 있도록 함
   - 강화 학습
     · 강화 학습 기법(PPO)을 활용하여 ChatGPT의 성능을
       향상시킴
     · 보상 모델의 피드백을 받아 ChatGPT가 점진적으로 
       더 나은 답변을 생성하도록 유도함
ㅇ ChatGPT의 주요 활용 사례
   - 비즈니스
     · 이메일 작성, 보고서 요약, 프레젠테이션 준비
   - 교육
     · 학습 자료 생성, 개념 설명, 언어 학습
   - 개발 및 기술 지원
     · 코드 디버깅, 알고리즘 설계, 기술 문서 작성
   - 일상적 도움
     · 여행 계획, 요리 레시피

4-1. GPT(Generative Pre-trained Transformer)

 ㅇ GPT는 인간처럼 대화하고 다양한 주제에 답변할 수 있도록  
    설계된 인공지능 모델
   - Generative: 새롭고 유의미한 텍스트를 생성하는 능력
   - Pre-trained: 사전 학습된 모델
   - Transformer: AI 모델의 아키텍처 유형으로, 텍스트에서 문맥을  
     이해하고 처리하는 인코더와 디코더로 이루어져 있음

4-2. GPT의 주요 버전

 ㅇ GPT-1
   - 2018년 6월 출시
   - 첫 번째 모델로, 언어 모델의 가능성을 입증
   - 1억 1천 7백만 개의 파라미터.
 ㅇ GPT-2
   - 2019년 2월 출시
   - 더 큰 데이터와 15억 개의 파라미터로 성능 향상
   - 자연스러운 텍스트 생성 능력으로 주목 받음
   - 공개 당시 악용 가능성 우려로 일부 제한적 공개
 ㅇ GPT-3
   - 2020년 6월 출시
   - 1750억 개의 파라미터로 성능 대폭 향상
 ㅇ GPT-3.5 
   - 2022년 11월 출시
   - 1,750억 개의 파라미터로 성능 대폭 향상
   - GPT 시리즈 중 최초로 대중에 성공적 공개(ChatGPT)
   - 훈련데이터 : 2021년 6월 이전 데이터
   - 대화 기억 : 최대 3,000개 처리
   - 언어 지원 : 영어
 ㅇ GPT-4
   - 2023년 1월 출시
   - 파라미터 수 미공개
   - 멀티모달 입력(텍스트와 이미지) 처리 가능
   - 더 높은 이해력, 추론 능력, 창의적 생성 능력 제공
   - 훈련데이터 : 2021년 9월 이전 데이터
   - 대화 기억 : 최대 25,000개 처리 
   - 언어 지원 : 한국어 포함 26개국 언어 지원

4-3. 대형언어모델(LLM, Large Language Model)

 ㅇ 대규모 언어 모델(LLM)은 방대한 양의 데이터로 사전 학습된 
    초대형 딥러닝 모델임
 ㅇ 기본 트랜스포머는 셀프 어텐션(Self-attention) 기능을 갖춘 
    인코더와 디코더로 구성된 신경망 세트임
   - 인코더
     데이터를 입력받아서 분석하는 역할을 하며
     자연어 처리 모델에서는 텍스트를 입력받아 해당 텍스트의
     문맥적 정보, 문장의 의미, 구조를 분석하는 데 특화되어 있음
     즉, 인코더는 문장 분류, 문서 요약, 질의 응답, 정보 검색과
     같은 작업에서 효과적인 능력을 발휘함
   - 디코더
     디코더는 인코더에서 분석한 정보를 바탕으로 새로운
     텍스트나 데이터를 생성하는 역할을 하고 있고
     특히, 언어생성 작업에서 강력한 기능을 발휘하며
     기계 번역, 텍스트 생성, 대화형 AI, 코드 자동 생성과 같은
     분야에서 주로 사용됨

4-4. 파이썬(Python)

 ㅇ 1991년 네덜란드계 소프트웨어 엔지니어인 귀도 반 로섬이 
    발표한 고급 프로그래밍 언어
   - '인터프리터를 사용하는 객체지향 언어'이자 플랫폼에 독립적인
     동적 타이핑(Dynamically typed) 대화형 언어
   - 파이썬이라는 이름은 귀도가 좋아하는 코미디인인 Monty
     Python's Flying Circus에서 따옴
   - 파이썬(Python) 이름에서 고대신화에 나오는 커다란 뱀을
     연상하기도 하겠지만 이와는 무관하며 다만, 파이썬 로고에는
     뱀 두마리가 형상화되어 있음
   - 파이썬은 간결하고 읽기 쉬운 문법이 특징인 프로그래밍
     언어로 데이터 분석, 웹 개발, 인공지능 등 다양한 분야에서
     활용됨
   - 파이썬은 비영리 파이썬 소프트웨어 재단이 관리하는 개방형,
     공동체 기반 개발 모델임


5. 이용 정책

 ㅇ 콘텐츠 정책 위반 내용을 암시하는 내용을 ChatGPT가
    감지하면 콘텐츠 정책을 위반한 것 같은데 이의가 있으면
    연락하라는 메시지를 뜨움
 ㅇ 경미한 정도라면 내용이 주황색 글씨로 바뀌면서 하단에 
    정책 위반 메시지가 뜸
 ㅇ 위반 정도가 심하면, 아예 메시지만 남기고 사용자의 질문이나
    ChatGPT가 출력한 대답 모두의 내용을 모조리 지워버림

5.1 콘텐츠 정책 위반 내용

 ㅇ 불법 활동
   - 오픈AI는 자사의 모델, 도구 및 서비스를 불법적인 활동에
     사용하는 것을 금지
 ㅇ 아동 성학대 자료 또는 아동을 착취하거나 해를 끼치는 
    모든 콘텐츠
   - 오픈AI는 아동 성 학대 자료를 미국 실종 및 착취 아동
     센터에 신고함
   - 가상 콘텐츠라면 신고는 안 하더라도 부정적으로 표현함
 ㅇ 혐오, 괴롭힘 또는 폭력적인 콘텐츠의 생성
   - 신분에 기반한 증오를 표현, 선동 또는 조장하는 콘텐츠,
     개인을 괴롭히거나 위협하거나 약자를 학대하는 콘텐츠,
     폭력을 조장하거나 미화하거나 타인의 고통이나 굴욕을
     찬양하는 콘텐츠 등. 이 부분의 검열이 심해서 고블린을
     죽인다든지, 심지어 억압을 부숴버린다는 식의 은유조차 
     이런 콘텐츠로 오인하며 경고 메시지가 표출됨
 ㅇ 멀웨어 생성
   - 컴퓨터 시스템을 방해하거나 손상시키거나 무단으로
     액세스하도록 설계된 코드를 생성하려고 시도하는 콘텐츠
 ㅇ 신체적 상해의 위험이 높은 활동
   - 무기 개발, 군사 및 전쟁 관련, 에너지·교통·수도 등 
     중요 인프라의 (직접적인) 관리 또는 운영, 자살·자해·
     섭식 장애 등 자해 행위를 조장·장려 또는 묘사하는 콘텐츠 등
 ㅇ 경제적 피해의 위험이 높은 활동
   - 다단계 마케팅, 도박, 페이데이론, 신용·고용·교육 기관 또는
     공공 지원 서비스에 대한 자격 자동 결정 등
 ㅇ 사기 또는 기만적인 행위
   - 사기, 조직적인 부정 행위, 표절, 학문적인 비리, 가짜 풀뿌리
     지원 또는 가짜 리뷰 작성과 같은 아스트로터핑, 허위 정보,
     스팸, 유사 의약품 등
 ㅇ 성인용 콘텐츠, 성인 산업 및 데이트 앱
   - 성행위에 대한 묘사 등 성적 흥분을 유발하거나 성적인
     서비스를 홍보하는 콘텐츠(성교육 및 건강 관련 내용 제외), 
     음란 채팅, 포르노그래피 등
 ㅇ 정치 캠페인 또는 로비
   - 대량의 캠페인 자료 생성, 특정 인구 통계에 맞춤화되거나
     이를 대상으로 하는 캠페인 자료 생성, 캠페인에 대한 정보를
     제공하거나 정치적 옹호 또는 로비에 관여하는 챗봇과 같은
     대화형 또는 대화형 시스템 구축, 정치 캠페인 또는 로비
     목적의 제품 구축 등
 ㅇ 사람들의 개인정보를 침해하는 활동
   - 개인의 동의 없이 개인을 추적하거나 모니터링하는 행위,
     개인의 얼굴 인식, 보호되는 특성에 따라 개인을 분류하는
     행위, 식별 또는 평가를 위해 생체 인식을 사용하는 행위,
     개인 식별 정보 또는 교육·재무 또는 기타 보호되는 기록을
     불법적으로 수집 또는 공개하는 행위 등
 ㅇ 자격을 갖춘 사람의 검토 없는 무단으로 법률 행위를 하거나
    맞춤형 법률 자문을 제공하는 행위
   - 오픈 AI의 모델은 법률 자문을 제공하도록 
     미세 조정되지(Fine-tuned) 않아, 오픈 AI의 모델을 
     법률 자문의 유일한 출처로 의존해서는 안 됨
 ㅇ 자격을 갖춘 사람의 검토 없는 맞춤형 재무 조언 제공
   - 오픈 AI의 모델은 재무 자문을 제공하도록 미세 조정되지
     않았음
   - 이 모델을 재정 자문의 유일한 출처로 사용해서는 안 됨
 ㅇ 특정 건강 상태를 진단하거나 치료 지침 제공
   - 오픈 AI의 모델은 의료 정보를 제공하도록 미세 조정되지 
     않았음
   - 심각한 건강 상태에 대한 진단 또는 치료 서비스를 제공하기
     위해 당사 모델을 사용해서는 안 됨
   - 즉각적인 조치가 필요한 생명을 위협하는 문제를 분류하거나
     관리하는 데 OpenAI의 플랫폼을 사용해서는 안 됨
 ㅇ 고위험 정부 의사결정
   - 법 집행 및 형사 사법, 이주 및 망명 등

6. 한계

 ㅇ 실시간 학습 불가
   - ChatGPT 3.5는 실시간으로 데이터를 학습할 수 없음
   - 2021년 6월까지의 데이터만 학습했음
 ㅇ 논리력 부족
   - 복잡한 논리적 추론이나 상식적인 이해에 제한이 있음
 ㅇ 환각(Hallucination)
   - 비현실적이거나 잘못된 정보를 생성할 수 있음
 ㅇ 기억력 제한
   - 대화 중 약 3,000개의 단어만 기억할 수 있어 긴 대화에서
     일관성을 유지하기 어려움
 ㅇ 편향성
   - 학습 데이터에 기반한 편향된 응답을 생성할 수 있음 

7. 발전 방향

 ㅇ 정확성 향상
     - 사용자 요청에 대한 응답의 질을 높이는 것
 ㅇ 자연스러운 대화 능력과 문맥 파악 능력 향상
     - 더 나은 대화 품질을 제공할 것
 ㅇ 사용자 개개인의 성향과 요구에 맞춘 서비스를 제공
     - 맞춤형 경험 제공 
 ㅇ 다국어 지원
 ㅇ 문화적 이해를 강화하여 글로벌 커뮤니케이션을 지원
 ㅇ 윤리적 AI와 신뢰성 측면에서의 발전

8. 경쟁 상대

 ㅇ 구글의 바드(BARD)
    - ChatGPT의 대항마로 내세운 구글의 생성 AI 챗봇
    - 대규모 언어 모델 람다(LaMDA)를 기반으로 탄생
    - 2023년 3월 베타 버전으로 첫 공개
    - 2023년 5월 영어, 한국어, 일본어로 이용할 수 있는 
      안정화 버전으로 전 세계 180개국에 전격 출시
    - 바드 (무료) : 실시간 정보 획득
      * GPT-3.5 (무료) : 실시간 정보 획득 불가능
      * GPT-4 (유료) : 유료 구독과 함께 웹브라우징 기능을
         적용해야 실시간 정보 획득 가능
 ㅇ xAI의 그록(Grok)
    - xAI는 일론 머스크 테슬라 최고경영자(CEO)가 설립한 
      인공지능(AI) 기업
    - 그록2(Grok2)은 2024년 12월 14일 X 계정을 통해 
      ‘그록이 이제 모두에게 무료’라며 발표
    - 그록2(Grok2)은 이전보다 3배 더 빠르고 정확성과 
      지시 수행 능력, 다국어 기능이 대폭 개선 되었음
    - 이미지 생성기 오로라(Aurora)를 포함한 새로운 기능들이
      추가 되었음
    - 사용자들은 X 메뉴에서 그록 아이콘을 눌러 대화창에 
      접속할 수 있음
    - 질문을 통해 다양한 정보를 제공받을 수 있음
    - 무료 사용자에게는 2시간마다 최대 10개 질문으로 제한
    - 그록의 새로운 기능으로는 웹 검색과 인용 기능
    - 사용자 정보를 활용해 프로필 이미지를 생성하는
      ‘나를 그려줘(Draw me)’ 기능
    - X 게시물의 배경 정보를 요약해 주는 ‘그록 버튼’ 있음
    - xAI는 구글, 오픈AI 등의 AI 서비스와 경쟁할 수 있는
      차별화된 사용자 경험을 제공하겠다는 목표 제시
    - 그록2(Grok2)는 무료화로 모든 사용자에게 AI 기술을 
      경험할 기회를 제공
    - xAI가 오픈AI, 구글 등 기존 선두 기업에 도전장을 내밀고
      AI 시장에서의 입지를 강화할 예정