주요 메뉴 바로가기 (상단) 본문 컨텐츠 바로가기 주요 메뉴 바로가기 (하단)

일론 머스크의 AI ‘그록’, 챗GPT 표절 논란돼

박진수 에디터 조회수  

일론 머스크가 야심 차게 출시한 인공지능(AI) 챗봇 ‘그록(Grok)’이 표절 논란에 휩싸였다. 그록을 훈련할 때 업계에서 가장 인지도가 높은 오픈AI(OpenAI)의 텍스트 기반 생성형 AI 챗봇 ‘챗GPT(ChatGPT)’ 관련 데이터가 사용됐을 가능성이 제기됐다.

그록이 오픈AI 이용 약관을 언급한 모습 (출처 : 엑스 @JaxWinterbourne)

잭스 윈터본이라는 보안 연구원은 그록이 사용자 요청을 거부한 스크린샷을 12월 8일(현지시간) 자신의 엑스(X) 계정에 공유했다. 스크린샷에서 그록은 “오픈AI의 이용 사례 정책에 어긋나므로 사용자 요청에 응답할 수 없다”라고 답변했다.

오픈AI와 무관한 ‘그록’, 왜 오픈AI를 언급했을까

그록은 일론 머스크가 올해 3월 설립한 AI 스타트업 ‘xAI’가 개발한 챗봇이다. 당연히 오픈AI와는 아무 연관이 없다. 그런데 그록이 사용자 요청을 거부하며 내놓은 답변에 xAI가 아닌 오픈AI가 난데없이 언급됐다. 일각에서는 그록을 개발할 때 오픈AI 자료나 챗GPT를 구성하는 소스 코드를 참조하거나 표절한 게 아니냐는 의혹을 제기했다.

잭스 윈터본은 그록을 개발할 때 오픈AI의 API(애플리케이션 프로그래밍 인터페이스)가 사용됐을 가능성이 높다고 주장했다. 소식을 접한 다른 사용자도 동의하는 분위기다.

일각에서는 오픈AI가 사용한 훈련 데이터 세트나 챗GPT와 관련된 데이터가 그록 훈련에 영향을 끼쳤을 것으로 분석했다. 한 사용자는 챗GPT와 그록에게 동일한 질문을 했더니 비슷하게 답변했다고 주장했다.

잭스 윈터본은 xAI가 어떻게 대응할지도 예상했다. 그는 xAI가 “오픈소스 대형 언어 모델(LLM)로 그록을 훈련했기 때문에 오픈AI가 언급된 답변이 나올 수 있다”라고 대응할 것이라며, 이 같은 답변을 제시한다면 그록은 기존 챗봇과 동일한 원리와 데이터로 구동되는 ‘아주 훌륭한 서비스’라고 비꼬았다.

xAI 해명, “챗GPT 답변이 훈련 데이터에 포함돼 문제 발생”

그록 기능을 구축하는 모습 (출처 : xAI)

논란이 일자 그록을 개발한 xAI의 공동 창업자 이고르 바부슈킨(Igor Babuschkin)이 입을 열었다. 그는 온라인에 있는 데이터를 모아 그록 훈련에 사용하는데, 온라인에 챗GPT가 작성한 답변이 너무 많은 나머지 실수로 해당 내용을 훈련 데이터에 포함했다고 해명했다.

챗GPT가 사용자 요청을 거부한 내용이 그록을 훈련할 때 사용한 텍스트 데이터에 포함됐고, 이를 학습한 그록이 부적절한 사용자 요청에 챗GPT와 똑같이 답변했다고 풀이된다.

그는 그록을 개발하는 데 오픈AI의 코드를 사용하지 않았으며, 앞으로 그록에서 같은 문제가 발생하지 않도록 조치하겠다고 덧붙였다.

AI 연구원 사이먼 윌리슨은 이고르 바부슈킨의 해명이 의심스럽다고 지적했다. 그는 오픈AI의 API를 사용해 개발했거나 챗GPT 서비스에서 긁어모은 데이터 세트로 훈련한 AI 모델은 모두 이번 사례와 같이 챗GPT처럼 답변했다고 주장했다. 그는 그록이 온라인에 공개된 데이터가 아니라 챗GPT가 답변한 내용을 포함한 데이터 세트로 훈련했을 가능성이 높다고 언급했다.

챗GPT가 답변한 내용을 훈련에 사용해도 괜찮을까. 소식을 보도한 해외 IT 매체 아르스테크니카(Ars Technica)는 최근 다른 AI가 만든 데이터로 자사 AI를 훈련하는 게 관행처럼 자리잡았다고 전했다.

매체는 챗GPT 답변을 모아 만든 데이터를 온라인에서 쉽게 찾을 수 있으며 챗GPT로 훈련용 데이터 세트를 생성하는 방법이 기사화된 적도 있다고 덧붙였다. 단, 이런 행위는 서비스 이용 약관에 위배된다. 오픈AI는 챗GPT로 만든 결과물을 경쟁사의 AI 모델 훈련에 사용하면 안 된다고 챗GPT 이용 약관에 명시했다.

xAI, 훈련용 데이터 내용 신경 써서 관리해야

정황상 그록을 훈련할 때 오픈AI와 관련 있는 데이터가 사용됐을 가능성은 높다. 이고르 바부슈킨이 해명한 대로 온라인에서 훈련용 데이터를 수집하다 챗GPT 답변 내용이 흘러 들어갔을 수도 있고, 그록을 개발할 때 오픈AI API를 사용했거나 약관을 위반하고 챗GPT 데이터로 훈련했을 가능성도 있다.

한 업계 관계자는 xAI가 훈련용 데이터 세트를 준비하면서 오픈AI나 챗GPT가 직접 언급된 내용을 제대로 거르지 못해 이번 사건이 일어났다고 지적했다.

한편 챗GPT 측은 잭스 윈터본이 공유했던 그록 답변 스크린샷을 10일 엑스(X)에 게시하면서 “우린 공통점이 많다”라고 비꼬았다. 이에 일론 머스크는 “챗GPT를 훈련할 때 이 플랫폼(엑스)에서 모든 데이터를 수집했기 때문”이라고 반박했다.

테크플러스 에디터 이병찬

tech-plus@naver.com​

author-img
박진수 에디터
CP-2023-0021@techpress.com

댓글0

300

댓글0

[Techpress] 랭킹 뉴스

  • 구글 "서드파티 쿠키 종료 없다"
  • 아이폰SE 4, 아이폰16 기반으로 만든다
  • 미국 삼성폰에는 이제 ‘구글 메시지’만
  • 갤럭시도 곧 위성 통신 지원? 단서 발견됐다
  • 왜 지금? 닌텐도 스위치 '조이콘 충전독' 나온다
  • iOS 18, 실종된 사진 복구 기능 생긴다

[Techpress] 공감 뉴스

  • 애플워치를 아이팟처럼...독특한 케이스 나온다
  • 넷플릭스, 메타 퀘스트용 앱 지원 중단했다
  • 샤오미 첫 플립폰 '믹스 플립'...갤플립6 넘어설까
  • 애플 'M4 맥북' 연말 출시 가능성 높아졌다
  • 픽셀 폴드 아니다...새 이름은 '픽셀 9 프로 폴드'
  • 삼성 XR 헤드셋, 언제 모습 드러낼까

당신을 위한 인기글

  • 무더운 여름 제철 음식 즐기는 오감만족 여행지 5선
    무더운 여름 제철 음식 즐기는 오감만족 여행지 5선
  • 노래방 택시에 이은 노래방 기차? 고성방가 허용하는 특이한 기차
    노래방 택시에 이은 노래방 기차? 고성방가 허용하는 특이한 기차
  • “역대 최고 수준” 재난으로 고통받는 이탈리아 인기 관광지 ‘이 곳’ 정체는?
    “역대 최고 수준” 재난으로 고통받는 이탈리아 인기 관광지 ‘이 곳’ 정체는?
  • “이러니 안 반해?”, 이종석 아이유도 반한 모델 비율 자랑했다
    “이러니 안 반해?”, 이종석 아이유도 반한 모델 비율 자랑했다
  • “손해 보기 싫다”외치던 신민아, 최근 제주도에서 전한 깜짝 근황
    “손해 보기 싫다”외치던 신민아, 최근 제주도에서 전한 깜짝 근황
  • “4억 주면 애 낳겠다”라며 시어머니에게 화냈다는 연예인
    “4억 주면 애 낳겠다”라며 시어머니에게 화냈다는 연예인
  • “대체 뭐 하고 놀았길래?” 보트 타고 북한까지 갔다는 여배우
    “대체 뭐 하고 놀았길래?” 보트 타고 북한까지 갔다는 여배우
  • ‘파리 올림픽 캐스터’ 김대호에 “심판 이상해” 분노한 사연은?
    ‘파리 올림픽 캐스터’ 김대호에 “심판 이상해” 분노한 사연은?
  • “군대 같은 시집살이”였다는 연예인, 아침마다 7첩 반상은 기본…
    “군대 같은 시집살이”였다는 연예인, 아침마다 7첩 반상은 기본…
  • “또 음주운전?” 끝나지 않는 음주운전 이번엔 막걸리 먹고
    “또 음주운전?” 끝나지 않는 음주운전 이번엔 막걸리 먹고
  • “벌써 10년이나…” 故 김자옥 그녀가 남긴 메모장…
    “벌써 10년이나…” 故 김자옥 그녀가 남긴 메모장…
  • 김재중 “타블로 재산 탕진 중이다”, 이유 보니 딸 하루 때문에?
    김재중 “타블로 재산 탕진 중이다”, 이유 보니 딸 하루 때문에?

[Techpress] 인기 뉴스

  • 구글 "서드파티 쿠키 종료 없다"
  • 아이폰SE 4, 아이폰16 기반으로 만든다
  • 미국 삼성폰에는 이제 ‘구글 메시지’만
  • 갤럭시도 곧 위성 통신 지원? 단서 발견됐다
  • 왜 지금? 닌텐도 스위치 '조이콘 충전독' 나온다
  • iOS 18, 실종된 사진 복구 기능 생긴다

[Techpress] 추천 뉴스

  • 애플워치를 아이팟처럼...독특한 케이스 나온다
  • 넷플릭스, 메타 퀘스트용 앱 지원 중단했다
  • 샤오미 첫 플립폰 '믹스 플립'...갤플립6 넘어설까
  • 애플 'M4 맥북' 연말 출시 가능성 높아졌다
  • 픽셀 폴드 아니다...새 이름은 '픽셀 9 프로 폴드'
  • 삼성 XR 헤드셋, 언제 모습 드러낼까

당신을 위한 인기글

  • 무더운 여름 제철 음식 즐기는 오감만족 여행지 5선
    무더운 여름 제철 음식 즐기는 오감만족 여행지 5선
  • 노래방 택시에 이은 노래방 기차? 고성방가 허용하는 특이한 기차
    노래방 택시에 이은 노래방 기차? 고성방가 허용하는 특이한 기차
  • “역대 최고 수준” 재난으로 고통받는 이탈리아 인기 관광지 ‘이 곳’ 정체는?
    “역대 최고 수준” 재난으로 고통받는 이탈리아 인기 관광지 ‘이 곳’ 정체는?
  • “이러니 안 반해?”, 이종석 아이유도 반한 모델 비율 자랑했다
    “이러니 안 반해?”, 이종석 아이유도 반한 모델 비율 자랑했다
  • “손해 보기 싫다”외치던 신민아, 최근 제주도에서 전한 깜짝 근황
    “손해 보기 싫다”외치던 신민아, 최근 제주도에서 전한 깜짝 근황
  • “4억 주면 애 낳겠다”라며 시어머니에게 화냈다는 연예인
    “4억 주면 애 낳겠다”라며 시어머니에게 화냈다는 연예인
  • “대체 뭐 하고 놀았길래?” 보트 타고 북한까지 갔다는 여배우
    “대체 뭐 하고 놀았길래?” 보트 타고 북한까지 갔다는 여배우
  • ‘파리 올림픽 캐스터’ 김대호에 “심판 이상해” 분노한 사연은?
    ‘파리 올림픽 캐스터’ 김대호에 “심판 이상해” 분노한 사연은?
  • “군대 같은 시집살이”였다는 연예인, 아침마다 7첩 반상은 기본…
    “군대 같은 시집살이”였다는 연예인, 아침마다 7첩 반상은 기본…
  • “또 음주운전?” 끝나지 않는 음주운전 이번엔 막걸리 먹고
    “또 음주운전?” 끝나지 않는 음주운전 이번엔 막걸리 먹고
  • “벌써 10년이나…” 故 김자옥 그녀가 남긴 메모장…
    “벌써 10년이나…” 故 김자옥 그녀가 남긴 메모장…
  • 김재중 “타블로 재산 탕진 중이다”, 이유 보니 딸 하루 때문에?
    김재중 “타블로 재산 탕진 중이다”, 이유 보니 딸 하루 때문에?

공유하기