주요 메뉴 바로가기 (상단) 본문 컨텐츠 바로가기 주요 메뉴 바로가기 (하단)

앤트로픽, 클로드 3.5 소네트 출시…GPT-4o보다 뛰어나다?

박진수 에디터 조회수  

스타에디터3시리즈콜라보리뷰+

앤트로픽, 클로드 3.5 소네트 출시…GPT-4o보다 뛰어나다?

(출처: 앤트로픽)
(출처: 앤트로픽)

인공지능(AI) 스타트업 앤트로픽(Anthropic)이 신규 AI 모델 ‘클로드 3.5 소네트(Claude 3.5 Sonnet)를 출시했다.

앤트로픽은 지난 2021년 오픈 AI 출신 다리오 아모데이와 대니엘라 아모데이가 설립했다. 지난해에는 아마존, 구글, 세일즈포스 등 빅테크 기업에서 총 73억 달러 투자를 유치한 바 있다.

클로드 3.5 소네트에 추가된 Artifacts 기능 (출처: 앤트로픽)
클로드 3.5 소네트에 추가된 Artifacts 기능 (출처: 앤트로픽)

클로드 3.5 소네트는 생성 AI 모델이다. 오픈 AI GPT나 구글 제미나이처럼 개인 맞춤형 답변을 생성한다. 멀티모달 기능도 갖췄다. 멀티모달이란 텍스트, 이미지, 음성 등 다양한 데이터를 동시에 처리할 수 있는 기술을 뜻한다. 텍스트와 이미지를 분석할 수 있도록 업그레이드했다.

분석 가능한 텍스트 양은 토큰 20만 개로 클로드 3 소네트와 동일하다. 토큰은 단어의 음절을 말한다. 만약 ‘fantastic’이라는 단어를 입력했다면, ‘fan’, ‘tas’, ‘tic’ 3개로 인식한다.

앤트로픽 유튜브를 통해 공개된 시연 영상을 보면 성능을 어느 정도 짐작할 수 있다. 사용자가 ‘해변에 게와 조개가 등장하는 8비트 게임을 만들어 달라’고 요청하자 코드를 전부 생성하는 모습을 보였다. 코딩을 모르는 사용자도 원하는 애플리케이션을 제작할 수 있게 된다. 

AI가 생성한 문서나 코드를 띄워주는 전용 창 기능인 ‘아티팩트(Artifacts)’도 제공한다. 편집이나 저장도 가능하다. 즉각 활용할 수 있게 문서로 정리해 주기 때문에 코드 개발이나 비즈니스 보고서 작성 등에 유용해 보인다.

(출처: 앤트로픽)
(출처: 앤트로픽)

앤트로픽은 지금껏 출시한 AI 모델 중 성능이 가장 뛰어나다고 강조했다. 공식 블로그에서는 ‘뉘앙스, 유머, 복잡한 요구사항을 파악해 자연스러운 어조로 수준 높은 답변을 제공한다’고 밝혔다. 텍스트뿐만 아니라 코드를 작성, 편집, 실행할 수 있는 기능도 추가했다고 설명했다.

최상위 모델이던 클로드 3 오퍼스보다 성능이 좋다. 클로드 3 오퍼스는 지난해 3월 출시된 클로드 3 제품군 중 하나다. 클로드 3는 규모에 따라 △하이쿠 △소네트 △오퍼스까지 총 3가지 모델로 나뉜다. 하이쿠는 간단한 작업을 빠르고 정확하게 처리할 수 있는 소형 모델이다. 소네트는 논리적 추론을 통해 코드나 텍스트를 생성할 수 있는 중형 모델이다. 오퍼스는 가장 복잡한 작업을 처리하는 최상위 모델이다.

(출처: 앤트로픽)
(출처: 앤트로픽)

자체 진행한 벤치마크 점수도 공개했다. 눈에 띄는 점은 GPT-4o보다 대다수 항목에서 높은 점수를 기록했다는 점이다. 

클로드 3.5 소네트가 우위를 점한 항목은 △시각적 수학 추론 △과학 다이어그램 △차트 질의응답 △시각적 문서 질의응답 등이 있다. 시각적 수학 추론은 시각적 요소를 사용해 수학 개념을 이해하고 문제를 해결하는 능력이다. 그래프, 도형, 그림 등을 활용해 수학 문제를 분석한다. 과학 다이어그램 역시 과학 분야에서 쓰이는 다이어그램을 분석하는 능력이다. 차트나 문서에 등장한 이미지 관련 질문을 던져도 막힘없이 대답한다.

점수 차가 가장 큰 건 차트를 바탕으로 질의응답을 주고받는 테스트다. 클로드 3.5 소네트는 90.8%, GPT-4o는 85.7% 정확도를 보였다. 이 외에도 △대학원급 추론 능력 △코드 작성 △다국어 수학 해석 능력 △텍스트 추론 능력 등 대다수 항목에서 GPT-4o보다 높은 점수를 얻었다. 

(출처: 앤트로픽)
(출처: 앤트로픽)

다만, IT 전문 매체 테크크런치(Techcrunch)는 벤치마크 점수만으로 성능을 판단할 수는 없다고 당부했다. 실제로는 엉뚱한 답변을 내놓을 가능성도 있다. 

구글이 지난 5월에 선보인 AI 오버뷰(Overview)만 해도 그렇다. AI 오버뷰는 생성 AI를 활용한 구글 검색 기능이다. 하지만 ‘피자에 치즈가 달라붙지 않는다’는 질문에 ‘무독성 접착제 8분의 1컵을 추가하라’는 답변을 제시하는 오류를 범했다.

클로드 3.5 소네트 역시 특정 질문에서 실수한다고 알려졌다. 외신에서는 AI가 잘못된 답변을 내놓는 환각(할루시네이션) 현상을 완전히 해결하진 못한 듯하다고 평가했다.

클로드 3.5 소네트는 오늘부터 앤트로픽 웹사이트와 iOS 앱을 통해 무료로 이용할 수 있다. 앤트로픽은 현재 많은 기업에서 클로드를 사용하고 있다며, 추후 업데이트를 통해 성능을 업그레이드하겠다고 밝혔다.

author-img
박진수 에디터
CP-2023-0021@techpress.com

댓글0

300

댓글0

[Techpress] 랭킹 뉴스

  • 왜 지금? 닌텐도 스위치 '조이콘 충전독' 나온다
  • 갤럭시도 곧 위성 통신 지원? 단서 발견됐다
  • iOS 18, 실종된 사진 복구 기능 생긴다
  • 애플워치를 아이팟처럼...독특한 케이스 나온다
  • 넷플릭스, 메타 퀘스트용 앱 지원 중단했다
  • 샤오미 첫 플립폰 '믹스 플립'...갤플립6 넘어설까

[Techpress] 공감 뉴스

  • 샤오미 첫 플립폰 '믹스 플립'...갤플립6 넘어설까
  • 픽셀 폴드 아니다...새 이름은 '픽셀 9 프로 폴드'
  • 삼성 XR 헤드셋, 언제 모습 드러낼까
  • 애플·엔비디아 AI 훈련에 유튜브자막 무단 사용 논란
  • 2세대 픽셀 폴드 딱 '이렇게' 생겼다
  • 8월→10월...테슬라 로보택시 연기, 진짜였네?

당신을 위한 인기글

  • 냉전 시대 지하 벙커에서 하룻밤을… 에어비앤비 이색 숙소 화제
    냉전 시대 지하 벙커에서 하룻밤을… 에어비앤비 이색 숙소 화제
  • 지하철역 안에 국제선 수하물 체크인 서비스 도입한 나라
    지하철역 안에 국제선 수하물 체크인 서비스 도입한 나라
  • 머무르기 좋은북스테이 숙소 BEST 5
    머무르기 좋은북스테이 숙소 BEST 5
  • 광고 노쇼 논란 그 후… 최근 뜻밖의 소식 전해졌다
    광고 노쇼 논란 그 후… 최근 뜻밖의 소식 전해졌다
  • “그래도 며느리인데” 박수홍 부모님이 억울하다며 법정에서 했던 말
    “그래도 며느리인데” 박수홍 부모님이 억울하다며 법정에서 했던 말
  • 전 남편에게 20년간 경제적 지원 위해 밤 행사까지 뛰었다는 연예인
    전 남편에게 20년간 경제적 지원 위해 밤 행사까지 뛰었다는 연예인
  • “또 가짜 뉴스 터졌나?” 이혼, 불륜, 증거 영상도 있다 진실은…?
    “또 가짜 뉴스 터졌나?” 이혼, 불륜, 증거 영상도 있다 진실은…?
  • “나태주 이상형 밝혀졌다” 대뜸 “누나 귀여워” 플러팅 상대는?
    “나태주 이상형 밝혀졌다” 대뜸 “누나 귀여워” 플러팅 상대는?
  • 정상의 자리에서 돌연 극단적 시도했다는 가수, 진짜 이유 밝혀졌다
    정상의 자리에서 돌연 극단적 시도했다는 가수, 진짜 이유 밝혀졌다
  • 국제 대회에서의 욱일기 사용, IOC 항의하겠다 ” 파리 올림픽에서…”
    국제 대회에서의 욱일기 사용, IOC 항의하겠다 ” 파리 올림픽에서…”
  • “김동현 당분간 못 본다”, 해병대 지원 이유 아버지 때문?
    “김동현 당분간 못 본다”, 해병대 지원 이유 아버지 때문?
  • 싸이, 악천후로 인한 공연 취소, 전액 환불해 준다더니… 결국
    싸이, 악천후로 인한 공연 취소, 전액 환불해 준다더니… 결국

[Techpress] 인기 뉴스

  • 왜 지금? 닌텐도 스위치 '조이콘 충전독' 나온다
  • 갤럭시도 곧 위성 통신 지원? 단서 발견됐다
  • iOS 18, 실종된 사진 복구 기능 생긴다
  • 애플워치를 아이팟처럼...독특한 케이스 나온다
  • 넷플릭스, 메타 퀘스트용 앱 지원 중단했다
  • 샤오미 첫 플립폰 '믹스 플립'...갤플립6 넘어설까

[Techpress] 추천 뉴스

  • 샤오미 첫 플립폰 '믹스 플립'...갤플립6 넘어설까
  • 픽셀 폴드 아니다...새 이름은 '픽셀 9 프로 폴드'
  • 삼성 XR 헤드셋, 언제 모습 드러낼까
  • 애플·엔비디아 AI 훈련에 유튜브자막 무단 사용 논란
  • 2세대 픽셀 폴드 딱 '이렇게' 생겼다
  • 8월→10월...테슬라 로보택시 연기, 진짜였네?

당신을 위한 인기글

  • 냉전 시대 지하 벙커에서 하룻밤을… 에어비앤비 이색 숙소 화제
    냉전 시대 지하 벙커에서 하룻밤을… 에어비앤비 이색 숙소 화제
  • 지하철역 안에 국제선 수하물 체크인 서비스 도입한 나라
    지하철역 안에 국제선 수하물 체크인 서비스 도입한 나라
  • 머무르기 좋은북스테이 숙소 BEST 5
    머무르기 좋은북스테이 숙소 BEST 5
  • 광고 노쇼 논란 그 후… 최근 뜻밖의 소식 전해졌다
    광고 노쇼 논란 그 후… 최근 뜻밖의 소식 전해졌다
  • “그래도 며느리인데” 박수홍 부모님이 억울하다며 법정에서 했던 말
    “그래도 며느리인데” 박수홍 부모님이 억울하다며 법정에서 했던 말
  • 전 남편에게 20년간 경제적 지원 위해 밤 행사까지 뛰었다는 연예인
    전 남편에게 20년간 경제적 지원 위해 밤 행사까지 뛰었다는 연예인
  • “또 가짜 뉴스 터졌나?” 이혼, 불륜, 증거 영상도 있다 진실은…?
    “또 가짜 뉴스 터졌나?” 이혼, 불륜, 증거 영상도 있다 진실은…?
  • “나태주 이상형 밝혀졌다” 대뜸 “누나 귀여워” 플러팅 상대는?
    “나태주 이상형 밝혀졌다” 대뜸 “누나 귀여워” 플러팅 상대는?
  • 정상의 자리에서 돌연 극단적 시도했다는 가수, 진짜 이유 밝혀졌다
    정상의 자리에서 돌연 극단적 시도했다는 가수, 진짜 이유 밝혀졌다
  • 국제 대회에서의 욱일기 사용, IOC 항의하겠다 ” 파리 올림픽에서…”
    국제 대회에서의 욱일기 사용, IOC 항의하겠다 ” 파리 올림픽에서…”
  • “김동현 당분간 못 본다”, 해병대 지원 이유 아버지 때문?
    “김동현 당분간 못 본다”, 해병대 지원 이유 아버지 때문?
  • 싸이, 악천후로 인한 공연 취소, 전액 환불해 준다더니… 결국
    싸이, 악천후로 인한 공연 취소, 전액 환불해 준다더니… 결국

공유하기