Loading...
기술자료 기술동향

기술동향

빅테크 '소형 거대언어모델' 경쟁,,,

● 마이크로소프트(MS)는 지난 21일 미국 워싱턴 레드먼드 MS 본사에서 개발자 회의 ‘빌드 2024′를 열고 이미지 분석이 가능한

소형 거대 언어 모델(sLLM) ‘파이3 비전’을 발표했다.

- MS는 그동안 협업 관계인 오픈AI의 거대 언어 모델(LLM)인 ‘GPT’를 활용해 인공지능(AI) 서비스를 해왔다.

▷ ‘LLM’은 천문학적 용량의 데이터를 학습하고 생성하는 역할을 하는 모델로 생성형 AI 개발의 기반이 된다.

- 만능 AI로 불리는 ‘GPT’는 생성형 AI가 학습·추론을 할 때 데이터를 서로 연결해 주는 파라미터(parameter·매개변수)가

1조개(GPT4 기준) 정도 된다.

▷ 반면 ‘파이3 비전’의 파라미터는 42억개에 불과하다.

→ 파라미터가 적으면 처리하는 데이터 수가 줄어, 제공하는 정보의 양도 적지만, 운영 비용은 크게 낮아진다.

▷ MS는 “파이3 비전은 시각 추론 작업, 표나 차트 이해 작업에 특화한 모델”이라며 “비슷한 성능을 지닌 다른 모델 대비

비용은 10분의 1에 그친다”고 밝혔다.

→ 업계 관계자는 “모든 자동차를 스포츠카처럼 고성능으로 만들지 않고, 용도에 따라 경차·소형차·대형차도 생산하듯이,

생성형 AI도 가성비에 맞는 저용량 모델이 나오는 것”이라고 말했다.

- 거대 언어 모델 개발 질주에 나섰던 빅테크들이 올해 들어 잇따라 sLLM 모델을 내놓으며 생성형 AI 시장 공략에 나서고 있다.

▷ sLLM은 말 그대로 소형화하고 경량화한 거대 언어 모델을 말한다.

→ 기본 조 단위 파라미터를 갖는 기존 LLM과 달리 적게는 수십억 개 단위의 파라미터로 운영이 가능해 훈련 시간과

운영 비용, 전력 소모량이 획기적으로 적은 게 특징이다.

● MS·구글·메타까지 ‘sLLM 경쟁’

- 올해 들어 글로벌 빅테크는 sLLM을 속속 출시하고 있다.

▷ MS가 파이3를 내놓은 데 앞서 지난달 메타는 파라미터 80억개의 라마3, 앤스로픽은 방대한 양의 연구 논문 요약에 특화된

클로드3 하이쿠를, 국내 기업 네이버는 하이퍼클로바X 대시를 내놨다.

→ 이들은 공통적으로 파라미터가 수십억 개에 그친다는 특징이 있다. 이 때문에 비용은 훨씬 저렴하고 속도는 빠르다.

- 빅테크들이 sLLM 개발에 뛰어드는 건 수익성 때문이다.

▷ LLM은 성능은 좋지만, 개발에 천문학적 비용이 들고, 사용처도 빅테크에 국한된다.

→ 아직은 수익성이 떨어질 수밖에 없다.

▷ 하지만 sLLM은 스타트업들도 사용할 수 있게 비용을 낮췄다.

→ 파이낸셜타임스(FT)는 “비싼 비용을 우려하는 일반 기업들이 조금 더 쉽게 AI 도입을 할 수 있도록 하기 위한 빅테크들의 노력”이라며 “LLM을 구축하기 위해 수십억

달러를 쓴 빅테크들이 수익을 내기 위해 sLLM을 속속 내놓고 있다”고 분석했다.

 

● MS·구글·메타까지 ‘sLLM 경쟁’

- 실제 sLLM은 LLM에 비해 비용이 크게 저렴하다.

▷ FT에 따르면 100만 토큰(데이터 기본 단위) 기준으로 LLM인 구글의 제미나이 1.5 프로는 7달러, GPT-4o가 5달러의

비용이 든다.

→ 예컨대 한 기업이 빅테크가 개발한 LLM을 활용해 서비스나 앱을 만들 경우, 영 단어 기준 100만개의 답변을 얻을 때마다

이 돈을 빅테크에 지불해야 한다는 뜻이다.

▷ 하지만 대부분의 sLLM은 비용이 100만 토큰 기준 1달러 미만이다.

→ 업계 관계자는 “AI 시대에 맞춰 관련 서비스를 만들고 싶어도 막대한 비용 탓에 선뜻 도입을 꺼렸던 기업들 입장에선

싸고 가벼운 sLLM이 입문용으로 도전해볼 만한 것”이라고 말했다.

● 수익성·활용성에 강점

- sLLM은 수익성뿐 아니라 활용성 측면에도 강점이 있다.

▷ 작고 가볍기 때문에 클라우드(가상 서버)를 거치지 않고 기기 안에서 AI 서비스를 제공하는 온디바이스(내장형) AI를

구현할 수 있다.

→ 실제 삼성전자는 올해 초 첫 AI 스마트폰 갤럭시S24를 내놓으며 구글의 sLLM 모델 ‘제미나이 나노’를 탑재했다.

→ 애플도 올해 아이폰에 AI를 구동하기 위해 자체 sLLM을 개발하고 있는 것으로 알려졌다.

- 의료·법률·금융 등 각 기업이 필요한 특정 목적에 맞게 맞춤형으로 개발 가능하다는 것도 장점이다.

▷ 국내에서는 KT가 기존 2100억개 이상의 파라미터를 가진 LLM ‘믿음’을 70억~400억개 수준으로 경량화해 특정 분야에

제공할 계획이다.

▷ 국내 AI 스타트업 업스테이지는 최근 sLLM 솔라미니를 출시했고 리걸테크 스타트업 로앤컴퍼니와 법률에 특화된 서비스를

개발하고 있다.

☞sLLM (소형 거대언어모델)

small Large Language Model의 약자.

오픈AI의 GPT나 구글의 제미나이처럼 방대한 양의 데이터를 학습해 모든 질문에 답하는 거대언어모델(LLM)과 달리 주로 의료·법률·금융 등 분야에 특화돼 성능을 정교하게

끌어올린 AI를 말한다. 처리하는 데이터가 적은 만큼, 훈련 시간과 운영 비용, 전력 소모량 등이 적어 경제적이다.

 

번호 제목 글쓴이
30 SK에코플랜트, 캐시카우 2곳 품는다…IPO 준비 착착 관리자
29 트럼프, '반도체 지원법' 정면 비판…삼성·SK, 美공장은? 관리자
28 美, 中반도체 수출 규제 강화한다…TEL·ASML 등 압박 관리자
27 미중 갈등, ASML 투자 대학에도 불똥…“中학생 너무 많아”,,, 관리자
26 ASML, 노광장비 주문 급증으로 전망치 상향 기대,,, 관리자
25 이종호 장관 "GPU·D램 수명 끝나간다…지능형 반도체가 AI시대 새 길",,, ,,,? 관리자
24 AMD, 올해 내놓을 첨단 칩 삼성에 맡기나 관리자
23 삼성전자 파운드리서 구글도 이탈, 첨단 미세공정 개선 급선무로 떠올라 관리자
22 삼성에 이어 SK하이닉스도 1c D램에 '인프리아 MOR' 적용한다 관리자
21 엔비디아 "차세대 데이터센터 'AI 공장'의 시대가 온다" 관리자
20 美, 엔비디아 등 중동 칩 수출도 제동…中기업 접근 우려 관리자
19 ‘반도체 코리아’ 무너질 수밖에 없는 이유 관리자
18 미국 AI 열풍에 반도체용 텅스텐 몸값 오른다, 중국산 대체할 한국 광산 주목,,, ,,,? 관리자
17 美보란듯 '반도체 자립' 올인 … 중국판 TSMC·퀄컴 키운다,,, 관리자
» 만물박사 아닌 '전문 박사'… 싸고 가벼운 AI가 뜬다 관리자
15 삼성 반도체 새 수장의 사인검,,, ,,,? 관리자
14 글로벌 반도체 벨트 치열한 전쟁 중...동아시아 vs 미·동남아 관리자
13 세계 반도체 매출 2030년 1천650조원…6년간 두배로 증가 관리자
12 막이 오르는 반도체·메모리 전쟁 관리자
11 삼성, 자체 AI칩 '마하' 전담팀 짠다, 관리자

고객지원

회사소개 카탈로그