분류
[ 펼치기 · 접기 ]
|
1. 개요[편집]
중국의 싱싱 그룹 산하의 AI 부문에서 개발한 오픈 소스 대규모 언어 모델(LLM) 시리즈이다. 수조 개의 토큰을 학습하여 자연어 처리 능력이 뛰어나며, 특히 다국어 지원과 코딩, 수학적 추론 능력에 강점을 보인다. 개발사 측은 모델의 가중치를 공개하여 연구자와 개발자들이 자유롭게 활용할 수 있도록 생태계를 구축하고 있다.
2. 특징[편집]
Skywork는 오픈 소스 지향 정책을 펼치고 있어 상업적 이용에 비교적 관대하며 허깅페이스 등을 통해 누구나 모델을 내려받아 미세 조정할 수 있는 것이 장점이다. 수조 개에 달하는 고품질 데이터를 학습했기 때문에 한국어를 포함한 다국어 성능이 준수하다는 평을 받으며, 모델 사이즈 대비 추론 성능이 뛰어나 양자화 기술을 적용할 경우 일반적인 소비자용 GPU에서도 구동이 가능하다는 효율성을 자랑한다.
3. 사용 방법[편집]
웹 서비스를 활용할 경우 Skywork 공식 웹사이트나 쿤룬테크의 플랫폼을 통해 채팅 형식으로 직접 대화해 볼 수 있으며 개발자들이 공유한 Hugging Face Spaces의 웹 데모 페이지를 이용하면 별도의 설치 없이 브라우저에서 즉시 성능을 테스트하는 것도 가능하다. 로컬에서 직접 구동하려는 개발자는 Hugging Face의 레포지토리에서 원하는 모델 사이즈를 선택해 내려받은 뒤 Python 환경에서 transformers와 torch 라이브러리를 설치하여 활용할 수 있다. 구체적인 실행 코드는 다음과 같다.
[ 펼치기 · 접기 ]
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("Skywork/Skywork-13B-base", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("Skywork/Skywork-13B-base", device_map="auto", trust_remote_code=True)
inputs = tokenizer("안녕하세요, Skywork!", return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs))
tokenizer = AutoTokenizer.from_pretrained("Skywork/Skywork-13B-base", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("Skywork/Skywork-13B-base", device_map="auto", trust_remote_code=True)
inputs = tokenizer("안녕하세요, Skywork!", return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs))
4. 모델 종류[편집]
Skywork-13B 가장 대중적으로 사용되는 기본 모델이다.
Skywork-Math 수학적 문제 해결에 특화된 버전이다.
Skywork-Chat 대화형 인터페이스에 최적화되어 명령어 이행 능력이 강화된 버전이다.
Skywork-Math 수학적 문제 해결에 특화된 버전이다.
Skywork-Chat 대화형 인터페이스에 최적화되어 명령어 이행 능력이 강화된 버전이다.
5. 여담[편집]
출시 당시 벤치마크 점수가 상당히 높게 나와서 화제가 되었으나, 중국계 모델 특유의 데이터 편향성에 대해서는 유저들 사이에서 의견이 갈리기도 한다.