일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 빅데이터
- AI
- Transformer
- 강화학습
- 프롬프트 엔지니어링
- 프롬프트 페르소나
- ChatGPT
- GPT
- TabNet
- mergekit
- GaN
- chatgpt 꿀팁
- 거대언어모델
- 악성댓글
- ChatGPT 잘 쓰는 법
- 모델링
- 인공지능
- GPT3
- 딥러닝
- 컴퓨터 비전
- 프롬프트 잘 쓰는법
- 머신러닝
- 프롬프트 잘 쓰는 법
- SOTA
- 경진대회
- 프롬프트
- IT
- 비전러닝
- LLM 성능 개선
- LLM
Archives
- Today
- Total
목록mergekit (1)
빅웨이브에이아이 기술블로그

빅웨이브 이현상 님이 작성한 기술 리뷰입니다. Mergekit? LLM을 합칠 수 있는 툴킷 주소 링크 GitHub - arcee-ai/mergekit: Tools for merging pretrained large language models. 특징 LLAMA, MISTRAL, GPT-NeoX, StableLM 등 지원 Linear, SLERP, Task Arithmetic 등 다양한 병합 방법 사용 가능 VRAM 8GB 수준의 GPU 가속화 가능 텐서 지연 로딩으로 메모리 사용 낮게 가능 가중치 값에 대한 보간 그래디언트 적용 Piecewise 형태로 LLM 모델 레이어를 병합시킴 최근에 Kyujin이라는 사람이 SOLAR랑 본인 모델 Mergekit해서 EN, KO 둘 다 1등함 ML 모델 앙상블이..
기술 블로그
2024. 2. 21. 17:55