일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 프롬프트 페르소나
- GPT3
- 악성댓글
- 강화학습
- AI
- chatgpt 꿀팁
- 딥러닝
- 비전러닝
- 컴퓨터 비전
- ChatGPT 잘 쓰는 법
- 경진대회
- 모델링
- 인공지능
- 프롬프트 잘 쓰는 법
- TabNet
- ChatGPT
- LLM
- mergekit
- Transformer
- 프롬프트 잘 쓰는법
- 거대언어모델
- 빅데이터
- GPT
- SOTA
- LLM 성능 개선
- 머신러닝
- 프롬프트
- GaN
- 프롬프트 엔지니어링
- IT
Archives
- Today
- Total
목록mergekit (1)
빅웨이브에이아이 기술블로그
Mergekit, LLM을 한번 합쳐보자!
빅웨이브 이현상 님이 작성한 기술 리뷰입니다. Mergekit? LLM을 합칠 수 있는 툴킷 주소 링크 GitHub - arcee-ai/mergekit: Tools for merging pretrained large language models. 특징 LLAMA, MISTRAL, GPT-NeoX, StableLM 등 지원 Linear, SLERP, Task Arithmetic 등 다양한 병합 방법 사용 가능 VRAM 8GB 수준의 GPU 가속화 가능 텐서 지연 로딩으로 메모리 사용 낮게 가능 가중치 값에 대한 보간 그래디언트 적용 Piecewise 형태로 LLM 모델 레이어를 병합시킴 최근에 Kyujin이라는 사람이 SOLAR랑 본인 모델 Mergekit해서 EN, KO 둘 다 1등함 ML 모델 앙상블이..
기술 블로그
2024. 2. 21. 17:55