일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 모델링
- 경진대회
- AI
- 빅데이터
- 프롬프트 엔지니어링
- IT
- GaN
- GPT
- GPT3
- LLM
- 악성댓글
- Transformer
- 프롬프트 잘 쓰는법
- 거대언어모델
- 프롬프트
- ChatGPT 잘 쓰는 법
- ChatGPT
- mergekit
- 프롬프트 잘 쓰는 법
- SOTA
- LLM 성능 개선
- 딥러닝
- 비전러닝
- 컴퓨터 비전
- 머신러닝
- chatgpt 꿀팁
- 강화학습
- 인공지능
- 프롬프트 페르소나
- TabNet
- Today
- Total
목록AI (12)
빅웨이브에이아이 기술블로그
빅웨이브 이현상 님이 작성한 기술 리뷰입니다. Mergekit? LLM을 합칠 수 있는 툴킷 주소 링크 GitHub - arcee-ai/mergekit: Tools for merging pretrained large language models. 특징 LLAMA, MISTRAL, GPT-NeoX, StableLM 등 지원 Linear, SLERP, Task Arithmetic 등 다양한 병합 방법 사용 가능 VRAM 8GB 수준의 GPU 가속화 가능 텐서 지연 로딩으로 메모리 사용 낮게 가능 가중치 값에 대한 보간 그래디언트 적용 Piecewise 형태로 LLM 모델 레이어를 병합시킴 최근에 Kyujin이라는 사람이 SOLAR랑 본인 모델 Mergekit해서 EN, KO 둘 다 1등함 ML 모델 앙상블이..
Introduction 안녕하세요! 빅웨이브에이아이 이현상입니다! 요즘 들어 블로그 포스트를 거의 올리지 못해 저도 참 아쉬웠는데요, 사실 저도 직장 근무를 하면서 회사 블로그 운영하기가 쉽지는 않더라구요 ㅜㅜ 그래서 아에 블로그를 지금처럼.. 방치하기 보다는, 저희 회사의 월간 세미나로 정리되는 내용을 하나씩 공유드리고자 합니다! 최근 저희 회사에서는 최신 트렌드에 발맞춰서 LLM(Large Language Model) 및 생성형 AI 관련 내용들을 연구하고 있는데요, 이 밖에도 추후 AI 관련 트렌드에 맞춰 정리된 내용들을 지속적으로 전달해드리려고 해요. 오늘은 LangChain이라는 LLM 어플리케이션 개발을 위한 프레임워크를 소개해드리겠습니다! 빅웨이브에이아이 이현상 님의 리뷰입니다. 1. Lan..
시작 안녕하십니까? 빅웨이브에이아이 선임 연구원 이현상입니다. 오랜만에 SOTA 알고리즘 시리즈로 인사드립니다! 지난 포스트에서 정형 데이터 예측 분야에서의 트랜스포머 기법을 적용한 TabNet을 소개드린 적이 있었는데요, 그 이후 2021년 6월 SAINT(Self-Attention and Intersample Attention Transformer)라는 새로운 정형 데이터 딥러닝 예측 기법이 등장했습니다! 최근 딥러닝 동향은 거의 대부분의 분야에서 트랜스포머를 적용하고 있는 상황이라고 여러번 말씀드렸죠? 이번에도 역시 트랜스포머 기반 정형 데이터 분석 기술입니다. 논문 내용에 대해서 하나씩 살펴보겠습니다. Key Idea SAINT는 2개의 핵심 아이디어를 가지고 있습니다. 본 논문에서는 정형 데이터..
시작 안녕하세요! 빅웨이브에이아이 이현상입니다. 지난 포스트에서 ViT-G/14에 대해서 소개드렸죠? 구글에서는 최근 TFT, TabNet, ViT 등 다양한 분야에서 트랜스포머 기법을 응용하여 우수한 성능을 달성하고 있습니다. 그런데 대표적인 SOTA 알고리즘 소개 사이트인 'paperwithcode'의 이미지 분류 분야를 보면 파라미터 수가 참 어마어마하죠? ImageNet 벤치마크 상위 4개 알고리즘은 모두 파라미터 개수가 1,000M(10억개)이 넘습니다! 파라미터 수가 10억개를 넘는 모델을 개인이 활용하거나 모바일 기기에 탑재하기에는 어려움이 있습니다. 그래서 딥러닝 모델을 실용적으로 활용하기 위한 효율적인 경량화도 딥러닝 분야에서 굉장히 중요한 요소 중 하나입니다. Andrew Howard,..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 지난 포스팅에서는 메타 러닝에 대해서 소개드렸습니다. 여러분들은 오징어게임을 보셨나요? 저는 얼마 전에 처음 보고 하루만에 완주 해버렸답니다. 오징어 게임은 현실의 삶이 힘든 사람들이 목숨을 건 게임을 통해서 최종 우승자는 456억을 얻을 수 있다는 내용의 드라마입니다. 삶의 가치와 돈에 대한 철학적인 메시지, 참신한 스토리 구성이 굉장히 흥미로웠습니다. 재밌게 보고 있는 와중 제가 알고있는 인공지능 기술이 등장하여 더욱 재밌었는데요, 오늘은 이 인공지능 기술에 대해서 소개드리고자 합니다. 인공지능에 관심있으신 분들은 벌써 눈치채셨을지 모르겠습니다! 어떤 장면에서 무슨 알고리즘이 적용되었는지 궁금하시죠? 위의 사진은 무궁화 꽃이 피었습니다 게임에서 술래 로봇이..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 지난 포스팅 글은 딥러닝에 대해서 쉽고 간단하게 알아보았었는데요 ! 이번 포스팅의 주제는 딥러닝 세계에서 떠오르는 학습 방법인 '메타 러닝(Meta learning)'에 대해서 알아보도록 하겠습니다. '메타'라는 단어는 한 차원 위의 개념적 용어로 대상의 전반적인 특성을 반영합니다. 그래서 메타 러닝은 데이터의 패턴을 정해진 프로세스로 학습하는 것이 아니라, 데이터의 특성에 맞춰서 모델 네트워크의 구조를 변화시키면서 학습합니다. 배우는 방법을 배우는 것이죠(Learning to learn). 메타 러닝은 범위가 굉장히 광범위 합니다. 최근에는 하이퍼파라미터 최적화, 자동 신경망 네트워크 설계 등으로 가장 많이 활용되고 있습니다. 자사의 데이터 분석 솔루션인 '..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 전 세계적으로 심각한 고령화 추세와 급등하는 의료비 부담에 대한 국가적 대응이 시급한 상황입니다. 디지털 헬스케어 산업은 예방, 개인맞춤 의료, 관리 중심의 의료서비스 확대, 고령화 대책방안, 의료비 지출 절감 산업으로 전망되고 있습니다. 그래서! 이번 포스팅에서는 인공지능 디지털 헬스케어에 대한 사례를 알아보도록 하겠습니다 디지털 헬스케어란? 헬스케어(healthcare)란 무엇일까요? 헬스케어란 질병 예방 및 관리를 합친 전반적인 건강관리 의료서비스 사업을 뜻합니다. 현대에는 소득증가, 의료기술의 발전으로 삶의 질이 높아졌습니다. 하지만 고령화 문제로 급증하고 있는 의료비의 지출과 만성질환자의 비율이 점차 증가하는 추세입니다. 늘어나고 있는 의료 수요 때문..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 지난 SOTA 알고리즘 포스팅 글은 정형 데이터 분석 분야의 TabNet에 대해서 알아보았는데요, 이번 시간에는 이미지 분류 분야의 SOTA 알고리즘인 ViT(Vision Transformer)-G/14에 대해서 알아보도록 하겠습니다! Key Idea 트랜스포머(Transformer)란 멀티헤드 어텐션(Multi-Head Attention) 기법이 적용된 인코더 디코더 구조의 모델을 의미합니다. ViT 모델은 트랜스포머 방법론을 이미지 분석 분야에 적용한 것입니다. ViT는 이미지를 고정된 사이즈로 분할하여 선형으로 모델에 입력한 후 포지션 임베딩 및 벡터 시퀀스를 모델의 인코더에 입력합니다. 분류 Task를 위해 추가적으로 클래스 토큰을 시퀀스에 추가하는 방..
안녕하세요 ! 빅웨이브에이아이의 박정환입니다. 지난 포스팅글은 정형 데이터 분석 분야의 SOTA 알고리즘인 TabNet에 대해서 알아보았었는데요~ 이번 포스팅글은 모델 서빙을 훨씬 쉽게 ! 훨씬 간단하게 ! 도와주는 BentoML에 대해서 알아보도록 하겠습니다 ! Serving BentoML을 알기 전, 모델 서빙이 무엇인지부터 알아보도록 하겠습니다. 서빙(Serving)이란, 개발된 모델을 서빙 하는 것, 맛있는 음식을 손님에게 서빙해주는 것이라고 생각하면 되겠습니다 ! 이 서빙의 방식으로는 Batch, Online, Edge(Mobile)으로 나뉘어져 있는데요, Serving 시 의존성 관리를 중요하게 취급되기 때문에 Docker나 쿠버네티스를 기반으로 합니다. 그럼, Batch Serving이 뭔지..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 지난 SOTA 알고리즘 포스팅 글은 이상치 탐지 분야의 PANDA, DEVNET, GAN, OCNN에 대해서 알아보았었는데요~ 이번 시간에는 정형 데이터 분석 분야의 SOTA 알고리즘인 TabNet에 대해서 알아보도록 하겠습니다! Key Idea 딥러닝이 발전의 발전을 거듭하고 있다고 해도, 이상하리만큼 정형 데이터쪽에서는 힘을 쓰지 못하고 있어왔습니다. 오히려, 정형 데이터는 기존 통계적 기법들이 우수한 성능을 보여주고 있었죠. 그러나, 딥러닝쪽에서도 어깨를 펼 새로운 모델이 등장했습니다 ! ! Google Cloud AI의 Sercan님과 Tomas님이 제안한 이 모델은 트리 룰에 기반하는 gradient boosting과 신경망 모델 구조의 장점을 모두 ..