일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 딥러닝
- 머신러닝
- GPT3
- 강화학습
- 프롬프트
- 프롬프트 잘 쓰는 법
- AI
- TabNet
- 빅데이터
- ChatGPT
- 경진대회
- 인공지능
- 모델링
- SOTA
- LLM
- IT
- LLM 성능 개선
- 프롬프트 페르소나
- ChatGPT 잘 쓰는 법
- chatgpt 꿀팁
- 비전러닝
- 컴퓨터 비전
- 프롬프트 잘 쓰는법
- 프롬프트 엔지니어링
- GaN
- Transformer
- GPT
- mergekit
- 거대언어모델
- 악성댓글
- Today
- Total
목록딥러닝 (18)
빅웨이브에이아이 기술블로그
빅웨이브 이현상 님이 작성한 기술 리뷰입니다. Mergekit? LLM을 합칠 수 있는 툴킷 주소 링크 GitHub - arcee-ai/mergekit: Tools for merging pretrained large language models. 특징 LLAMA, MISTRAL, GPT-NeoX, StableLM 등 지원 Linear, SLERP, Task Arithmetic 등 다양한 병합 방법 사용 가능 VRAM 8GB 수준의 GPU 가속화 가능 텐서 지연 로딩으로 메모리 사용 낮게 가능 가중치 값에 대한 보간 그래디언트 적용 Piecewise 형태로 LLM 모델 레이어를 병합시킴 최근에 Kyujin이라는 사람이 SOLAR랑 본인 모델 Mergekit해서 EN, KO 둘 다 1등함 ML 모델 앙상블이..
Introduction 안녕하세요! 빅웨이브에이아이 이현상입니다! 요즘 들어 블로그 포스트를 거의 올리지 못해 저도 참 아쉬웠는데요, 사실 저도 직장 근무를 하면서 회사 블로그 운영하기가 쉽지는 않더라구요 ㅜㅜ 그래서 아에 블로그를 지금처럼.. 방치하기 보다는, 저희 회사의 월간 세미나로 정리되는 내용을 하나씩 공유드리고자 합니다! 최근 저희 회사에서는 최신 트렌드에 발맞춰서 LLM(Large Language Model) 및 생성형 AI 관련 내용들을 연구하고 있는데요, 이 밖에도 추후 AI 관련 트렌드에 맞춰 정리된 내용들을 지속적으로 전달해드리려고 해요. 오늘은 LangChain이라는 LLM 어플리케이션 개발을 위한 프레임워크를 소개해드리겠습니다! 빅웨이브에이아이 이현상 님의 리뷰입니다. 1. Lan..
시작 안녕하십니까? 빅웨이브에이아이 선임 연구원 이현상입니다. 오랜만에 SOTA 알고리즘 시리즈로 인사드립니다! 지난 포스트에서 정형 데이터 예측 분야에서의 트랜스포머 기법을 적용한 TabNet을 소개드린 적이 있었는데요, 그 이후 2021년 6월 SAINT(Self-Attention and Intersample Attention Transformer)라는 새로운 정형 데이터 딥러닝 예측 기법이 등장했습니다! 최근 딥러닝 동향은 거의 대부분의 분야에서 트랜스포머를 적용하고 있는 상황이라고 여러번 말씀드렸죠? 이번에도 역시 트랜스포머 기반 정형 데이터 분석 기술입니다. 논문 내용에 대해서 하나씩 살펴보겠습니다. Key Idea SAINT는 2개의 핵심 아이디어를 가지고 있습니다. 본 논문에서는 정형 데이터..
시작 안녕하세요! 빅웨이브 이현상입니다. 저희 팀에서는 일주일에 한번(수요일) 기술 리뷰를 진행하는데요, 최근 사업에서 시계열(Timeseries) 분석 분야에 대한 수요가 많이 존재하여 이의 SOTA 알고리즘을 소개드리고자 합니다! 기존 포스트에서는 미래에 미리 알고있는 변수를 트랜스포머 구조에서 디코더에 입력하는 TFT(Temporal Fusion Transformer) 모델에 대해서 설명드렸습니다. TFT는 2019년에 발표된 논문으로 그 후 우수한 성능의 모델들이 다수 등장했습니다! 그 중 단변량 시계열 예측에서 우수한 성능을 나타내는 SCINet을 소개합니다. SCINet 시계열 예측 분야는 일반적으로 다변량 및 단변량 문제를 구분합니다. 단변량이라는 것은 변수를 하나로 설정하여 미래 시점의 변..
안녕하세요, 빅웨이브에이아이 김지혜입니다. 여러분들은 3월 9일이 어떤 날인지 아시나요?! 3월 9일은 바로 “제20대 대선일”로 2월 4일 기준 한달 정도 앞두고 있는데요, 윤석열, 이재명, 안철수, 심상정, 허경영 등의 후보가 경쟁 중에 있습니다. 이번 대선에서 흥미로운 점은 바로 선거 유세에 AI 기술들이 활용되었다는 점입니다. 오늘은 선거에서 활용된 두 가지 AI 기술을 소개드리겠습니다! AI 윤석열 먼저 AI 윤석열을 소개드리겠습니다. 윤석열 후보는 국민의힘의 유튜브 채널인 '오른소리'에서 AI 윤석열의 영상을 게시했습니다. https://www.youtube.com/watch?v=F7yzl-NE4Y0 본체보다 말을 잘하는 것 같은데?! 영상에서의 윤 후보는 고개를 돌리는 본인의 습관이 AI 기..
시작 안녕하세요! 빅웨이브에이아이 이현상입니다. 지난 포스트에서 ViT-G/14에 대해서 소개드렸죠? 구글에서는 최근 TFT, TabNet, ViT 등 다양한 분야에서 트랜스포머 기법을 응용하여 우수한 성능을 달성하고 있습니다. 그런데 대표적인 SOTA 알고리즘 소개 사이트인 'paperwithcode'의 이미지 분류 분야를 보면 파라미터 수가 참 어마어마하죠? ImageNet 벤치마크 상위 4개 알고리즘은 모두 파라미터 개수가 1,000M(10억개)이 넘습니다! 파라미터 수가 10억개를 넘는 모델을 개인이 활용하거나 모바일 기기에 탑재하기에는 어려움이 있습니다. 그래서 딥러닝 모델을 실용적으로 활용하기 위한 효율적인 경량화도 딥러닝 분야에서 굉장히 중요한 요소 중 하나입니다. Andrew Howard,..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 지난 포스팅에서는 메타 러닝에 대해서 소개드렸습니다. 여러분들은 오징어게임을 보셨나요? 저는 얼마 전에 처음 보고 하루만에 완주 해버렸답니다. 오징어 게임은 현실의 삶이 힘든 사람들이 목숨을 건 게임을 통해서 최종 우승자는 456억을 얻을 수 있다는 내용의 드라마입니다. 삶의 가치와 돈에 대한 철학적인 메시지, 참신한 스토리 구성이 굉장히 흥미로웠습니다. 재밌게 보고 있는 와중 제가 알고있는 인공지능 기술이 등장하여 더욱 재밌었는데요, 오늘은 이 인공지능 기술에 대해서 소개드리고자 합니다. 인공지능에 관심있으신 분들은 벌써 눈치채셨을지 모르겠습니다! 어떤 장면에서 무슨 알고리즘이 적용되었는지 궁금하시죠? 위의 사진은 무궁화 꽃이 피었습니다 게임에서 술래 로봇이..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 지난 포스팅 글은 딥러닝에 대해서 쉽고 간단하게 알아보았었는데요 ! 이번 포스팅의 주제는 딥러닝 세계에서 떠오르는 학습 방법인 '메타 러닝(Meta learning)'에 대해서 알아보도록 하겠습니다. '메타'라는 단어는 한 차원 위의 개념적 용어로 대상의 전반적인 특성을 반영합니다. 그래서 메타 러닝은 데이터의 패턴을 정해진 프로세스로 학습하는 것이 아니라, 데이터의 특성에 맞춰서 모델 네트워크의 구조를 변화시키면서 학습합니다. 배우는 방법을 배우는 것이죠(Learning to learn). 메타 러닝은 범위가 굉장히 광범위 합니다. 최근에는 하이퍼파라미터 최적화, 자동 신경망 네트워크 설계 등으로 가장 많이 활용되고 있습니다. 자사의 데이터 분석 솔루션인 '..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 저는 항상 교육자료를 만들면서 어떻게 해야 더 쉽게 딥러닝을 소개할지 고민하는데요, 그 과정에서 만들어진 자료들을 바탕으로 최대한 쉽게 딥러닝을 알려드리고자 합니다! 딥러닝을 알기 위해서는 기반 기술인 인공지능과 머신러닝이 무엇인지부터 알아야 합니다. 지난 포스팅(디지털 헬스케어)에서도 한번 소개를 드렸죠? 인공지능 디지털 헬스케어, AI가 지켜주는 우리의 건강! 안녕하세요! 빅웨이브에이아이의 박정환입니다. 전 세계적으로 심각한 고령화 추세와 급등하는 의료비 부담에 대한 국가적 대응이 시급한 상황입니다. 디지털 헬스케어 산업은 예방, 개인맞춤 bigwaveai.tistory.com 딥러닝 개념 인공지능이란 인간의 학습능력, 추론능력, 지각능력, 논증능력, 자연..
안녕하세요! 빅웨이브에이아이의 박정환입니다. 이번 포스팅 글은 저희 빅웨이브에이아이에서 개발한 데이터 분석 솔루션 BADA(Bigwave AI Data Analytics)를 소개하겠습니다. 기존 데이터 분석 솔루션은 데이터 분석에 대한 지식과 전문적 인력이 없어도 자체적으로 분석을 수행할 수 있도록 여러 기능을 제공하고 있습니다. 하지만 기존 솔루션들이 가지고 있는 문제점이 있었고, 저희는 이런 부분들을 보완하고 차별화 요소를 넣어 BADA 시제품 개발을 완료했습니다. 그럼 문제 인식을 어떻게 하게 되었는지부터 알려드리도록 하겠습니다! 중소기업/기관에서의 빅데이터 분석 도입의 어려움 빅데이터 분석 시스템을 도입하고 싶은 기업은 많지만 인프라 구축에는 큰 비용과 전문 인력이 필요합니다. (통계청 기준 ->..