빅웨이브에이아이 기술블로그

딥러닝, 그거 어떻게 하는 건데? 본문

기술 블로그

딥러닝, 그거 어떻게 하는 건데?

빅웨이브 이현상 2021. 9. 23. 10:20

안녕하세요! 빅웨이브에이아이의 박정환입니다.

 

저는 항상 교육자료를 만들면서 어떻게 해야 더 쉽게 딥러닝을 소개할지 고민하는데요,

 

그 과정에서 만들어진 자료들을 바탕으로 최대한 쉽게 딥러닝을 알려드리고자 합니다!

 

여러분의 관심사와 흥미를 빅데이터로 분석하여 가장 높은 조회수를 이끌어낼 만한 제목을 도출했습니다

 

딥러닝을 알기 위해서는 기반 기술인 인공지능과 머신러닝이 무엇인지부터 알아야 합니다.

 

지난 포스팅(디지털 헬스케어)에서도 한번 소개를 드렸죠?

 

 

인공지능 디지털 헬스케어, AI가 지켜주는 우리의 건강!

안녕하세요! 빅웨이브에이아이의 박정환입니다. 전 세계적으로 심각한 고령화 추세와 급등하는 의료비 부담에 대한 국가적 대응이 시급한 상황입니다. 디지털 헬스케어 산업은 예방, 개인맞춤

bigwaveai.tistory.com

 

 

딥러닝 개념

 

인공지능이란 인간의 학습능력, 추론능력, 지각능력, 논증능력, 자연언어의 이해 능력 등을 인공적으로 구현한 시스템을 의미합니다.

 

인공지능 분야에서 머신러닝과 딥러닝 개념이 포함되는 것입니다.

 

머신러닝은 학습을 통해서 예측값을 원하는 방향으로 개선하는 컴퓨터 알고리즘을 의미합니다.

 

즉, 기계가 데이터의 패턴을 파악하여 예측값을 도출하는 것이죠.

 

머신러닝 기술을 활용하면 주식의 가격을 예측하거나 사진에 있는 과일의 품종을 자동으로 예측하는 등의 일을 할 수 있습니다.

 

그럼 딥러닝이란 무엇일까요?

 

딥러닝은 머신러닝 시스템에서 고도화된 기술을 의미합니다.

 

구체적으로 설명드리면 딥러닝은 신경망에서 은닉층(hidden layer)이 2개 이상인 것을 의미합니다.

 

신경망? 은닉층? 용어가 다소 생소하죠?

 

조금 더 자세하게 살펴보겠습니다.

 

인공지능, 머신러닝, 딥러닝

 

 

'신경망(neural network)'이란 머신러닝의 한 분야로써 인간의 뇌가 작동하는 과정을 인공적으로 구현한 기술을 말합니다.

 

인간의 뇌에 있는 수많은 뉴런들은 인간의 의지에 따라서 신호를 받아 결과를 출력합니다.

 

그래서 인간은 자신의 신체를 자유롭게 움직일 수 있는 것이죠.

 

신경망은 이러한 뉴런 시스템을 수학적으로 접근하여 개발되었습니다.

 

'은닉층(hidden layer)'은 신경망에서 더욱 복잡한 연산을 위해 가상의 뉴런을 생성하는 것입니다.

 

은닉층이 많을수록 신경망은 더욱 어려운 예측에 성공할 수 있습니다.

 

은닉층이 많은, 즉 2개 이상인 신경망을 딥러닝(deep learning)이라고 합니다!

 

동전의 앞면 뒷면을 맞추는 것과 강아지의 품종을 맞추는 것 중 어떤 일이 더 어려울까요?

 

동전의 앞면 뒷면을 맞추는 것은 확실한 특징이 있지만, 강아지의 품종은 종류도 워낙 많고 비슷한 사례가 있어서 어려울 수 있습니다.

 

딥러닝은 강아지의 품종을 예측하는 것과 같은 어려운 문제에서 강력한 성능을 보입니다.

 

인공신경망

 

 

왜 딥러닝을 사용하는가?

 

그렇다면 왜 딥러닝을 사용할까요?

 

현 시대에서 인공지능을 사용하는 가장 큰 이유는 인간의 수고를 덜기 위한 목적입니다.

 

딥러닝은 인공지능 기술을 크게 발전시켰으며 오히려 인간보다도 뛰어난 성능을 달성하게 되죠.

 

특히 비정형 데이터 분석에서 우수한 성능을 보입니다.

 

비정형 데이터란 이미지나 비디오, 텍스트와 같이 구조화되지 않은 데이터를 의미합니다.

 

반대 의미로 정형 데이터가 있는데 정형 데이터는 우리가 흔히 아는 엑셀, 스프레드 시트와 같이 테이블 형태로 저장된 것을 말합니다.

 

그럼 이제 딥러닝 기술을 현재 어떻게 활용하고 있는지 알아보겠습니다.

 

 

딥러닝 활용 분야

 

자연어 처리

 

기계 번역, 텍스트 분류, 토픽 모델링 등

 

 

 

음성 인식

 

Speech To Text (STT), Text To Speech (TTS) 등

 

최적화

 

운영 스케줄링, 생산 공정 최적화, 에너지 최적화 등

비전러닝

 

이미지 분류, 객체 탐지, 이미지 세그멘테이션 등

로봇 공학

 

가사지원/실버, 교육/오락, 의료/헬스케어, 국방/안전, 해양/환경, 범용 지능형 인공지능 로봇 등

 

 

딥러닝 데이터 분석 프로세스

 

위와 같이 딥러닝 데이터 분석은 강력한 성능으로 인해서 이미 다양한 분야에서 활용되고 있습니다.

 

그렇다면 실제 딥러닝 분석 프로젝트는 어떤 프로세스로 구성될까요?

 

문제 정의

 

 

딥러닝 데이터 분석에서 가장 중요한 단계입니다.

 

어떤 프로세스든 항상 초기 단계에서의 판단이 중요합니다.

 

문제 정의란 분석에 필요한 데이터 조건을 정의하며 소재를 파악하고 확보하는 것을 의미합니다.

 

현실 세계의 문제가 딥러닝 데이터 분석으로 해결될 수 있는지 반드시 검토되어야 합니다.

 

실제 사례에서도 최근에 인공지능, 머신러닝 기술이 좋다고 해서 우선적으로 프로젝트를 요구하는 경우가 있는데,

 

문제 정의가 제대로 되지 않으면 원하는 가치를 창출하는 것이 어려울 수 있습니다.

 

애초에 목적이 제대로 설정되지 않은 상황에서 부가 가치를 만들어내는 것은 당연히 어렵겠죠?

 

데이터 수집

 

 

딥러닝 분석에 필요한 데이터를 수집하는 단계입니다.

 

데이터 스키마(설계)를 설정하고 보유 데이터 뿐만 아니라 다양한 출처의 데이터를 수집합니다.

 

데이터 전처리

 

 

데이터 프레임을 정형화하고 결측치 및 중복 데이터를 처리하는 단계입니다.

 

딥러닝 모델에 입력할 수 있도록 데이터를 행렬 형태로 변환해야 합니다.

 

데이터를 학습(train), 검증(validation), 테스트(test) 데이터로 구분해야 합니다.

 

데이터를 분할하는 이유는 임의의 테스트 환경을 만들어서 딥러닝 모델이 새로운 데이터에도 잘 적용되는지 평가해야 하기 때문입니다.

 

 

딥러닝 모델 학습

 

 

실험을 통해 적합한 딥러닝 알고리즘을 선정하는 단계입니다.

 

기존 알고리즘을 사용하거나 새로운 기법을 활용하기도 합니다.

 

최적의 모델 구조 및 하이퍼 파라미터(모델 설정값) 설정이 중요합니다.

 

모델 검증 및 시각화

 

마지막으로 최적화된 모델을 선정하고 성능 검증을 진행하는 단계입니다.

 

정의된 문제를 충분히 해결할 수 있는 수준인지 검토하며, 목적에 따라서 API 형태로 배포하거나 대시보드 형태로 시각화를 합니다.

 

 

마무리

 

이번 포스팅은 딥러닝이 무엇인지, 어디에 활용되는지, 그리고 프로세스에 대해 소개드렸습니다.

 

최근에 주목받고 있는 기술인 만큼 활용 차원에서 어떤 개념인지 알아두면 좋겠죠?

 

궁금하신 부분이나 지적 및 피드백이 있으시면 댓글 남겨주세요.

 

감사합니다 '_' !!

 

 

참고 자료
https://brunch.co.kr/@gdhan/10
https://www.popit.kr/deep-learning-2/
Comments