본문 바로가기

일상정보

머신러닝 및 기계학습이란 무엇인가?

반응형

기계 학습 알고리즘은 인공지능의 진보와 함께 수많은 응용 프로그램의 대부분을 담당합니다.


◆ 머신러닝이란 도대체 무엇일까요?

기계 학습 알고리즘은 통계를 사용하여 대용량의 데이터들 중에서 일정한 패턴을 찾습니다. 그리고 이러한 데이터는 수많은 것들, 단어, 이미지, 클릭 등 다양한 것들을 포함합니다. 디지털 방식으로 저장할 수 있는 경우는 기계 학습 알고리즘에 바로 연결할 수 있습니다.


머신러닝은 오늘날 우리가 사용하는 많은 서비스들로 예를들면, 넷플릭스, 유튜브, 스포티파이 등의 추천 시스템, 구글, 바이두와 같은 검색 엔진, 페이스북, 트위터와 같은 소셜 미디어, 시리, 알렉사와 같은 음성 비서와 같은 다양한 서비스를 제공하는 프로세스이지요. 


위의 경우처럼, 각 플랫폼은 모든 회사에 대한 데이터를 최대한 많이 수집하고 있습니다. 즉, 시청하는 장르, 클릭하는 링크, 응답하는 상태 등 머신러닝을 사용하여 다음에 무엇을 원하는지 정확하게 추측해 낼 수 있습니다. 음성 비서 같은 경우에는, 우리가 말하는 다양한 소리를 구분해내기도 합니다.


이러한 과정들은 매우 기본적입니다. 일정한 패턴을 찾아내고, 추출된 패턴을 적용하게 됩니다. 그러한 수집된 데이터들이 현 세계를 지배하게 되지요. 1986년 영국의 인지심리학자이며 컴퓨터과학자인 제프리 에버레스트 힌턴의 발명 덕택으로 오늘날 인공지능 분야를 개척한 아버지로 알려져 있습니다.


 딥러닝이란 무엇일까요?

딥러닝은 스테로이드에 대한 머신러닝입니다. 즉, 기계가 작은 패턴을 찾아내고 증폭시키는 보다 향상된 기술을 사용합니다. 이 기술을 심층 신경 네트워크라고도 합니다. 이것은 여러 계층의 간단한 계산 노드가 함께 작동하여 데이터를 대충 훑어보고 예측의 형태로 최종 결과를 제공하기 때문이지요.


 신경 네트워크란?

신경망은 인간의 두뇌의 내부 작용에 의해서 영감을 받았습니다. 노드란 일종의 뉴런이고, 네트워크는 뇌 자체와 비슷합니다. 하지만 제프리 힌튼은 신경망의 유행이 지난 시기에 논문을 발표했습니다. 그 누구도 어떻게 훈련시켜야 할지 방법을 알지 못해서 좋은 결과를 얻지는 못했습니다. 그 기술이 다시 돌아오는데 거의 30년이나 걸렸다는군요.


 감독되는 학습이란?

기계학습은 감독이라는 형태로도 나타납니다. 감독 대상 학습에서 가장 일반적인 데이터는 기계에 특정 라벨을 붙여서 어떤 패턴을 찾아야 하는지 정확하게 알려줍니다. 그것을 추적하는 징후를 포착하게 되면 목표물을 사냥할 탐지견과 비교할 수 있습니다. 넷플릭스 프로그램에서 재생 버튼을 누를 때가 바로 그런 경우이지요. 알고리즘과 비슷한 프로그램을 찾으라고 지시하는 형태인 것입니다.


 감독되지 못한 학습도 있습니다.

감독되지 않은 학습에서는 데이터에 라벨이 없습니다. 그 기계는 찾을 수 있는 어떤 패턴이든지 찾아내려고 노력합니다. 이것은 강아지에게 엄청 다양한 물체의 냄새를 맡게한 후 비슷한 냄새를 찾아내라고 하는 것과 같습니다. 감독되지 않은 기술은 뚜렷한 응용 프로그램이 없기 때문에 인기가 별로이지요. 이것은 사이버 보안 분야에서 큰 영향력을 받았습니다.


 강화학습이란 무얼까?

기계학습의 최신 분야엔 강화학습도 있습니다. 보강 알고리즘은 시행착오를 통한 학습으로 정확한 목표를 달성합니다. 수많은 다른 것들을 시도하면서, 행동이 목표에 도달하는데 도움을 주거나 방해하는지에 따라서 보상을 받거나 또는 벌칙을 받습니다. 마치 개에게 새로운 속임수를 가르칠 때 간식을 주거나 주지 않는 것과 비슷하지요. 강화학습은 복잡한 바둑 게임에서 최고의 인간 플레이어를 이긴 것으로 유명한 프로그램인 구글의 알파고가 바로 그것입니다.



머신러닝 및 기계학습머신러닝 및 기계학습




●인공지능, 머신러닝, 딥러닝은 어떤 관계일까?

이 세가지 단어의 개념을 머리에 인식하려면 그 포함관계를 그려보면 됩니다. 그 순서는 바로 인공지능 > 머신러닝 > 딥러닝이 되지요. 제일 큰 그림이 인공지능, 그 내부에 머신러닝, 다시 그 하류에 딥러닝이 존재합니다.


인간이 가진 지능을 기계로 구현하는 것이 인공지능입니다. 반면, 머신러닝은 인공지능을 구체적으로 구현하기위한 접근방식이라 할 수 있지요. 딥러닝은 머신러닝을 완벽하게 실현하기 위한 더 구체적인 기술인 것입니다. 


머신러닝은 알고리즘을 사용해서 데이터를 분석, 학습, 판단, 예측을 하게 됩니다. 코딩을 직접 짜서 넣는 것이 아니라 수많은 데이터를 가지고 알고리즘을 통한 자체 학습을 이용해 목표한 작업을 수행하도록 하게 하는 방식이지요. 알고리즘의 방식으로는 의사결정을 짓는 트리학습과 귀납적인 논리 프로그램방식, 강화학습, 클러스터링, 베이지안 네트워킹 등이 존재하지요. 

인공지능을 제대로 구현하려면 아직까지는 어느정도의 코딩을 해야함은 피할 수 없습니다. 만일, 표지판과 같은 이미지를 인식하려면 끝과 같은 경계부분을 감지해내는 법, 이미지의 겉면을 확인하는 방법, 또 그 표면에 표시된 문자를 인식하는 방법들을 모두 코딩을 통해 만들어야만 하지요. 하지만, 외부의 환경 여하에 따라서 인식률이 현저히 떨어지거나 오류가 생길 확률이 존재합니다. 표지판 주위에 폭우가 온다거나 짙은 안개라든가 그 앞에 장애물이 있다면 인식을 못할 확률이 높인것이지요. 이런 부분이 아직은 난제라 할 수 있습니다.


딥러닝은 용어에서 알 수 있듯이 심층이란 단어를 떠올리게 됩니다. 2012년에 구글과 스탠퍼드대는 심층신경망 시스템을 만들었는데요. 만6천개의 컴퓨터를 연결해서 10억개의 신경망을 연결한 것이지요. 이 시스템으로 유튜브의 이미지 1천만개를 분석했는데, 사람사진과 고양이 사진을 판별하는 시험을 성공했답니다. 


수많은 데이터를 가지고 컴퓨터가 자가학습을 통해서 인식한 것이지요. 이것은 이제 인간의 능력을 훨씬 앞선상태입니다. 이런 능력은 이제 의료계통에서는 암세포나 종양세포를 판별하기까지 한다네요. 또한 무인자동차나 OTT사이트에서의 영화추천과 같은 곳에서 나타나기 시작했습니다. 


이렇듯, 딥러닝은 머신러닝을 실제로 구현하도록 그 실용성을 보여주면서 인공지능의 영역을 점점 확장하고 있습니다. SF공상과학영화에서나 볼 수 있었던 내용들이 이제 우리의 현실 속에서 서서히 다가오고 있네요. 딥러닝은 인공지능을 구체적으로 실현하는 현재의 기술이라고 단언할 수 있습니다.  

반응형