머신러닝(Machine learning 기계 학습)이란?
컴퓨터 프로그램에 있는 분야의 데이터를 반복해 주는 것으로 내재하는 규칙성 등을 학습시켜 미지의 데이터가 주어졌을 때에 학습 결과에 맞추어 예측이나 판단, 분류 등을 실시할 수 있도록 하는 메커니즘입니다.
현대 인공 지능 (AI) 연구에서 가장 유력한 기술 중 하나입니다.
예를 들어, 숫자를 필기한 화상과 거기에 찍혀 있는 숫자를 쌍으로 한 학습 데이터를 많이 준비하고, 일정한 알고리즘(계산 순서)에 따라 차례로 이것을 처리해 나가면, 화상의 패턴으로부터 찍혀 있는 숫자를 예측하는 학습 모델을 만들 수 있습니다.
학습이 끝난 시스템에 미지의 수기 숫자의 화상을 주면, 거기에 찍혀 있는 숫자를 추론해 회답할 수 있게 됩니다.
종래 이러한 구조를 만들려고 하면 각 숫자의 화상에 나타나는 특징적인 패턴을 인간이 정리해 판단 기준으로서 프로그램에 짜 넣을 필요가 있지만,
기계 학습에서는 데이터로부터 특징을 추출해 특정의 컴퓨터가 결과(답)에 연결하는 작업을 자동으로 수행하기 때문에 인간은 학습하고 싶은 내용을 나타내는 데이터만 제공할 수 있습니다.
교사 있음 학습 (supervised learning) 기계 학습의 수법 중, '예제와 답'이라고 하는 형식으로 정리된 '교사 데이터'에 적합하도록 모델을 구축해 가는 방식을 '교사 있음 학습'이라고 합니다.
예제를 입력하면 대응하는 대답을 출력하도록 모델을 조정해 간다. 인간이 이미 대답을 알고 있는 판단이나 작업을 자동화하고 싶은 경우에 유효한 수법으로 응용 범위도 넓지만,
원시 데이터를 '예제와 대답의 쌍'이라고 하는 형식으로 (인손에 의해) 정리하지 않으면 되지 않는다. 학습 데이터의 질이나 잠재적인 문제점이 그대로 정밀도나 결과에 반영되어 버리는 난점도 있습니다.
교사 없음 학습 (unsupervised learning) 인간이 기준이나 정답을 주지 않고 학습 데이터를 분석시켜 시스템이 자율적으로 어떠한 규칙성이나 경향을 찾아내는 방식을 '교사 없는 학습'이라고 합니다.
주어진 데이터군을 어떤 목적으로 해석하고, 특징이 유사한 데이터의 그룹 분할 등을 행할 수 있도록 합니다.
인간에게도 정답을 모르는 과제에 대한 지견을 얻고 싶은 경우나, 대량의 데이터로부터 규칙성을 탐색하고 싶은 경우 등에 유효한 수법으로, 데이터의 전처리가 적고 현실 세계에 있는 다양한 대량의 데이터를 소재로 할 수 있습니다.
다만, 결과가 무엇을 의미하는지는 인간에 의한 해석이 필요하고, 인간에게 유용한 결과를 얻을 수 있도록 제어하는 것이 어렵고 정밀도도 안정시키기 어렵다는 등의 과제가 있다.
강화 학습 (reinforcement learning) 시스템의 행동에 대해 평가(보상)가 주어지고, 행동의 시행착오를 반복하여 평가를 극대화하는 행동 패턴을 학습시키는 방식을 「강화 학습」이라고 합니다.
기계의 제어나 경기, 게임 등을 실시하는 AI의 훈련에 적합합니다. 다른 학습 기법과는 달리 인간은 정리된 형태로 학습 데이터를 제공하지 않으며 시스템은 현재 상황을 입력으로서 행동을 선택합니다.
행동의 결과는 평가(값)로서 시스템에 전달되어 어떤 행동이 바람직한 결과로 이어지는지를 반복 시행착오 하면서 학습해 갑니다.
인공 지능 심층 학습과의 관계
인공지능 (AI Artificial Intelligence)이란 인간의 지적 영업의 일부를 어떠한 형태로 모방하는 IT 시스템 전반을 가리키는 총칭이며
초기의 AI 연구에서는 대상에 대한 지식이나 룰, 판단 기준 등을 인간이 프로그램의 일부로 직접 기술하는 수법이 일반적이었습니다.
그러나 이러한 방법으로는 지식의 기술에 수고가 걸려 특정의 좁은 분야에서도 인간과 같은 판단을 내릴 수 있는 시스템을 실현하기에는 엄청난 시간과 비용이 필요하게 됩니다.
이 한계를 깨기 위해 인간은 학습 방법만을 프로그램으로 구현하고 실제 지식의 획득은 데이터를 대량으로 주어 자동 처리한다는 기계 학습의 방법이 고안되었다.
기계 학습의 구체적인 방식에는 SVM(지원 벡터 머신)이나 베이지안 네트워크, 결정 트리(데시젼 트리) 학습, 데이터 클러스터링 등 다양한 수법이 있지만
인간의 뇌의 신경 회로의 망상의 연결에 착상을 얻은 '뉴럴 네트워크 '(NN, Neural Network)가 유력한 방식으로 대두했습니다.
2010년대가 되면 네트워크의 계층을 종래보다 깊게 설정(4층 이상)한 '딥 뉴럴 네트워크' (DNN Deep Nueral Network)가 눈부신 발전을 이루고 기계 학습 연구, 개발의 핵심으로서 주목받도록 되었다.
이 DNN에 기초한 기계 학습을 '심층 학습' 또는 딥 러닝(deep learning)이라고 합니다.
머신러닝 활용의 장점
복잡한 분석, 분류 업무를 시스템화에 의해 효율화해 사원의 부담이나 전문적인 스킬에의 의존도를 경감하는 것이 가능합니다. 이것은 노동력 부족의 해소로 이어집니다.
실시간으로 모든 정보를 집약하고 가공 분석하고 경영자가 원하는 정보를 즉시 시각화하는 것이 가능하기 때문에 신속한 경영 판단이 가능합니다.
고객 지원의 자동화나 서포트 담당자간에 보다 올바른 대응책의 공유가 가능해져 고객 만족도가 향상합니다. 과거의 판매 상황이나 고객의 기호 정보, 트렌드 정보 등을 학습시켜 장래의 수요를 예측하는 것이 가능해집니다.
'테크' 카테고리의 다른 글
이미지 생성 AI란? (0) | 2023.05.26 |
---|---|
알기 쉬운 딥러닝과 머신러닝의 차이 (0) | 2023.05.26 |
파이썬 딥러닝으로 할 수 있는 일은? (0) | 2023.05.26 |
딥러닝의 의미란 무엇인가? (0) | 2023.05.26 |
틱톡 금지 제작자에게 어떤 의미가 있을까? (0) | 2023.05.21 |
댓글