기획 배우기/5분 스터디

[기획자의 하드웨어 5분 스터디] #043. AI의 3가지 학습법

쥰채 2026. 6. 11. 18:23

💡 하드웨어와 AI 도메인으로 시야를 넓혀가는 서비스 기획자의 5분 스터디 기록입니다.

 

[개념] 

1. 지도학습(Supervised Learning): 정답지를 주고 가르치기
가장 대중적이고 상용화된 방식이다. 문제와 정답(Label)을 세트로 묶어서 공부시키는 것이다. 예를 들어, 3살 아이에게 사과 사진을 보여주며 "이건 사과야", 포도 사진을 보여주며 "이건 포도야"라고 반복해서 알려주는 것과 같다고 할 수 있다. 아이는 나중에 처음 보는 사진을 보더라도 '이건 사과네!'라고 맞힐 수 있게 된다.

2. 비지도학습(Unsupervise Learning): 정답 없이 스스로 특징 찾기
정답지 없이 데이터만 잔뜩 주고, "너희가 알아서 비슷한 것들끼리 묶어 봐"라고 시키는 방식이다. 예를 들어 아이에게 수많은 블록을 그냥 주고 "정리해 봐"라고 했을 때, 아이가 가르쳐주지 않아도 색깔별로 혹은 모양별로 끼리끼리 모아두는 것과 같다.

3. 강화학습(Reinforcement Learning): 칭찬과 벌로 실력 키우기
정답지 대신 '보상(Reward)'을 준다. 시행착오를 겪으며 보상을 최대화하는 방향으로 스스로 진화하게 된다. 예를 들어 아이가 혼자 자전거 타기를 배우는 과정과 비슷하다. 중심을 잘 잡고 앞으로 나가면 '빠르다'는 즐거움(보상)을 느끼고, 넘어지면 '아픔(벌)'을 겪으며 점점 타는 법을 익히는 원리와 같다고 할 수 있다.

 

[비즈니스 활용]

영유아의 수면 모니터링 시스템을 기획한다고 가정해 보자.

1. 지도학습
영유아 모니터링 시스템에서 '정상적인 수면' 영상과 '낙상 사고' 영상을 수만 건 학습시켜 사고를 감지하는 기능이 대표적인 지도학습이라고 할 수 있다. 스팸 메일 분류나 얼굴 인식도 여기에 해당한다.

2. 비지도 학습
고객 세그먼테이션(Segmentation)에 주로 쓰이는 방식이다. 우리의 앱을 쓰는 부모님들의 행동 데이터를 넣었을 때, AI가 '이 그룹은 밤 10시 이후에 접속이 잦은 '워킹맘' 그룹이네', '이 그룹은 커뮤니티 활동이 활발한 '정보 공유형'그룹이네'라고 스스로 분류해 내는 식이다.

3. 강화학습
만약 카메라가 자체적으로 움직일 수 있다면 강화학습을 적용할 수 있겠지만, 수면 모니터링 시스템보다는 좀 더 복잡한 서비스에 어울릴 것 같다. 자율 주행 자동차나 로봇 청소기가 장애물을 피해가는 경로 최적화, 혹은 바둑의 '알파고'가 승리라는 보상을 위해 최적의 수를 두는 것에 쓰인다. 최근에는 개인화 추천 알고리즘의 효율을 높이는 데에도 적극 활용되고 있다.

 

[오늘의 인사이트] 

지금 우리 서비스엔 어떤 학습법이 필요할까?

AI PM은 '정답을 알려줘서 성능을 높일지(지도)', '스스로 분류하게 해서 인사이트를 얻을지(비지도)', '보상을 통해 최적의 행동을 찾게 할지(강화)'를 비즈니스 목적에 맞게 결정하는 전략가이다. 따라서 기획자로서 새로운 기능을 정의할 때, 개발팀에 무작정 "AI로 해주세요"라고 하기보다 학습 방법론에 따른 리소스를 먼저 고려할 수 있어야 한다.

명확한 기능 구현(예: 낙상 감지)은 '지도학습'
정확도가 생명이므로 양질의 '정답지(데이터 라벨링)'를 확보하는 데 예산과 시간을 집중해야 한다. "이 영상은 진짜 낙상인가?"를 판단하는 기준을 기획자가 명확히 세워줘야 한다.

사용자 분석이나 인사이트 도출은 '비지도 학습'
우리가 미처 몰랐던 사용자들의 새로운 패턴을 발견하고 싶을 때 적합하다. 마케팅 전략을 짜거나 맞춤형 콘텐츠를 추천할 때 강력한 무기가 될 수 있다.

최적의 경로 제어나 실시간 대응은 '강화학습'
로봇 팔이 아이를 달래주거나, 카메라가 아이의 동선을 따라 자동으로 회전하는 최적의 각도를 찾는 등의 인터랙션 기획에 활용될 수 있다.