본문 바로가기

인공지능

머신러닝이란?

**머신러닝(Machine Learning)**은 컴퓨터가 명시적인 프로그래밍 없이 데이터를 통해 학습하고, 미래를 예측하거나 판단하는 기술이다.

좀 더 쉽게 말하면,
사람이 일일이 규칙을 코드로 짜주지 않아도,
컴퓨터가 **예시(데이터)**를 통해 스스로 규칙을 찾아내고, 새로운 상황에서 판단할 수 있게 되는 것이야.


🔍 어떻게 학습할까?

🧠 머신러닝의 핵심 과정:

  1. 데이터 수집 (Data)
    → 예: "고양이"와 "개" 사진 수천 장
  2. 학습(Training)
    → 사진과 정답(label)을 보고 컴퓨터가 공통된 특징을 찾아냄
    → 예: 고양이는 귀가 뾰족하고 수염이 있음
  3. 모델 생성 (Model)
    → 데이터를 바탕으로 예측 알고리즘을 만들어냄
  4. 예측(Prediction)
    → 새 사진을 보여주면, 모델이 스스로 고양이인지 개인지 예측
  5. 평가(Evaluation)
    → 정답과 비교해서 얼마나 잘 맞췄는지 확인

📌 예시 1: 고양이 vs 개 분류 모델

데이터를 통해 동물 이미지를 학습시키고, 새 이미지를 분류하게 만드는 고전적인 예시

  • 데이터: 수천 장의 동물 사진 + 라벨 ("고양이", "개")
  • 학습: 각 이미지의 특징(귀 모양, 눈 크기, 털 색 등)을 분석
  • 예측: 새 사진을 입력하면 “이건 고양이야”라고 판단

이건 "지도학습(Supervised Learning)"의 예시야.
정답을 알려주면서 학습시키는 방식이지.


📌 예시 2: 유튜브 알고리즘

너가 자주 보는 영상을 바탕으로 유튜브가 "너가 좋아할 만한 영상"을 추천하는 것!

  • 데이터: 네가 본 영상들, 클릭 시간, 검색어
  • 학습: 어떤 종류의 영상을 자주 보는지 학습
  • 예측: “이 학생은 과학 영상 좋아하니까, 이 과학 채널도 보여줘야겠다!”

이건 "비지도학습 + 강화학습"이 복합적으로 쓰이는 예시야.


🎯 고등학생에게 강조할 포인트

  • 머신러닝은 암기나 명령 기반 프로그래밍이 아니라, 경험을 통한 학습
  • 데이터 품질과 양이 매우 중요함 (쓰레기 데이터를 넣으면, 쓰레기 결과가 나옴 → GIGO: Garbage In, Garbage Out)
  • 우리가 자주 사용하는 서비스(인스타그램, 유튜브, 넷플릭스 등)의 추천 시스템은 전부 머신러닝이 기반임

 

개념 확인 퀴즈 (객관식)

1. 머신러닝에서 '학습'이란 무엇을 의미할까?
A. 데이터를 저장하는 것
B. 데이터를 삭제하는 것
C. 데이터를 분석하여 패턴을 찾는 것 ✅
D. 데이터를 무작위로 섞는 것

2. 지도학습(Supervised Learning)의 특징은?
A. 정답 없이 스스로 학습
B. 정답이 있는 데이터를 사용함 ✅
C. 보상을 통해 학습
D. 게임을 통해 학습

3. 자율주행 자동차에 쓰이는 머신러닝의 종류는?
A. 지도학습
B. 비지도학습
C. 강화학습 ✅
D. 데이터압축

4. 다음 중 머신러닝이 쓰이는 분야가 아닌 것은?
A. 영화 추천
B. 계산기 사칙연산 ✅
C. 질병 예측
D. 번역기

5. 머신러닝의 핵심 과정이 아닌 것은?
A. 학습
B. 예측
C. 색칠하기 ✅
D. 평가