본문 바로가기

공부/클라우드 컴퓨팅과 인공지능 (K-MOOC)

06. 데이터 기반의 기계학습의 기초

반응형

6.1 4차 산업혁명과 데이터

 

4차 산업혁명

  • 인공지능, 빅데이터, 가상현실 등의 기술
  • 사이버 물리 시스템 - 4차 산업혁명의 기술을 포괄하는 개념
  • 물리시스템 - 현실세계 리얼월드 피지컬 스페이스
  • 사이버 시스템 - 가상세계, 컴퓨터 상에 있는 세계

ex>) 현실에 존재하는 차, 먼저 주변의 정보를 파악 -> 네트워크를 통해서 시스템으로 들어감- 클라우드 기술

 

인공지능에 대한 연구

  • 오래된 개념으로 컴퓨터의 탄생과 동시에 등장
  • 인공지능을 실제로 구현하기 위해 어떤 판단을 내리는지 계속적으로 탐구

빅데이터

  • 인공지능과 다르게 최근에 등장한 개념
  • 데이터 양이 증가하면서 전산적으로 처리할 수 있는 데이터의 공유가 편리해짐
  • 데이터를 모으고 새로운 가치를 창출할 수 있다는 개념이 등장함
  • 빅데이터가 초기에 등장했을 때 데이터는 흩어져 있어서 효율적으로 사용할 수 없었음
  • 효율적으로 저장하고 공유할지 관심이 높아지면서 현재 많은 분야에서 빅데이터가 형성됨

 

6.2 Convolutional Neural Network (합성곱 인공 신경망)

인공지능의 구현

  • 입력에 대한 적절한 출력으로 행동을 결정할 수 있는 적절한 출력을 줌
  • 입력 - X, 출력 - Y

데이터의 결정 : x와 y사이의 관계

 

예측

  • 새로운 x가 주어졌을 때 해당한는 y값을 찾는 것
  • 정답인 y값을 정확하기 찾을수록 좋은 모델

 

해석

왜 y가 이런 식으로 나왔는지 설명

=>문제가 예측이냐 해석이냐에 따라 어떤 f를 선택할지 달라지게 됨

 

모델의 복잡성

  • 모델이 표현할 수 있는 데이터 다양성에 대한 척도
  • 일부 정량적이지만 정성적인 개념

 

단순한 모델

y=ax +b (선형모델)

복잡한 모델

딥러닝

 

복잡한 모델의 특징

  • 입력 변수의 수가 많음
  • 추정해야 할 모델의 파라메터 수가 많음
  • 모델이 고차원 항을 많이 포함함

관계 추정의 목표

  • 제곱에러의 평균을 최소화 할 수 있는 f()를 찾는것
  • 가장 예측력이 좋은 것을 찾는 것

줄일 수 있는 에러

  • 언젠가는 0으로 만들 수 있는 에러

줄일 수 없는 오차가 생기는 이유

수집한 x로 오차가 설명 - ex) 감정적인 측면

-> 완벽한 모델을 만들 수 없음

 

Quiz 6.

1번

기계학습에서 모델이 주어진 학습 데이터는 잘 설명하지만, 새로운 데이터를 예측하지 못하는 현상을 의미하는 것은?

 

회귀분석

과최적화

선형관계

비모수성

2번

기계학습의 주된 분류에 해당하지 않는 것은?

 

지도학습

준지도학습

비지도학습

강화학습

3번

다음 중 그 개념의 범위가 가장 작은 것은?

 

인공지능

기계학습

딥러닝

모두 동등함

4번

다음 주 복잡한 기계학습 모델이 갖는 일반적인 성격이 아닌 것은?

 

입력 변수의 수가 많음

모델 파라메터의 수가 많음

모델이 고차항을 많이 포함함

선형 관계를 가정함

5번

기계학습에서 상품의 가격이나 사람의 키와 같이 연속형 변수에 대하여 모델을 찾고 그 값을 예측하는 분석을 무엇이라 하는가?

 

회귀분석

반응형