인공지능/이론 정리

퍼셉트론이란?

고등어찌짐 2022. 1. 2. 22:27
  • ( 단순 ) 퍼셉트론 알고리즘
    여러 신호를 받아 머시깽이 연산을 하고, 그것을 하나의 출력 ( 0 / 1 ) 으로 나타내는 알고리즘입니다. 
    인공 신경망의 기초 개념이 되어 사용되고 있습니다. 


  • 노드 / 뉴런
    퍼셉트론 알고리즘을 표현할 때, 원으로 표현하는 부분입니다. 
    예시로 x1, x2, x3.... 와 같은 입력값이 있습니다. 


  • 가중치 
    퍼셉트론 알고리즘을 계산시 입력 노드에서 받아온 x1, x2... 등의 입력값에 가중치 w1, w2... 를 곱한 후 결과값을 출력합니다. 


  • 임계값
    특정 임계값 θ ( theta ) 를 정해놓고, 가중치 합이 임계값을 넘느냐 넘지 않느냐에 따라 결과값 0, 1 를 출력합니다. 


  • 학습이란 ?
    학습이란, 원하는 출력값을 얻기 위한 최적의 가중치값와 임계값 즉, 매개변수 값을 찾아나가는 과정을 의미합니다.
     

  • 편향 ( bias )
    만약 다음과 같은 수식이 있을 때, 
    y = 0 ( x1w1 + x2w2 <= theta ) 
         1 ( x1w1 + x2w2 > theta ) 
    theta 값을 이항해 다음과 같은 수식을 만들 수 있습니다. 
    y = 0 ( x1w1 + x2w2 - bias <= 0 ) 
         1 ( x1w1 + x2w2 - bias > 0 ) 
    이 값을 편향값이라고 합니다. 


  • 가중치와 편향의 차이점
    가중치는 각 노드의 입력에 얼마나 힘을 줄것이냐 하는 의미입니다. 중요한 데이터라면 증폭할 수 있고, 아니라면 
    가중치를 적게 주어 입력 신호의 영향력을 제어할 수 있습니다. 
    반면 편향이란 입력 신호와 가중치의 계산값으로 얼마나 쉽게 출력값을 내어줄 것인지 ( 활성화 ) 에 대한 기준입니다. 


  • 선형 영역과 비선형 영역
    논리 게이트 AND, OR, NAND 를 다음과 같이 수식으로 표현할 수 있습니다. 
    y = 0 ( x1w1 + x2w2 - bias <= 0 ) 
         1 ( x1w1 + x2w2 - bias > 0 ) 
    이 수식 안에서 가중치와 편향값만 바꾸면 AND, OR, NAND 의 입출력을 모두 표현 가능합니다.
    이를 4분면 그래프로 표현하면, 각 입력 좌표가 어떤 출력 ( 0 / 1 ) 을 가지는지 선형의 구조로 그려낼 수 있습니다. 

    하지만, XOR 게이트는 위와 같이 하나의 식만으로는 표현할 수 없습니다. 
    이를 4분면 그래프로 표현하면, 직선으로는 원하는 출력 부분으로 나눌 수 없고, 곡선을 사용해야하기에 비선형 
    영역에 해당합니다. 


  • 다층 퍼셉트론 
    비선형 영역의 XOR 게이트를 구현하기 위해서는 다층 퍼셉트론이 필요합니다. 
    하나의 퍼셉트론만으로 구현 가능했던 AND, OR, NAND 와는 다르게 XOR은 각 입력신호들을 NAND, OR 에서 받고
    각 출력값들을 다시 AND 로 보내야만 구현할 수 있습니다. 
    이렇게 여러 층을 쌓은 퍼셉트론을 다층 퍼셉트론이라고 합니다. 

 

# 참조

밑바닥부터 시작하는 딥러닝