티스토리 뷰

6. 딥러닝

[인공지능] 강화이론

패스트코드블로그 2020. 5. 24. 13:59

출처: 위키백과 강화이론

 

강화이론[편집]

스키너는 유기체가 어떤 행동을 한 결과가 스스로에게 유리하면 그 행동을 더 자주 하게 된다고 보았다(1953). 이때 그 행동의 결과로 주어진 것으로 행동의 빈도를 높이는 자극을 강화인(Reinforcer)이라고 하는데(Chance,1999), 이런 강화인은 일차적 강화인과 이차적 강화인으로 나누어 볼 수 있다.

먼저 일차적 강화인(Primary Reinforcer)은 유기체의 행동을 직접적으로 증가시킬 수 있는 강화인이다. 예를 들면 음식이나 물과 같은 것이 되겠는데, 당장 배고픈 유기체에게 음식으로 만족을 주는 것으로써 바로 다음 행동을 증가시킬 수 있다. 반면에 이차적 강화인(Secondary Reinforcer)은 유기체의 행동을 바로 증가시키지 못한다. 하지만 일차적 강화인과 연합하여 행동을 증가시킬 수 있는데, 쿠폰이나 토큰 등이 이에 해당한다. 즉, 쿠폰이나 토큰으로도 유기체를 강화할 수 있지만 그것은 유기체를 직접 강화하는 것이 아니라 일차적 강화인과 교환할 수 있기 때문에 강화가 가능하다는 것이다.

이차적 강화인으로써 가장 대표적인 것이 이다. 돈은 여러 종류의 일차적 강화인과 교환할 수 있기 때문에 일반화 된 강화인이라고 부르기도 한다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함