[인공지능] 강화이론

티스토리 뷰

6. 딥러닝

[인공지능] 강화이론

패스트코드블로그 2020. 5. 24. 13:59

강화이론[편집]

스키너는 유기체가 어떤 행동을 한 결과가 스스로에게 유리하면 그 행동을 더 자주 하게 된다고 보았다(1953). 이때 그 행동의 결과로 주어진 것으로 행동의 빈도를 높이는 자극을 강화인(Reinforcer)이라고 하는데(Chance,1999), 이런 강화인은 일차적 강화인과 이차적 강화인으로 나누어 볼 수 있다.

먼저 일차적 강화인(Primary Reinforcer)은 유기체의 행동을 직접적으로 증가시킬 수 있는 강화인이다. 예를 들면 음식이나 물과 같은 것이 되겠는데, 당장 배고픈 유기체에게 음식으로 만족을 주는 것으로써 바로 다음 행동을 증가시킬 수 있다. 반면에 이차적 강화인(Secondary Reinforcer)은 유기체의 행동을 바로 증가시키지 못한다. 하지만 일차적 강화인과 연합하여 행동을 증가시킬 수 있는데, 쿠폰이나 토큰 등이 이에 해당한다. 즉, 쿠폰이나 토큰으로도 유기체를 강화할 수 있지만 그것은 유기체를 직접 강화하는 것이 아니라 일차적 강화인과 교환할 수 있기 때문에 강화가 가능하다는 것이다.

이차적 강화인으로써 가장 대표적인 것이 돈이다. 돈은 여러 종류의 일차적 강화인과 교환할 수 있기 때문에 일반화 된 강화인이라고 부르기도 한다.

'6. 딥러닝' 카테고리의 다른 글

[인공지능] 딥러닝 서버 PC사양 (0)	2020.06.06
아나콘다/딥러닝/2020-05-24/ 딥 러닝 [출처: 아이티월드 ] (0)	2020.05.24
[인공지능뉴스] AI 시대, 수학실력이 최고의 경쟁력이다 (0)	2020.05.24
[인공지능뉴스] 임백준 \| 저물어가는 프로그래밍의 시대 (0)	2020.05.24
[인공지능뉴스] 카카오뱅크, “쓰임새 있는 상담챗봇 만들겠다” (0)	2020.05.10

패스트코드블로그 패스트코드블로그 님의 블로그입니다.

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

글 보관함

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

패스트코드블로그

티스토리 뷰