https://yozm.wishket.com/magazine/detail/2123/
[쉽게 배우는 AI] 13. 강화학습이란? | 요즘IT
강화학습의 핵심은 일단 시도해 보고, 결과에 점수를 매기는 것인데요. 행동의 결과가 자신에게 유리했다면 보상을 받고, 불리했다면 벌을 받습니다. 이를 계속 반복하면서 더 나은 점수(보상)
yozm.wishket.com
<아티클 내용 요약>
- reinforcement는 강화, 증강이라는 뜻이다.
- 강화 학습의 핵심은 일단 해보는 것이다.
- 강화 학습은 경험을 통해 실력을 키워가는 것이다.
- 그 행동의 결과가 유리한 것이면 상을 받고, 불리한 것이면 벌을 받는다. 이 과정을 반복해 더 좋은 답을 찾아낼 수 있다는 것이 강화 학습의 기본 아이디어다.
- 강화 학습에서 사용하는 용어로만 바꾸면 강화 학습을 더 잘 알 수 있다.
- 바둑으로 인간을 이긴 알파고가 바로 강화 학습을 통해서 구현된 소프트웨어다.
- 자동차의 자동주차 기능도 강화 학습을 통해 만들어졌다.
<알게 된 개념>
- 강화 학습은 인간과 비슷하다고 느껴져 이해하기 쉬웠다.
결국 반복적인 학습을 통해 배우고 발전하는 것이 기계가 하냐, 인간이 하냐의 차이 아닐까?
'데일리 미션 > Article' 카테고리의 다른 글
Article : A/B 테스트 제대로 이해하기 : ① 테스트를 설계할 때 우리의 진짜 질문은? (0) | 2024.05.07 |
---|---|
Article : 쉽게 배우는 AI 14. 머신러닝 수업을 마치며 (0) | 2024.02.21 |
Article : 쉽게 배우는 AI 12. 비지도학습 (0) | 2024.02.21 |
Article : 쉽게 배우는 AI 11. 연관 규칙 학습이란? (0) | 2024.02.21 |
Article : 쉽게 배우는 AI 10. 비지도 학습 (0) | 2024.02.21 |