Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 딥러닝
- hackthissite
- Scala
- 웹해킹
- 인공지능
- hacking
- Javascript
- hackerschool
- BOF 원정대
- 백엔드
- 리눅스
- BOF
- deep learning
- backend
- 러닝스칼라
- mysql
- 경제
- c++
- Linux
- 챗GPT
- 파이썬
- Web
- ChatGPT
- 러닝 스칼라
- c
- php
- flask
- Python
- Shellcode
- webhacking
Archives
- Today
- Total
목록알파고 (1)
jam 블로그
[강화 학습] 1990년 이후 강화학습 관련 모델이나 기법
Q-Learning (1992): 이후 강화학습 분야의 대표적인 알고리즘 중 하나인 Q-Learning이 Watkins와 Dayan에 의해 제안됨. [논문: "Q-Learning", 1992] TD-Gammon (1995): 텐니스 게임에서의 자가 학습을 통해 세계 챔피언을 이긴 최초의 강화학습 모델인 TD-Gammon이 제안됨. [논문: "Temporal Difference Learning of Backgammon Strategy", 1995] DQN (2013): DeepMind에서 개발된 Deep Q-Network(DQN)은 딥러닝을 강화학습에 적용한 첫번째 모델로, Atari 게임에서 인간 수준의 성능을 보임. [논문: "Playing Atari with Deep Reinforcement Lear..
인공지능
2023. 2. 27. 21:07