Q 러닝

Q 러닝(Q-learning)은 모델 없이 학습하는 강화 학습 기법 가운데 하나이.

3 처지: 마르코프 결정 과정, 강화 학습, 기댓값.

마르코프 결정 과정

마르코프 결정 과정(Markov Decision Process)는 의사결정 과정을 모델링하는 수학적인 틀을 제공.

새로운!!: Q 러닝와 마르코프 결정 과정 · 더보기 »

강화 학습

강화 학습(Reinforcement learning)은 기계 학습의 한 영역이.

새로운!!: Q 러닝와 강화 학습 · 더보기 »

기댓값

확률론에서, 확률 변수의 기댓값(期待값)은 각 사건이 벌어졌을 때의 이득과 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값이.

새로운!!: Q 러닝와 기댓값 · 더보기 »

여기로 리디렉션합니다

Q-러닝.

유니온백과는 개념지도 또는 시맨틱 네트워크로서 백과 사전 사전으로 구성됩니다. 각 개념과 그 관계에 대한 간략한 정의를 제공합니다.

이것은 개념 다이어그램의 기초가되는 거대한 온라인 정신지도입니다. 무료로 사용할 수 있으며 각 기사 나 문서를 다운로드 할 수 있습니다. 교사, 교육자, 학생 또는 학생이 사용할 수있는 학습, 연구, 교육, 학습 또는 교수법을위한 도구, 자료 또는 참고 자료입니다. 학교, 초등, 중등, 고등학교, 중급, 기술 학위, 대학, 대학교, 학부, 석사 또는 박사 학위 과정; 논문, 보고서, 프로젝트, 아이디어, 문서, 설문 조사, 요약 또는 논문. 다음은 정보가 필요한 각 중요도의 정의, 설명, 설명 또는 의미와 관련 개념을 용어집으로 나열한 것입니다. 한국어, 영어, 스페인 사람, 포르투갈 인, 일본어, 중국말, 프랑스 국민, 독일 사람, 이탈리아 사람, 광택, 네덜란드 사람, 러시아인, 아라비아 말, 힌디 어, 스웨덴어, 우크라이나 말, 헝가리 인, 카탈로니아 사람, 체코 사람, 헤브라이 사람, 덴마크 말, 핀란드어, 인도네시아 인, 노르웨이 인, 루마니아 사람, 터키어, 베트남 사람, 태국어, 그리스 사람, 불가리아 사람, 크로아티아어, 슬로바키아 사람, 리투아니아 사람, 필리핀 인, 라트비아 사람, 에스토니아 사람 와 슬로베니아로 제공됩니다. 곧 더 많은 언어.

모든 정보는 위키백과에서 추출되었으며 라이센스 크리에이티브 커먼즈 저작자표시-동일조건변경허락 3.0.

유니온백과는 Wikimedia Foundation에서 보증하거나 제휴하지 않습니다.

Google Play, Android 및 Google Play 로고는 Google Inc.의 상표입니다.

개인 정보 정책