심벌 마크
유니온백과
통신
다운로드하기 Google Play
새로운! 안드로이드 ™에 유니온백과를 다운로드 할 수 있습니다
비어 있는
브라우저보다 빠른!
 

토픽 모델

색인 토픽 모델

학습 및 자연언어 처리 분야에서 토픽 모델(Topic model)이란 문서 집합의 추상적인 "주제"를 발견하기 위한 통계적 모델 중 하나로, 텍스트 본문의 숨겨진 의미구조를 발견하기 위해 사용되는 텍스트 마이닝 기법 중 하나이.

7 처지: 명시 의미 분석, 기계 학습, 특잇값, 자연 언어 처리, 잠재 디리클레 할당, 음수 미포함 행렬 분해, 생물정보학.

명시 의미 분석

자연언어 처리 및 정보검색에서 명시 의미 분석 (Explicit Semantic Analysis, ESA)는 문서 코퍼스를 지식 베이스로 사용하여 개별 단어 혹은 전체 문서 텍스트를 벡터 형태로 표현하는 것을 가리. 특히 ESA에서는 단어는 해당 텍스트 코퍼스의 tf–idf 행렬의 열벡터로 표현되고, 단어의 나열인 문서는 해당 벡터들의 중심값으로 표현.

새로운!!: 토픽 모델와 명시 의미 분석 · 더보기 »

기계 학습

학습(機械學習) 또는 머신 러닝()은 인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말. 가령, 기계 학습을 통해서 수신한 이메일이 스팸인지 아닌지를 구분할 수 있도록 훈련할 수 있. 기계 학습의 핵심은 표현(representation)과 일반화(generalization)에 있. 표현이란 데이터의 평가이며, 일반화란 아직 알 수 없는 데이터에 대한 처리이.

새로운!!: 토픽 모델와 기계 학습 · 더보기 »

특잇값

유클리드 공간 위의 선형 변환은 단위 공을 타원체로 대응시키며, 선형 변환의 특잇값들은 타원체의 주축 반지름들이다. 함수해석학에서, 특잇값(特異값)은 콤팩트 작용소와 그 에르미트 수반의 합성의 고윳값의 제곱근이.

새로운!!: 토픽 모델와 특잇값 · 더보기 »

자연 언어 처리

자연 언어 처리(自然言語處理) 또는 자연어 처리(自然語處理)는 인간이 발화하는 언어 현상을 기계적으로 분석해서 컴퓨터가 이해할 수 있는 형태로 만드는 자연 언어 이해 혹은 그러한 형태를 다시 인간이 이해할 수 있는 언어로 표현하는 제반 기술을 의미.

새로운!!: 토픽 모델와 자연 언어 처리 · 더보기 »

잠재 디리클레 할당

자연어 처리에서 잠재 디리클레 할당(Latent Dirichlet allocation, LDA)은 주어진 문서에 대하여 각 문서에 어떤 주제들이 존재하는지를 서술하는 대한 확률적 토픽 모델 기법 중 하나이.

새로운!!: 토픽 모델와 잠재 디리클레 할당 · 더보기 »

음수 미포함 행렬 분해

음수 미포함 행렬 분해(Non-negative matrix factorization, NMF)는 음수를 포함하지 않은 행렬 V를 음수를 포함하지 않은 행렬 W와 H의 곱으로 분해하는 알고리즘이.

새로운!!: 토픽 모델와 음수 미포함 행렬 분해 · 더보기 »

생물정보학

생물정보학(生物情報學), 흔히 바이오인포매틱스(bioinformatics)는 생물학적인 문제를 응용수학, 정보과학, 통계학, 컴퓨터 과학, 인공지능, 화학, 생화학등을 이용하여 주로 분자 수준에서 다루는 학문이.

새로운!!: 토픽 모델와 생물정보학 · 더보기 »

여기로 리디렉션합니다

주제 모델.

나가는들어오는
이봐 요! 우리는 지금 Facebook에 있습니다! »