일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 셀레니움
- Selenium
- 소스설치
- 가비아
- 한빛아카데미
- Apache
- 크롤링
- aws
- word2vec
- 한빛미디어
- 생활코딩
- Lamp
- jupyter
- 밑바닥부터시작하는딥러닝2
- 논문리뷰
- MySQL
- CBOW
- 수동설치
- AndroidStudio를활용한안드로이드프로그래밍
- 머신러닝
- 컴파일설치
- attention
- image
- Crawling
- 프로그램새내기를위한자바언어프로그래밍
- deeplearning
- 비지도학습
- 밑바닥부터시작하는딥러닝
- 딥러닝
- 예제중심HTML&자바스크립트&CSS
- Today
- Total
목록It공부/Machine Learning (2)
안녕, 세상!
(1) 확률적 클러스터링 K-means 기법은 데이터 점이 반드시 클러스터에 할당됩니다. 하지만 같은 클러스터로 분류된 데이터 내부에서 클러스터 중심 벡터로부터 가까운 데이터가 있고 먼 데이터가 있습니다. 이에 따라 특정 클러스터 중심벡터로 부터 먼 데이터의 경우 또 다른 클러스터의 데이터일 확률도 존재할 것입니다. 확률적 클러스터링은 입력 데이터에 대한 클러스터를 분류하되, 입력 데이터들의 각각에 대한 전체 클러스터의 종류에 속할 확률까지 고려한 클러스터링 기법입니다. 전체 클러스터에 대한 입력데이터의 클러스터 확률을 부담률(responsibility)이라고 하며 γ(감마)로 표기합니다. 부담률의 합은 1이어야 합니다. ex) [0.5, 0.3, 0.2] 입력 데이터에 대한 클러스터를 분류하는 행렬은 ..
(1) 클러스트링 (Clustering) 비지도 학습은 지도학습과는 다르게 입력 데이터들에 대한 정답 레이블이 없습니다. 따라서 입력 데이터들에 대한 특징들을 기반으로 연관성에 따라 정답 없이 분류를 해야 합니다. 즉, 클러스트링은 입력 데이터가 비슷한 것 끼리 클래스를 나누는 것입니다. 입력 데이터들이 넓은 범위로 흩어져 분포해 있을 것인데 데이터의 분포 모양을 클러스터(Cluster)라고 합니다. 데이터 분포에서 클러스터를 찾아, 동일한 클러스터에 속하는 데이터들은 같은 클래스로 분류하고 다른 클러스트에 속하는 데이터들은 다른 클래스를 할당하는 것이 클러스터링입니다. (2) K-means K-means 기법은 분류할 클러스터 수(K) 를 직접 정하고 클러스터 수 만큼의 중심 벡터(점)를 가지고 중심 ..