Jaccard 거리
Jaccard 거리는 두 집합 간의 불일치를 정량화하기 위해 사용되는 척도다. 이는 유한 샘플 집합 간의 유사성을 측정하는 Jaccard 지수(또는 Jaccard 유사성 계수)에서 파생된다. Jaccard 지수는 샘플 집합의 교집합 크기를 합집합 크기로 나눈 값으로 계산된다.
두 집합이 얼마나 다른지를 정량화하는 Jaccard 거리는 Jaccard 지수의 보완으로 계산된다. 이는 다음과 같이 정의된다:
또는 집합 표기법으로는:
여기서:
- 와 는 두 집합이다,
- 는 집합 와 의 교집합 크기이며,
- 는 집합 와 의 합집합 크기다.
Jaccard 거리는 0에서 1 사이의 범위를 가지며, 0은 집합이 동일함을, 1은 집합이 공통의 요소가 없음을 나타낸다. 이 척도는 계산 생물학, 정보 검색, 기계 학습 등 다양한 분야에서 널리 사용되며, 특히 클러스터링과 유사성 측정 작업에서 중요하게 사용된다.
Backlinks (0)
No backlinks found.
Comments (0)