Distância

O objetivo é determinar os vizinhos mais próximos no espaço n-dimensional

Formalmente vizinhos próximos (near neighbors) são pontos que se encontram a uma “pequena distância”

Em primeiro lugar tem de se definir o que significa distância

Distância e Similaridade de Jaccard

A similaridade (ou semelhança) de Jaccard de 2 conjuntos é definida pelo quociente entre a dimensão da sua interseção e dimensão da sua união

A distância Jaccard, d_j , é obtida diretamente da similaridade

  • distância Jaccard = 1 - similaridade

Matlab

Qual a similaridade entre as seguintes strings

str1=’When nine hundred years old you reach, look as good
you will not.’

str2=’You will not look as good when nine hundred years old’


C1=unique(strsplit(lower(str1)));
C2=unique(strsplit(lower(str2)));

simJ=length(intersect(C1,C2))/ length(union(C1,C2))

Resultado: 0.7692

Last updated