Bonjour, je souhaite utiliser des méthodes de clustering avec une matrice de distance précalculée (NxN). J'ai trouvé que DBSCAN a un attribut "métrique" mais je ne trouve pas d'exemples à suivre. Peux-tu aider s'il te plait. Des exemples d'autres méthodes de regroupement sont également très utiles. Merci.
sur quelle partie n'êtes-vous pas clair?
utilisez metric="precomputed" et fournissez comme X une matrice de similarité précalculée.
Voir http://scikit-learn.org/dev/auto_examples/manifold/plot_mds.html pour un exemple utilisant MDS.
non, ce n'est pas faisable algorithmiquement pour k signifie
Pouvons-nous changer le type de distance en similarité cosinus ? Merci!
non. Nous avons un PR en préparation pour K medoid qui est un algorithme connexe
qui peut prendre une métrique de distance arbitraire. Essayez-le : #7694. K signifie
doit calculer à plusieurs reprises la distance euclidienne de chaque point à un
vecteur arbitraire et nécessite que la moyenne soit significative ; ça ne peut pas marcher
avec une métrique de votre choix.
Commentaire le plus utile
sur quelle partie n'êtes-vous pas clair?
utilisez metric="precomputed" et fournissez comme X une matrice de similarité précalculée.
Voir http://scikit-learn.org/dev/auto_examples/manifold/plot_mds.html pour un exemple utilisant MDS.