Jaccard's Coefficient Comparator

Fraunhofer INT

Jaccard's Coefficient Comparator - Vergleich von Technologien und Projekten

Der Jaccard's Coefficient Comparator vergleicht Texte unter Anwendung des Jaccard's Coefficient Maß, ein Standardmaß im Information Retrieval. Bei der Berechnung des Jaccard-Koeffizient wird die Anzahl der gemeinsamer Terme (Schnittmenge) zweier Texte durch die Anzahl aller unterschiedlicher Terme (Vereinigungsmenge) beider Texte dividiert. Der Jaccard's Coefficient Comparator ist opimiert für den Vergleich von Elementen aus Taxonomien. So können Technologien, Projekte etc. untereinander verglichen werden. Die Eingabe von Texten erfolgt im XML-Format (siehe hierfür die Beispieldatei: Science Citation Index (SCI) - Scope Notes.

Screenshot

Fraunhofer-Gesellschaft