Bei Blog Age einen Eintrag über sinnvolles Tagging und Tagwolken gelesen. Eigentlich keine neue Erkenntnis dort. Nur, die Regeln werden sich nicht durchsetzen, da auch das Mensch-Maschine Interface zu kompliziert ist. Ich selbst halte z.B. die Pluralbildung für Blödsinn, weil sie nicht den Wortstamm abbildet. Zum Suchen muss dann wieder ein Stemmer drüber gehen, um die Stammform zu finden. Auch wenn ich hier selbst inzwischen Tags anbiete, sinnvoll finde ich sie nicht wirklich und verwende sie höchstens als Link für ein erweitertes Kategoriensystem. An meiner Meinung vom Juni hat sich nichts geändert. Suchwerkzeuge wie z.B. Lucene, welches zur Zeit auch hier zum Einsatz kommt, sind da erheblich effektiver. (Gefunden wie Schockwellenreiter)
Und bei Telepolis eine schöne Gesichte über Deutschland und die Unfähigkeit zu Reformen: Angriff auf die "Schreibgemeinschaft".
Man muss einfach einmal Tags hinterfragen. Was wird mit einem Tag hinterlegt? Ein Wort. Mehr erst einmal nicht. Es ist nicht einmal bekannt, was dieses Wort für eine semantische Bedeutung hat. Wörter können auch als Symbole bezeichnet werden. 20051020T115023 ist z.B. ein Wort, welches den gerade vergangenen Zeitstempel darstellte (ISO 8601). Müller ist auch eine Wort. Aber was bedeutet es? Ist Müller der Nachname? Oder der Beruf? Das geht nicht aus dem Symbol hervor. Man kann einem Tag in dieser Hinsicht die semantische Bedeutung eines Schlüsselwortes zuordnen. Aber mehr ist es zuerst einmal nicht. Und das ist eigentlich ziemlich wenig, wenn ich alleine sehe, was es im Dublin Core an Metadatentypen gibt. Bei Tags muss man sich selbst die semantische Bedeutung implizit dazu denken.
Erheblich bessere Metadateninformationen kann man dann über Taxonomien, Thesauri und Ontologien abbilden. Taxonomien und Thesauri sind dabei sehr gut erforscht und werden, zumindest bei Taxonomie, seit Jahrhunderten verwendet. Ontologien sind recht neu und ihre Handhabung ist nicht ganz einfach. Abilden kann man diese Metainformationen zu einem Dokument sehr gut mit dem RDF und seiner XML Ausprägung. Allerdings sind die Werkzeuge hierfür noch nicht sehr ausgereift.
Im Vergleich, selbst zu Dublin Core, sind Tags unterentwickelt und sehr schwach. Sie bieten keine wirklichen Möglichkeiten der Kategorisierung und sind aus Sicht eines eventuellen semantsichen Webs irrelevant.
