Gabi und Sascha
Tags - Kategorien : Alle | Berlin | Bücher | Fotografie | Java | Linkhalde | Weichware | Verfassung

Was ist Wahrheit? Wahrheit gibt es immer nur im Kontext. Das 11-1=10 ist werden die meisten als wahr hinnehmen. Es ist Schulwissen. Bei 1+1=10 haben die meisten Menschen schon Schwierigkeiten und werden das Ergebniss als falsch bewerten. Im Kontext des Dualsystem sind beide Aussagen aber wahr. Auch Wolfram Alpha liefert bei 1+1=10 zur Zeit false. Dem System fehlt der Kontext.

Vor einigen Jahren war ich mit der Basisarbeit für ein semantisches System für die Biomedizin beschäftigt. Die Biomedizin ist eines der Gebiete, in welchem wirklich gute Taxonomien, Thesaurie und Ontologien existieren. Privatfirmen pflegen solche Informationen und verdienen viel Geld damit. Der Meta-Thesaurus UMLS der National Library of Medicine ist eine grosse freie Quelle für solche Daten. Eines der zentralen Ordnungssysteme ist des Thesaurus bestand damals aus 142 Oberknoten. Das System sah vor, dass aus diesen Knoten der Kontext einer Anfrage ausgewählt wird. Treffer, die diesem Kontext näher kommen, wurden höher gewichtet.

Allerdings sind 142 Oberpunkte ein Problem: Kein Wissenschaftler wird sich durch eine Liste mit 142 Einträgen kämpfen, um die für ihn wichtigen zu finden. Zumal es dann auch wieder auf das Wissen der Unterpunkte ankommt. Ausserdem konnten mehrere Kontexte ausgewählt werden. Es gibt zwei Möglichkeiten aus der Sache heraus zu kommen:

  1. Ein Eingabesystem zu entwickeln, welches dem Wissenschaftler bei der Auswahl unterstützt.
  2. Die Liste der Oberknoten eindampfen.

Beides ist schwierig. Letzteres aber fatal. Hierfür wurde sich entschieden. Die Liste sollte auf 10 Oberpunkte eingedampft werden. UMLS wurde von den besten Wissenschaftlern ihres Faches entwickelt. Es ist ein allgemein anerkannter Standard. Wie alle Standards nicht perfekt. Sicherlich hat es wochen-, monatelange Diskussionen für die Oberpunkte gegeben. Bei uns wurde es von 4 selbsternannten Fachleuten an einem Nachmittag eingedampft. Auch die konnten sich nicht einigen, so das am Ende die lautesten gewannen. Es war spannend die Besprechung mitzuerleben.

Das Projekt ist gescheitert. Weil das Thema Kontext sträflich vernachlässigt wurde.

Am Thema Kontext werden alle semantischen Suchsysteme entweder scheitern, gnadenlos oberflächlich oder hoch spezialisiert sein. Weil es keine Wahrheit gibt. Spätestens bei Religionen und Geschichte wird es kniffelig. Weil nicht alles erfasst werden kann. Hier hilft auch die dynamische Semantik nicht weiter.

Cyc ist auch gescheitert.