Was ist Wahrheit? Wahrheit gibt es immer nur im Kontext. Das 11-1=10 ist werden die meisten als wahr hinnehmen. Es ist Schulwissen. Bei 1+1=10 haben die meisten Menschen schon Schwierigkeiten und werden das Ergebniss als falsch bewerten. Im Kontext des Dualsystem sind beide Aussagen aber wahr. Auch Wolfram Alpha liefert bei 1+1=10 zur Zeit false. Dem System fehlt der Kontext.
Vor einigen Jahren war ich mit der Basisarbeit für ein semantisches System für die Biomedizin beschäftigt. Die Biomedizin ist eines der Gebiete, in welchem wirklich gute Taxonomien, Thesaurie und Ontologien existieren. Privatfirmen pflegen solche Informationen und verdienen viel Geld damit. Der Meta-Thesaurus UMLS der National Library of Medicine ist eine grosse freie Quelle für solche Daten. Eines der zentralen Ordnungssysteme ist des Thesaurus bestand damals aus 142 Oberknoten. Das System sah vor, dass aus diesen Knoten der Kontext einer Anfrage ausgewählt wird. Treffer, die diesem Kontext näher kommen, wurden höher gewichtet.
Allerdings sind 142 Oberpunkte ein Problem: Kein Wissenschaftler wird sich durch eine Liste mit 142 Einträgen kämpfen, um die für ihn wichtigen zu finden. Zumal es dann auch wieder auf das Wissen der Unterpunkte ankommt. Ausserdem konnten mehrere Kontexte ausgewählt werden. Es gibt zwei Möglichkeiten aus der Sache heraus zu kommen:
- Ein Eingabesystem zu entwickeln, welches dem Wissenschaftler bei der Auswahl unterstützt.
- Die Liste der Oberknoten eindampfen.
Beides ist schwierig. Letzteres aber fatal. Hierfür wurde sich entschieden. Die Liste sollte auf 10 Oberpunkte eingedampft werden. UMLS wurde von den besten Wissenschaftlern ihres Faches entwickelt. Es ist ein allgemein anerkannter Standard. Wie alle Standards nicht perfekt. Sicherlich hat es wochen-, monatelange Diskussionen für die Oberpunkte gegeben. Bei uns wurde es von 4 selbsternannten Fachleuten an einem Nachmittag eingedampft. Auch die konnten sich nicht einigen, so das am Ende die lautesten gewannen. Es war spannend die Besprechung mitzuerleben.
Das Projekt ist gescheitert. Weil das Thema Kontext sträflich vernachlässigt wurde.
Am Thema Kontext werden alle semantischen Suchsysteme entweder scheitern, gnadenlos oberflächlich oder hoch spezialisiert sein. Weil es keine Wahrheit gibt. Spätestens bei Religionen und Geschichte wird es kniffelig. Weil nicht alles erfasst werden kann. Hier hilft auch die dynamische Semantik nicht weiter.
Cyc ist auch gescheitert.
10% der Eclipse Nutzer sind nicht zufrieden mit der Entwicklungsumgebung. Dies hat eine Umfrage der Eclipse-Foundation ergeben. Ich gehöre zu den 10%. In den letzten Wochen wurde ich so unzufrieden, dass ich nach 8 Jahren Eclipse zu Netbeans gewechselt bin.
Der Grund für den Wechsel ist recht einfach. Auf meinem XEN Ubuntu (8.04) war Ganymede unzuverlässig. Aus unerfindlichen Gründen musste ich ca. alle 4 Wochen neu installieren. Bei Eclipse nicht so schwer, wenn nur die Standardumgebung genutzt wird. Die nachinstallierten Plugins mussten allerdings immer wieder neu installiert werden. Und damit begann der Ärger. Jenes Plugin braucht genau dieses Plugin, mit einer Versionsnummer auf X-Nachkommastellen genau. Einige Plugins sind von erschreckend schlechter Qualität usw. Die schlechte Maven Unterstützung und der unzuverlässige Subversion Support taten ein übriges (Versionskonflikte mit Kommandozeilen Client).
Bei Netbeans bekomme ich die nötige Umgebung out-of-the-box. Maven Projekte werden automatisch erkannt, Subversion wird sauber unterstützt. Groovy wird ebenfalls standardmässig unterstützt. Das JavaFX Plugin kann einfach nachgeladen werden (Mac OS X Plattform). Einzig das Scala-Plugin musste manuell nachgeladen werden. Und selbst dabei war die Installation intuitiver als bei Ganymede mit seinem dropins-Verzeichnis.
Bis jetzt vermisse ich nichts. Einziger Wermutstropfen: Das Task-Scanning kann manchmal etwas nervig sein. Ausserdem unterstützt der Editor noch nicht die Möglichkeit Whitespace-Zeichen unterschiedlich zu visualisieren. An letzteres hatte ich mich bei Ganymede gewöhnt. Kann aber gut darauf verzichten.
