Gabi und Sascha
Tags - Kategorien : Alle | Berlin | Bücher | Fotografie | Java | Linkhalde | Weichware | Verfassung
Suchergebnisse : "tag:eos"

1 First steps with ANTLR and grammar testing
The εοs-toolkit is also a playground project. With the project I'll test out some new ideas of my software mindset. The generic interfaces of Function, Predicate and Supplier should be the nucleus of a simple to use configuration language. Function it...
08.06.2008
2 Possible future of the eos-toolkit configuration
A core architecture pattern of the εοs-toolkit is exchangeability of the main services. Many interfaces and classes are supported thru or by the factory design pattern. The constructed service also embeds such services. At this time of writing 13 serv...
04.05.2008
3 Immature Hadoop XML Streaming API
With support of the Hadoop streaming API it is possible to read in XML. In the εοs-toolkit the streaming API is used to convert Medline documents in EosDocuments in a cluster. The streaming API is not easy to use. First: the implementation (Hadoop 0....
14.04.2008
4 APT vs. DocBook
During the development process of the εοs-toolkit I tried out writing the documentation with APT-format. APT stands for Almost Plain Text. Writing documents is like writing in the early days of word-processors. The syntax is simple end easy to learn. ...
12.04.2008
5 ε·ο·s at Sourceforge
A few weeks ago I registered the eos-toolkit project at Sourceforge. Today I delivered an improved documentation and clean up the site design (based on Maven 2, inspired by the Emphasize blog of Martin, former based on Maven). eos (or εοs) is an ac...
08.04.2008
6 Apache Commons Chaos Reloaded
Über das Apache Commons Chaos habe ich mich schon einmal ausführlich ausgelassen. Vor ein paar Tagen schlug es wieder zu. Ich habe an einer abstrakten Hadoop Tool Implementierung gearbeitet. Die Implementierung sollte dem Benutzer die Arbeit abnehmen ...
01.04.2008
7 HadoopTestCase Ergebnisse prüfen
Mit HadoopTestCase bietet Hadoop eine einfache Möglichkeit den Hadoop Map/Reduce Prozess in einer Testumgebung auszuführen. Das Ergebnis des Prozesses zu prüfen ist indirekt über RunningJob möglich. RunningJob wird von JobClient.runJob(job...
21.03.2008
8 ε·ο·s Lucene look up beschleunigt
Die Lucene Performanz in ε·ο·s entäuschte. Heute habe ich Daniel um Rat gefragt. Er wies mich auch den Lucene FieldCache hin und eine Diskussion über die Implementierung. Ich habe es in ε·ο·s implementiert. Bei Tests habe ich festgestellt, dass der Cac...
19.02.2008
9 ε·ο·s
Die Morgenröte ist in einer ersten Beta-Version fertig. ε·ο&#...
18.02.2008
10 Lucene Index mit Hadoop erstellen und mit HadoopTestCase prüfen
Das letzte Glied der Backend-Kette für eine Entity Oriented Search ist fertig. In einem ersten Schritt habe ich Medline Abstracts in Sätze zerlegt und eventuell doppelt vorhandene heraus gefiltert. In einem zweiten Schritt habe ich relevante Konzepte ...
10.02.2008
11 HadoopTestCase und der DistributedCache
Hinweis: Der Eintrag kann sich in den nächsten Tagen noch ändern. --> Ich habe heute in eine Hadoop MapReduce-Applikatio...
07.02.2008
12 Doppelte Sätze in Medline Abstracts
Nach der Medline Abstract Satzzerlegung habe ich heute im Hadoop-Cluster doppelte Sätze eleminiert. Hierfür werden die Abstracts mit dem java.text.BreakItera...
04.02.2008
13 Medline Abstract Satzzerlegung
Habe heute auf 17.021.733 Medline Abstracts 3 Java Satzzerleger angewendet. Stand des Datenumfangs ist von Ende November 2007. Die Titel der Abstracts wurden als Sätze an die Abstract-Texte angehängt. Für die Satzzerlegung wurde verwendet: der Brea...
02.02.2008

Google-Suche!