Corpus systemdelar
Här är en enkel bild som visar hur Corpus fungerar:
Överst är klientprogrammet (som du ser på webben) och
kopplingarna till QueryServer som tar hand om frågor och levererar
svar.
QueryServer finns inuti Corpus men kan även köras som en separat
server som kopplar sig till de inre delarna av Corpus.
Delarna
QueryServer: Svarar på frågor och anpassar resultaten.
CMD: Styr cache-, data - parametrar, start, stop och synkronisering.
Context: Ett träd av vyer. Håller även reda på
ålder och versioner.
QueryServer: Uppslagsverk, synonymer, språk och andra relationer..
MetaDataIndex: Information om grupper/dokument.
Index: Snabbuppslagning av dokument med ord/symboler.
Balance: Viktade nätverk som hittar kopplingar mellan ord eller
dokument.
Uncharted: Dokument som ännu inte indexerats. Ser till att spindlar
får nya URL:ar och kan lämna ifrån sig nyfunna referenser.
Corpus: Informations server, ser till att alla delar får information
och städar när information tas bort.
De inre delarna Corpus:core är beroende av varandra och hanterar
alla relationer till information, data och infrastruktur. Dictionary (Ordlistan)
relaterar ord till metadata-fält och fritext så det går
snabbt att så upp relevant information. Context ser till att informationen
pressenteras på ett rimligt och översiktligt sätt. Balance
lär sig att hitta viktiga begrepp och relationer i texter.
Under kärnan huserar Agenter och kartor (Uncharted) över den
information som ska indexeras och undersökas.
Context och name space
Kontext innehåller flera olika "name spaces" för att
gruppera och organisera information från olika strukturer bl a URL:er
URL Träd / Namespace
Varje dokument eller informationselement är kopplat till metadatainformation
som beskriver informationen i källan. Det finns både kontent-
och kontext-noder.
Content = Innehåll som titel, kort beskrivning, författare
etc
Context = Alla underkatalogers viktigaste nyckelord, titlar och beskrivning.
Du kan bygga egna agenter, adaptrar, spindlar och styra hur och vilken
information som ska lagras som metadata etc.