Corpus systemdelar

Här är en enkel bild som visar hur Corpus fungerar:

Överst är klientprogrammet (som du ser på webben) och kopplingarna till QueryServer som tar hand om frågor och levererar svar.

QueryServer finns inuti Corpus men kan även köras som en separat server som kopplar sig till de inre delarna av Corpus.

Delarna

QueryServer: Svarar på frågor och anpassar resultaten.

CMD: Styr cache-, data - parametrar, start, stop och synkronisering.

Context: Ett träd av vyer. Håller även reda på ålder och versioner.

QueryServer: Uppslagsverk, synonymer, språk och andra relationer..

MetaDataIndex: Information om grupper/dokument.

Index: Snabbuppslagning av dokument med ord/symboler.

Balance: Viktade nätverk som hittar kopplingar mellan ord eller dokument.

Uncharted: Dokument som ännu inte indexerats. Ser till att spindlar får nya URL:ar och kan lämna ifrån sig nyfunna referenser.

Corpus: Informations server, ser till att alla delar får information och städar när information tas bort.


De inre delarna Corpus:core är beroende av varandra och hanterar alla relationer till information, data och infrastruktur. Dictionary (Ordlistan) relaterar ord till metadata-fält och fritext så det går snabbt att så upp relevant information. Context ser till att informationen pressenteras på ett rimligt och översiktligt sätt. Balance lär sig att hitta viktiga begrepp och relationer i texter.

Under kärnan huserar Agenter och kartor (Uncharted) över den information som ska indexeras och undersökas.

Context och name space

Kontext innehåller flera olika "name spaces" för att gruppera och organisera information från olika strukturer bl a URL:er

URL Träd / Namespace

Varje dokument eller informationselement är kopplat till metadatainformation som beskriver informationen i källan. Det finns både kontent- och kontext-noder. Content = Innehåll som titel, kort beskrivning, författare etc

Context = Alla underkatalogers viktigaste nyckelord, titlar och beskrivning.

Du kan bygga egna agenter, adaptrar, spindlar och styra hur och vilken information som ska lagras som metadata etc.
contact - crew - events - software - login
User friendly document oriented solutions with Metadata and XML.
Open infrastructure for information discovery and structure.
This page:
  • print-version
  • metadata
  • comment
  • Latest news: