Software detaljer:
Sherlock Holmes er en universel søgemaskine, et system til indsamling og indeksering af tekstdata (tekstfiler, websider osv), både lokalt og over netværket.
Funktioner :.
- Samler filer via HTTP eller fra lokale filer
- Parser tekstfiler, HTML, PDF, og flere andre formater ved hjælp af eksterne parsere (såsom MS Word og PostScript).
- Hele systemet er modulopbygget, så tilføje dine egne datakilder eller parsere er bare spørgsmål om at tilslutte højre modul (godt, som regel også skrive det).
- Fungerer godt i blandet charset miljø.
- mener flere forekomster af den samme fil (selv med mindre ændringer) et enkelt dokument med flere URL'er.
- Alt er yderst konfigurerbar. Du kan skrive filtrering regler i en særlig sprog, som gør det muligt at justere konfiguration variabler afhængigt af dokumentet, der behandles.
- Søgning af ord, sætninger og booleske udtryk. Søgning i filnavne og link tekster.
- Proximity søgning og nærhed vægtning af regelmæssige søgninger.
- Anerkendelse af sprog, nem integration af analyse af verber og synonymic ordbøger.
- Spelling brik baseret på ord frekvenser observeret i de indekserede data, vink brugeren, at hans forespørgsel kunne blive stavet forkert.
- Søgeresultater omfatter kontekst i hvert dokument.
- Vægte godt til millioner af dokumenter på normal PC-hardware.
- Brugergrænseflade (front-end) er helt adskilt fra resten af systemet, hvilket gør det nemt at ændre og også til at integrere søgemaskinen i eksisterende applikationer.
- downloadede filer og indekser komprimeres for at spare plads.
Kommentarer ikke fundet