Ho un sito interno (intranet) che comprende diversi blog e forum, centinaia di pagine statiche, molti file PDF e molti altri tipi di documenti. È stato incollato insieme vagamente negli ultimi due anni e ora è mio compito mantenerlo.
Sto cercando un motore di ricerca che posso ospitare me stesso idealmente:
Consente di cercare direttamente nei database Blog/Forum se vengono fornite le informazioni del database e le tabelle da cercare.
Gestisce la maggior parte dei documenti di testo (PDF/DOC/ODF)
È open source o consente l'accesso al codice sorgente una volta acquistato
Non mi importa in quale lingua o piattaforma sia scritto. Normalmente, userei solo la ricerca nel sito di Google, ma questa non è un'opzione per una intranet.
Scopri Lucene
Scritto in Java disponibile anche per . NET framework
Ecco un articolo di CodeProject che spiega come funziona e come viene utilizzato. http://www.codeproject.com/KB/library/IntroducingLucene.aspx
Ho usato Sphider prima e sono rimasto piuttosto colpito.
SearchBlox che si basa su Lucene potrebbe essere in grado di soddisfare le tue esigenze. È gratuito e viene fornito con un cingolato.
Normalmente, utilizzerei solo la ricerca nel sito di Google, ma questa non è un'opzione per una rete intranet.
Esiste infatti l'appliance di ricerca di Google che è l'equivalente della ricerca del sito Google per le intranet. Tuttavia, questo non è open source (la ricerca del sito di Google non lo è neanche, nel caso non l'avessi notato.)