Sobald Sie die neue Collection
benannt haben, sollten Sie den Indexing-Prozess starten, d.h. mit
Excite-Worten: Sie legen die CollectionContents fest. Beim Indexing definieren Sie, welches Haupt-Verzeichnis durchsucht werden soll, und im Weiteren, welche Dokument-Typen dieses Haupt-Verzeichnisses durchsucht werden dürfen. Zuerst geben Sie das Haupt-Verzeichnis
selbst an (unter dem Punkt "Index Using Rules"), welches
jene Dokumente enthält, die in die Suche aufgenommen werden sollen, z.B.
"faq". /u/web/<UserID>/<Haupt-Verzeichnis-Name> Dann konfigurieren Sie den IndexFilter. Hierbei können Sie eine der beiden folgenden Methoden verwenden:
Im Custom Filter File legen Sie fest, welche Dokumente Ihres Haupt-Verzeichnisses durchsucht und welche NICHT durchsucht werden sollen. Normalerweise bezieht Excite nur HTML- und/oder TEXT-Dateien in seine Volltextsuche ein. Das Custom Filter File gibt Ihnen die Möglichkeit, Excite mitzuteilen, dass es Dokumente anderen Typs entweder als HTML-Dateien oder als TEXT-Dateien interpretieren soll (oder nicht!) und diese Dokumente ebenfalls durchsuchen soll (oder auch nicht!). Sobald das Excite-Search-Programm Ihr Custom Filter File kennt, wird bei jedem Aufruf Ihrer "Suchmaschine" für jedes Dokument im Haupt-Verzeichnis nachgesehen, ob dafür spezielle Regeln im Custom Filter File festgelegt wurden, d.h. es wird nachgesehen, ob das Dokument durchsucht werden soll oder nicht.
Erstellen des Custom Filter File Sie geben in dieser Datei eine Liste von Dateinamen und/oder (Unter-)Verzeichnisnamen an - unter Einhaltung einer bestimmten Syntax. Alle Dateien, die hier aufgelistet werden, werden in die "Suchmaschine" einbezogen (oder nicht!), also durchsucht (oder nicht!) und jedes aufgeführte Verzeichnis wird ebenfalls aufgenommen, mitsamt allen darin enthaltenen Dokumenten (oder auch nicht!). Die Syntax, in der Sie die Regeln festlegen, besteht aus drei Spalten:
Es gibt zwei verschiedene Kategorien von Ausdrücken, mit denen die "Lage" der Verzeichnisse oder Dateien beschrieben werden kann: Regular Expressions und Unix-Style Globbing Expressions. Regular Expressions: Unix-Style Globbing Expressions:
Ein einfaches Custom Filter File: # Keine ".pl" Dateien in Verzeichnissen mit dem
Namen "bin" aufnehmen. Nach der Erstellung des Custom Filter Files speichern Sie dieses in Ihrem Speicherbereich als .txt-Datei ab, entfernen die Endung .txt und tragen dann im dritten Feld des IndexFilters den Pfad zu der Datei ein: /u/web/<UserID>/<Pfad>/<Datei-Name> Nun drücken Sie unter "Possible Actions" auf den SAVE-Button. |
|