Nachdem der Windows Search 4 Dienst auf dem Windows 2008 Server (oder auch auf dem Windows 2003 Server) aktiviert wurde, fängt er an die gewählten Verzeichnisse und Dateien zu durchsuchen (siehe hierzu auch Beitrag "Windows Search 4 - Schnelle Suche unter Windows 7").

Selbstverständlich findet der Suchdienst dann sofort alle Dateien und Ordner anhand Ihrer Namen bzw. Namensteile. Windows Search beherscht weiterhin von Haus aus das Volltextindizieren von Textdateien (*.txt), aber auch das Indizieren von Word-Dokumenten im "97-2003-Format ... also im DOC-Format", PowerPoint-Präsentationen (ppt), Excel-Arbeitsmappen (xls) und auch PDF-Dateien.

 

windows search - dateitypen in den indizierungsoptionen

 

Von Haus aus klappt es aber mit den Inhalten der neuen Open XML-Dateitypen von Office 2007 und 2010 nicht. Man kann zwar den Dateityp hinzufügen (in der obigen Abbildung die Zeile pptx) und dann die Option "Eigenschaften und Dateiinhalte indizieren" aktivieren, doch kann damit der Windows Search Dienst noch lange nicht in die Dateien (docx, pptx, xlsx, usw.) hineingreifen, um deren Inhalte zu indizieren.

Beispiel: Auf einem Windows 2008 Server liegt einen PowerPoint Präsentation mit dem Namen"ladezeiten-verbessern-css-und-javascript-komprimieren.pptx". Das Office 2007 bzw. 2010 ist auf dem Server selbst nicht installiert. Damit hat der Server zunächst keine Chance mit diesen Dateien umzugehen, sprich sie zu öffnen oder anzuzeigen.

 

PowerPoint Präsentation im pptx-Dateiformat

 

Die Suche auf einem angeschlossenen Windows 7 Client (genauer einem Windows 7 Rechner, der seine Bibliothek Dokumente um die Netzwerkadresse mit der PowerPoint-Datei auf diesem Server erweitert hat ... siehe auch Windows 7 Bibliotheken) liefert bei der Suche nach dem Dateinamen ...

 

Windows 7 - Suche nach Dateinamen

 

... gleich den Treffer. Betrachtet nochmals die Präsentation auf dem Bild oben. Auf der letzten Folie stehen die Worte "Vielen Dank". Suche ich nach diesen Worten ...

 

Windows 7 - Volltextsuche bringt keinen Treffer

 

... gibt es keinen Treffer. Das liegt daran, dass der Server selbst, auf dem die Dateie liegt nicht in die PowerPoint Präsentation im Open XML Dateiformat greifen kann. Dieses Problem lässt sich allerdings leicht lösen.

Microsoft hat für die neuen Dateiformate ein Filter Pack herausgegeben. Unter microsoft.com steht das Filter Pack für 64-bit Systeme (z. B. Windows 2008 Server) und für 32-bit Systeme (z. B. Windows 2003 Server) zum Download bereit.

 

2007 office system konverter filter pack

 

Ladet die entsprechende Datei herunter ...

 

2007 office system konverter filter pack download

 

... und installiert diese auf dem Server mit dem Windows Search Dienst. Durch die Installation bring Ihr Windows Search die Dateitypen ".docx, .docm, .pptx, .pptm, .xlsx, .xlsm, .xlsb, .zip, .one, .vdx, .vsd, .vss, .vst, .vdx, .vsx und .vtx" bei.

 

microsoft filter pack 01

.

microsoft filter pack 02

.

microsoft filter pack 03

.

microsoft filter pack 04

.

microsoft filter pack 05

.

microsoft filter pack 06

 

Der Dateityp "pptx" wurde nun neu hinzugefügt und wird zukünftig mit dem "Office Open XML Format PowerPoint Filter" indiziert. Die Inhalte der übrigen Dateiformate des neuen Office Paketes werden nun ebenfalls aufgenommen.

 

microsoft filter pack 07

 

Der Index ist nun allerdings neu aufzubauen. Erstellt hierzu den Index neu. Das kann natürlich - abhängig von der Anzahl der zu indizierenden Dateien - ein wenig dauern ... ggf. führt ihr das über Nacht durch.

 

microsoft filter pack 08

.

microsoft filter pack 09

 

Im Beispiel geht's recht schnell, sind ja auch nur ein paar Dateien.

 

Volltextsuche läuft nun unter Windows 7 auch mit PPTX, DOCX, usw.

 

Wechsle ich nun zum Windows 7 Client und suche nochmals nach einem Wort aus der Präsentation (hier nur die Buchstaben "dank") wird der Treffer sofort angezeigt. Die Volltextindizierung der Dateien läuft.

Hinweis zum Suchen: Sucht Ihr nach wortbestandteilen, nutzt das Sternchen als Maske (z. B. "*ank" würde dann auch "Vielen Dank" finden").

ENDE DES WORKSHHOPS

 

Weitere Informationen zum Thema Indizieren der neuen Office Dateiformate im Internet


Neueste Beiträge

wvm7x_