Die Tücken von CONTAINS ...

drnicolas

Benutzer
Beiträge
12
Ich habe eine FILESTREAM-Tabelle die ausschliesslich PDFs speichert samt Volltextindex.

ANfangs war ich begeistert wie gut ich mit CONTAINS(file_stream,'<Begriff>') suchen kann.

Mittlerweilse klemmt es immer noch und immer mehr:

Problem 1:
Suche nach Beträgen in Rechnungen. CONTAINS(..., '62,71') ACHTUNG KOMMA; funktioniert gar nicht. 62.71 (PUNKT!) funktioniert ab und zu.

Möglicherweise muss der Scuhbegriff länger sein. Wenn ich das PDF durchsuche, dasnn finde ich 62,71 (KOMMA) problemlos

Problem 2:
Ich habe nicht schelcht gestaunt, dass das Wort "Leimbindung" nicht gefunden wird, wohl aber "Block". In dem PDF steht "Block mit Leimbindung".
Sowohl Block wie auch Leimbindung lassen sich im Acrobat Reader oder mit pdfsearch finden.
Ich bin überrascht, dass gerade das lange Leimbindung NICHT gefunden wird, wohl aber das kurze Wort Block. Verschiedentlich las ich, dass der Volltextindex nur Wörter ab einer gewissen Länge berücksichtigt

Problem 3:
Ich öfters nach Begriffen mit mehreren Worten suchen (oder Zahlenfolgen).
Ich weiss, ich kann suchen '<WORT1> AND <WORT2>'. Dazu müsste aber der ursprüngliche Begriffe erst in Worte zerlegt werden

Wie kann ich das lösen?
 
Werbung:
Ohne auf deine Fragen konkret einzugehen, Volltextsuche ist komplex und konfigurierbar.
Es beginnt mit den Fragen der Server Version, wurde der Wizard genutzt oder SQL zur Erzeugung des Index?
Ist dir grob das Prinzip klar und warum Zahlen dazu im Widerspruch stehen könnten?
Weiter
Welche Sprache wurde definiert?
Welcher Aktualisierungsmodus?
Welcher catalog ?
Stoplist vom System? Sprache?
...
 
Werbung:
Den Volltextkatalog habe ich vor ewigen Zeiten definiert - die genauen Angaben muß ich mal versuchen herauszufinden.
Aber ich habe sicherlich einfach die Defaults übernommen.
 
Zurück
Oben