Ich habe eine FILESTREAM-Tabelle die ausschliesslich PDFs speichert samt Volltextindex.
ANfangs war ich begeistert wie gut ich mit CONTAINS(file_stream,'<Begriff>') suchen kann.
Mittlerweilse klemmt es immer noch und immer mehr:
Problem 1:
Suche nach Beträgen in Rechnungen. CONTAINS(..., '62,71') ACHTUNG KOMMA; funktioniert gar nicht. 62.71 (PUNKT!) funktioniert ab und zu.
Möglicherweise muss der Scuhbegriff länger sein. Wenn ich das PDF durchsuche, dasnn finde ich 62,71 (KOMMA) problemlos
Problem 2:
Ich habe nicht schelcht gestaunt, dass das Wort "Leimbindung" nicht gefunden wird, wohl aber "Block". In dem PDF steht "Block mit Leimbindung".
Sowohl Block wie auch Leimbindung lassen sich im Acrobat Reader oder mit pdfsearch finden.
Ich bin überrascht, dass gerade das lange Leimbindung NICHT gefunden wird, wohl aber das kurze Wort Block. Verschiedentlich las ich, dass der Volltextindex nur Wörter ab einer gewissen Länge berücksichtigt
Problem 3:
Ich öfters nach Begriffen mit mehreren Worten suchen (oder Zahlenfolgen).
Ich weiss, ich kann suchen '<WORT1> AND <WORT2>'. Dazu müsste aber der ursprüngliche Begriffe erst in Worte zerlegt werden
Wie kann ich das lösen?
ANfangs war ich begeistert wie gut ich mit CONTAINS(file_stream,'<Begriff>') suchen kann.
Mittlerweilse klemmt es immer noch und immer mehr:
Problem 1:
Suche nach Beträgen in Rechnungen. CONTAINS(..., '62,71') ACHTUNG KOMMA; funktioniert gar nicht. 62.71 (PUNKT!) funktioniert ab und zu.
Möglicherweise muss der Scuhbegriff länger sein. Wenn ich das PDF durchsuche, dasnn finde ich 62,71 (KOMMA) problemlos
Problem 2:
Ich habe nicht schelcht gestaunt, dass das Wort "Leimbindung" nicht gefunden wird, wohl aber "Block". In dem PDF steht "Block mit Leimbindung".
Sowohl Block wie auch Leimbindung lassen sich im Acrobat Reader oder mit pdfsearch finden.
Ich bin überrascht, dass gerade das lange Leimbindung NICHT gefunden wird, wohl aber das kurze Wort Block. Verschiedentlich las ich, dass der Volltextindex nur Wörter ab einer gewissen Länge berücksichtigt
Problem 3:
Ich öfters nach Begriffen mit mehreren Worten suchen (oder Zahlenfolgen).
Ich weiss, ich kann suchen '<WORT1> AND <WORT2>'. Dazu müsste aber der ursprüngliche Begriffe erst in Worte zerlegt werden
Wie kann ich das lösen?