現在位置: ホーム ブログ PDFファイルを全文検索
ブログ

PDFファイルを全文検索

検索対象としてPloneの中にPDFファイルを入れることで、全文検索の対象になります。検索対象としてファイル名及びファイルの中身を全文検索できます。これは日本語にも対応しています。

仕組み

このBlogで何度も紹介していますが、Ploneには日本語に対応した全文検索エンジンが内蔵されています。英語などの欧米言語はもちろん、中国語や韓国語にも対応しています。

PDFのファイル内を全文検索させるためには、Ploneをインストールする際に、xpdfモジュールを前もって入れておく必要があります。

これにより、PloneにPDFファイルをアップロードした時に、自動的にPDF内から本文を抜き取り、Ploneのインデックスに入れる仕組みになっています。

設定等

特に設定は不要です。前もってxpdfモジュールが入っていれば、自動的に検索対象になります。

使い方

PDFがPloneの中にあれば、Plone標準の検索ボックスから検索すれば自動的にピックアップされます。

Ploneの検索は、アクセスしているユーザの権限で閲覧できるものだけをピックアップしてくれますので、ログインユーザにしか見せたくないというファイルが存在すれば、セキュリティの設定やワークフローで閲覧を制限しておけば、不要なものは検索対象に成りません。

その他

PDFにだけではなく、Microsoft Word や Microsoft Excel を始めオープンドキュメント形式のLibre OfficeやOpen Offeceのファイルの中身を全文検索するプロダクトを公開しています。詳しくは「Ploneプロダクトの紹介(1) MS-Officeファイルを全文検索可能に」のエントリーを参照して下さい。

comments powered by Disqus