世界初の「ファイルサーバ専用」検索システムとして満10年
鉄飛テクノロジーのファイルサーバ全文検索システム「FileBlog」は、2007年の発売から今年で満10年を迎えることができました。
10年前の発売当時、「ファイルサーバ全文検索システム」を名乗る製品はほとんどなく、「ファイルサーバ専用」を明言して売り出したFileBlogは、画面の左端にフォルダツリーを世界で初めて表示した全文検索システム製品でした。
FileBlog発売当時、全文検索エンジン製品は大きく下記の3種類でした。
- インターネット検索
GoogleやYahooなど大手ポータルサイトが提供する
インターネットWebサイト検索システム - Webサイト内検索
企業ホームページや、ニュースサイト、インターネットショッピングサイトなどが提供する
サイト内での記事検索や、商品検索 - エンタープライズ検索
電子メール・ファイルサーバ・グループウェアなど
社内システムを横断的に検索する社内データ検索システム
いずれも当時は1000万円級の投資が必要な高価なシステムで、情報システム部門のITインフラ投資の枠内では手が出ないものでした。しかし3)のエンタープライズ検索について、電子メール検索やグループウェア内検索を諦め、純粋に共有ファイルサーバ検索に対象を絞り込めば、従来より二回りぐらい安価にシステムを提供できました。そのためにFileBlogは設計・開発されました。
10年間下がり続けたファイルサーバ検索システムの構築コスト
ファイルサーバ全文検索システムの構築に必要な総費用は、中小企業や大企業の部門レベルで利用される規模のファイルサーバを対象として考えた場合、この10年間一貫して低下してきています。
最大の要因は、ハードウェア性能が向上して、高性能のPCサーバがより安価に入手できるようになったことです(FileBlogが10年間ライセンス価格を据え置いていることもありますが…)。FileBlogが発売された2007年以降のPCサーバ環境の急激な変化を振り返ってみましょう。
- 2006年―Intelが(Intel Core/ Core 2)を発表し、マルチコアCPUの普及が始まりました。
クワッドコアXeonも2007年からリリースされています。 - 2009年―Windows 2008 R2 で、サーバOSが初めて64bit版のみとなりました。
これ以降、PCサーバへの大容量メモリ搭載が加速しています。 - 2009年―2.5インチHDD同等のSATA規格SSDが発売され、SSDの時代が始まりました。
2017年現在、もはや8コアや16コアのCPUは珍しくもなく、大容量メモリに高速SSDドライブを搭載したPCサーバも、中小企業が普通に導入できる価格帯に降りてきています。
全文検索システムでは、「10年前の不可能が今では可能」に
全文検索システムは、導入時に全文書の内容を一度読み取り、単語に分割して検索用の索引を構築します。この処理は、原理的に文書量に比例して時間がかかるため、かつて数千万~数億文書を扱う全文検索システムの索引構築には何週間も何か月もかかりました。
しかし、多数の文書を読み取ってテキストを単語に分割する処理は、同時に複数文書を並列実行することが可能であるため、大容量メモリを搭載してマルチコア処理が可能な現代のPCサーバでは、10年前の数十倍の速度で処理することが可能になっています。
また、ハードディスクの数十倍の高速アクセスが可能なSSDは全文検索索引の格納先としても理想的です。
10年前に「エンタープライズサーチエンジン」の導入を検討したものの、費用が1000万円以上かかり、導入に何週間もかかる、として断念したケースもかなりあったと聞きます。「エンタープライズ検索はうまくいかない。」という当時の印象をお持ちの方も、今では100万円・1週間で構築できる可能性があるということを、思い出してください。
オープンソース+独自開発で、こだわりと低コストを両立
オープンソースの検索エンジンを使えば、簡単にファイルサーバ検索が実現できるのでしょうか?
実はFileBlog自身、オープンソースの全文検索エンジンとして、現在デファクト標準といえる"Apache Solr"を利用しており、オープンソースの恩恵を存分に享受しています。しかし、「Webサイト内の記事の検索」のような簡単な用途であればオープンソース製品をそのまま利用できますが、「ファイルサーバ検索システム」に求められる機能は、全文検索エンジンだけでは不十分です。
例えば、Windowsファイルサーバを検索する場合、Active Directory などWindowsのログイン認証を受け付け、ユーザのアクセス権に応じた検索結果を表示したり、ファイルの変更をリアルタイムに検知して全文検索索引を自動更新したり、Windowsファイルサーバの運用に寄り添う機能の強化が必要です。また、Microsoft Office(Word/Excel/PowerPoint)文書やPDFなど、主要なファイル形式の文書をブラウザ上でそのまま閲覧できるようにしたり、Windowsエクスプローラ同様のファイル一覧・ファイル操作を可能にしたり、ユーザインタフェースの充実も重要です。
私たちはオープンソース製品を利用しつつ、重要な付加機能やユーザインタフェースは自社で開発しています。
「ファイルサーバ検索」は普及期を迎えています
部門ファイルサーバの全文検索システムや、目的別ファイルサーバの検索システムであれば、
ハードウェア込みで、思っていた以上に現実的な予算で実現が可能になっているかもしれません。
お気軽にご相談下さい。