FileBlogは、既存のファイルサーバを丸ごと公開対象・検索対象にする使い方を想定しています。当然、何十万・何百万という数のファイル保存されることも想定しなければなりません。 FileBlogの製品リリース後、実際に100万文書・テラバイトを越える文書数量を持つお客様環境への導入を行ってまいりました。

50万件の壁を突破する ―スタンダード版
正直に告白しますと、FileBlogも1年ほど前は大規模環境対応が不十分でした。 おおよそ50万文書を登録するあたりから、検索が遅くなったり、ファイルを登録している最中にインデックス(索引情報)が破損したりと、 さまざまのトラブルに見舞われたのです。
しかしながら、繰り返しテストを行う中で原因が少しずつ判明し、高負荷環境での安定性が獲得できました。
FileBlogスタンダード版では、おおよそ50万文書~100万文書弱までを実用的な性能で扱えると考えています。

100万件の壁を突破 ―エンタープライズ版
次に突き当たったのは、100万件の壁でした。検索エンジンが1つのインデックス(索引)で管理する文書量が増えると、性能が低下します。 また、1つの検索エンジンに多数のユーザが同時アクセスしても、性能が低下します。
そこで、1つのサーバ上で、検索エンジンを複数同時起動することを可能にしたのが、エンタープライズ版です。 2008年春に開発したエンタープライズ版によって、100万件を越える文書数での運用が現実的に可能になりました。

1000万件の壁に挑む ―エンタープライズPLUS版
2008年春、ある大手メーカー様から数TB・数千万ファイル規模のファイルサーバを対象とした検索システム構築のご相談を受けました。 お客様の求める性能は、FileBlogの当時の能力を大きく越えるもので、100万件近い文書を1時間程度でインデックス(索引)付けしたいというものでした。
まずはエンタープライズ版をチューニングして性能アップに取り込みましたが、到底目標には届きませんでした。 そこで開発したのが「エンタープライズPLUS版」です。こちらのバージョンでは、オープンソースでより高性能で定評のある 「Apache Solr」という検索エンジンを採用してみましたところ、以前の「エンタープライズ版」の4倍~5倍の性能を達成できました。

さらなる挑戦へ
私たちは実用的なファイルサーバ検索システムは、軽くて速くなくてはいけないと考えています。 より多くの文書が私たちの前に出現したら、より強力なシステムで乗り越えて参ります。
ぜひ、「こんなファイルを多数持っているのですが~」というお話を、お寄せ下さい。