japan.internet.comThe Internet & IT Network
Twitter
RSS
  • ニュース
  • コラム
  • リサーチ
  • ヘッドライン
  • 特集
  • ブログ
  • プレスリリース
  • 専門チャンネル
  • イベント
  • ランキング
  • ニュースメール
2009年11月24日
文字サイズ文字サイズ小文字サイズ中文字サイズ大
事業仕分けによる次世代スーパーコンピューターの開発予算削減について、どうお考えですか?
賛成
反対
どちらとも言えない
投票締切 11/30 12:00
Webテクノロジー コラム2005年10月26日 09:00
P2P とコラボレーション
P2P とコラボレーション アリエル・ネットワーク(ありえる・ねっとわーく)メールホーム
自社開発の P2P フレームワークを元に、コラボレーションソフトの開発・販売や、P2Pアプリケーション開発のコンサルティングを行っている。

mod_estraier――Proxy 型 Web 検索システム

国内国内internet.com発の記事
前回はサーバサイド P2P による全文検索エンジン「HyperEstraier」を紹介しました。 前回紹介した時はβ版でしたが、 先日(10月17日)にバージョン1.0が正式リリースされました。

さて今回は、HyperEstraier を利用した「mod_estraier」を紹介します。

mod_estraier は最新バージョンが 0.0.7(10月21日現在)です。 バージョン番号を見ても分かる通り、 まだ始まったばかりのプロジェクトで、 今後仕様が大きく変わる可能性もあります。

mod_estraier は Apache のモジュール(プラグイン)です。 mod_estraier を導入することで、 Apache がプロキシとして動作します。

各クライアントからこのプロキシを通して Web にアクセスすると、 逐次、プロキシを通過した文書が HyperEstraier のインデックスに登録されます。 インデックスを通過したドキュメントは、 mod_estraier の検索インターフェイスを通して検索することができるようになります。

Google 的な Web の検索では、 世界中のWebコンテンツをインデックシングします。 これは世界中のコンテンツを洩れることなく検索することができますが、 検索結果が膨大になったり、ごみの情報が多くを占めるようになります。

mod_estraier のアプローチでは、 世界中のコンテンツは検索対象にはなりません。 mod_estraier を通過したコンテンツだけが検索対象になります。 グループや会社の部署単位で利用すると、 その組織で必要としている情報が自然とインデックス化されていきます。

del.icio.us のようなソーシャルブックマークシステムでは、 各ユーザーが明示的に「ブックマークする」行為が必要です。 mod_estraier では、明示的な作業は必要なく、 普段の作業がそのままブックマークする行為につながります。

自分が必要としている情報は、 自分の属している組織やグループで必要としていることが多いので、 自分が得た情報から他の人が検索することで、 必要な情報へアクセスしやすくなります。 ユーザーへの負担がなく、 通常の行為が自分や他人の利益(情報の取得のしやすさ)につながるため、 とても便利です。

mod_estraier は、 ベースとなる検索エンジンに HyperEstraier を使っています。 つまり、 mod_estraier も HyperEstraier のひとつのノードとして動作します。 これにより mod_estraier 同士を P2P 的につなぎ合わせて、 大規模な検索 DB を作成したり、負荷分散できます。

ある会社に導入する場合を考えてみましょう。 部署単位に mod_estraier を導入することで、 部署内のユーザーが見たことのあるコンテンツは検索対象になります。

次に、部署ごとの mod_estraier のノードを P2P で接続することで、 自分の部署のユーザーが見たコンテンツだけでなく、 全社員が見たコンテンツも検索対象になります。 これで、大規模な検索 DB が利用でき、 負荷分散にもなります。

部署の中との結び付きや必要な情報は、 他の部署にとってはそれほど重要でない場合があります。 営業と開発の部署では、 同じキーワードで検索しても必要としている情報は違ってきます。 P2P により mod_estraier 同士をつなぎ合わせて、 大規模な DB を利用できるだけでは不十分です。

HyperEstraier には各ノードごとに検索結果の重み付けを変えることができます。 営業のノードが開発のノードに検索を依頼した場合、 この重み付けを変化させることで、 検索結果の順位を変動させることができます。 営業の人には、 営業が必要としている情報を検索の上位に出すことができるようになります。

冒頭にも述べましたが、 mod_estraier はまだ開発が始まったばかりのプロジェクトです。 荒削りのところもありますが、 今後の可能性が期待され、 夢が膨らむプロジェクトです。 オープンソースで開発が進められているプロジェクトで、 日本人が開発していますので、 もし、興味を持たれたら開発に参加してみてください。 (執筆:大谷弘喜)

Graphic Design Forum
【Graphic Design Forum】
流動的媒体と静的媒体に関する見解(11月18日)
アイレップの SEM フロンティア
アイレップの SEM フロンティア
検索技術の進化で広がる SEO 領域―2010年以降に要求される事は?(11月24日)
百式のネットビジネス研究
百式のネットビジネス研究
外国で見かけた標識を写真に撮ると翻訳してくれる iPhone アプリ「PicTranslator」(11月24日)
DevX
DevX
HTML 5のフォーム要素(11月24日)
エンジニア転職ノウハウ開発室
エンジニア転職ノウハウ開発室
エンジニア的「合わない」と思う瞬間/理系の人々(11月24日)
「IT の耳」
「IT の耳」
【書評】『Hyper-V スタートアップバイブル』――仮想化についてのすぐれた解説書(11月20日)
週刊-サイト別アクセス状況データ
週刊-サイト別アクセス状況データ
ビデオリサーチインタラクティブ調査(月間インターネットオーディエンスデータ)(11月19日)
海外ソーシャルウェブに学ぶ成功の秘訣
海外ソーシャルウェブに学ぶ成功の秘訣
ゲーム業界を襲う世界的な激震。ソーシャルゲーム急成長のインパクト(11月19日)
成約率、反応率を上げる Web 文章術
成約率、反応率を上げる Web 文章術
文章力を磨き、キャッシュを生み出す Web サイト に(11月19日)
今さら聞けない初歩からのアクセス解析
今さら聞けない初歩からのアクセス解析
サイトリニューアル前のアクセス解析活用法(11月19日)
「Webからの脅威」―その傾向と最新対策
「Webからの脅威」―その傾向と最新対策
新たな対策技術:スパムフィルタリングと E-mail レピュテーション(11月18日)
Copyright 2009 Japan Internet.com K.K. All Rights Reserved.http://www.internet.com/