japan.internet.com The Internet & IT Network


RSSニュース検索
カテゴリ
> トップページ
> Webビジネス
> Eコマース
> Webファイナンス
> Webマーケティング
> パブリック
> Webテクノロジー
> 携帯・ワイヤレス
> Linux Today
> Linux Tutorial
> J.I.C.ブログ
キャリア
> 転職ならen
> 派遣ならen
> アルバイトならen
> IT求人情報
ヘッドライン
> 今日のヘッドライン
> 週間ヘッドライン
Special Link
> 求人情報はe-aidem
> ロレックス
> 合宿免許
> フォトコミュニティ
> ストックフォト
> クリップアート
> イラスト
イベント&セミナー
> イベントカレンダー
> 書評「IT の耳」
> 出張・接待検索
> ニュースガジェット 注目
無料ニュースメール
> 新規登録
> 変更・解除
> オプトインメールの登録・変更・解除
インフォメーション
> パートナーサイト
転職ならエン
就職ならen
求人ならen
履歴書ならen
アルバイトならエン
CRM/SFAならオラクル
> 会社概要地図
> グループ会社
株式会社アエリア
(株)サンゼロミニッツ
株式会社エアネット
> お問い合わせ
> 広告掲載について
> リンクについて
> 著作権について
> その他お問い合わせ
> 利用規約
> 個人情報保護方針
Webテクノロジー 2007年5月23日 09:00
Webテクノロジー・バックナンバー
情報共有システムに関するデータ寄りの視点

著者: 小松宏行 プリンター用 記事を転送
2007年5月23日 09:00 付の記事
国内internet.com発の記事
このエントリーを含むはてなブックマーク この記事をクリップ! Buzzurlにブックマーク Yahoo!ブックマークに登録 newsing it!

Web2.0 という言葉もそろそろ聞き飽きた、というかあまり聞かれなくなったという感じがあり、流行り物が大好きな日本人としては「Web2.0 って過去だよね〜」などと宣言して、連載を始めてみたい気もしました。

が、しかし私は仮にもハードコアな技術魂を持っていることを周囲に標榜しているので、流行り廃りでものの価値を決めてしまうことはしたくない、と考え直して、襟を正して、技術的な視点を大切にしてコラムを書いていこうと考えています。

■ 定型データと非定型データ

前任者のコラムの延長で、まずグループウェア、インフォメーション ポータルといった(業務系との対比の意味での)情報系のシステムに関して考えてみます。業務系、情報系といったややあいまいな言い方でなんとなく区別がつきそうでつかないのですが、取り扱うデータの側面から考えると、定型データと非定型データの違いと捉えることができます。

商品番号、仕入先、原価、顧客名、発送日、請求書番号、住所、電話番号… これらはデータ タイプがはっきりしています。これらのデータ構造に対して、関係モデルを用意したり、オブジェクトとして各種メソッドを設計したりすることもできます。このようなデータ構造がシステムの主たる構成データである場合に、そのシステムを定型データ上のシステムと呼ぶことにしましょう。それに対して、非定型データ上のシステムを考えてみます。

■ 非定型データは扱いにくい

電話でのコミュニケーションにおける通話内容を例に取りましょう。通話自体に課金するような目的には通話開始時間、通話総時間や掛けた側の情報、受けて側の情報などの定型データが登場しますが、通話の中身は非定型です。課金に関するシステムが定型データを主に扱うシステムであるのに対して、この場合の会話の中身を扱うシステムが非定型データを扱うシステムです。

その会話の内容がビジネス上重要なものに限定したとしても、「明日の待ち合わせ場所と時間について」かもしれないし「受注した商品が期日までに納品されるかどうかの確認」かもしれないし「コードネームで呼ばれる秘密プロジェクトの進捗状況」かもしれません。非定型のデータは日常のコミュニケーションで交わされている内容ですから、「そこになんらかの知識が存在しているがあらかじめその内容を分析するほどに定式化されてはいない」という扱いにくいものです。

こういったものを総称して知識(ナレッジ)と称して集めておき、日時、書き手などの参考となる定型データをタグとしてラベルして保存しておくのが非定型データのデータベースです。

■ タグつき非定型データ

この非定型データの取り扱いを考える場合、内容や意味を分析することなしにデータに対するメソッドをほとんど考えつきません。すぐに思いつくのは文字数とか文の数程度でしょうか。もちろんこれではそれらのデータは知識として役に立つ内容にはなりません。

そこで、できるだけ多くの定型データをタグとしてつけておくと扱いやすいデータになります。会話の日時、会話者、会話内容のキーワードなどです。しかし、これらの定型データを補完すればするほど、日常会話的なコミュニケーションから書類による定型コミュニケーションのような、コミュニケーション自体のコストが高くなっていきます。

■ 自然文解析のアプローチ

そこで、自然なコミュニケーションに近いデータに関してシステムの側が有用な定型データを構成する方法を考えましょう。そこでは非定型データに対しての内容や意味の分析が重要となってきます。Nグラムとか形態素分析とかいった手法でテキストの構造をもとに意味内容を抽出する方法です。全文検索技術の基礎になっている手法です。データ間の類似度をベクトル空間法などのやり方をもとに並べてデータの意味的ソートを行う方法も考えられます。

■ ネットワーク分析のアプローチ

その他にネットワーク的なアプローチがあります。ハイパーリンクはテキスト間のレファレンスであるから、複数のハイパーテキストを考える場合には、ここのテキストの情報だけでなくリンクを分析することも有意義に思われます。実際、このネットワーク的な分析を使うとテキストの分析に新しい有効な手法が得られるのですが、例を挙げると Google のサーチエンジンや商用サイトのリコメンデーション エンジンがあります。こうしてみると、ネットワーク的なアプローチが非定型データの典型であるドキュメントの分析に新しい地平を開いたことが見えてくると思います。

■ 大きく二極にわける

このように考えるとノウハウとか知識と呼ばれる非定型のデータに関して、タグ付けアプローチのように、業務分析と同様の手法を駆使して収集するデータの構造を限定して有効な知識に組み立てるか、とりあえず、自然文解析やネットワーク分析のように非定型のままデータを集めて分析的手法を駆使して知の内容を浮き上がらせるか、大きく分けて2方向からのアプローチが見えてきます。

■ 予告

次回は知の共有を目的とする場合に重要な要素となる情報発信者側の制約条件を考えてみます。そこでは Web2.0 の非定型データ上のシステムへのアプローチがはっきりするでしょう。






関連記事
  • 社内 SNS 導入率は9.4%、社内 Blog は4.4%
  • 日立情報とマイクロソフト、2007 Office system で協業
  • ナレッジマネジメントルネッサンス
  • アリエル、RSS/Atom の読込ができるマルチスケジューラ 4.7.1
  • EIP の究極は、多分、ポータルでなくなる


  • 関連テーマ
  • Google


  • ★最新トップニュース
    国内 Adobe Flash Player 10 パブリックベータ版を公開(Webテクノロジー 5月16日 18:10)
    米国 Adobe Systems は、2008年5月15日、「Adobe Flash Player 10」(コードネーム:Astro)のパブリックベータ版を Adobe Labs で公開したことを発表した。
    国内 【今週の Web ミミズク】CBS の高価な買い物、グリッドは地球を救えるか、四川州地震のネット募金(Webファイナンス 5月16日 18:00)
    今週のビッグニュースは、なんといっても、CBS による CNET の買収だ。買収総額は18億ドル、だそうだが、この金額は高いか、安いか。
    国内 TI、WUXGA 対応の「.95 WUXGA DLP チップ」を発表、対応 DLP プロジェクタ製品も登場(Webテクノロジー 5月16日 17:50)
    Texas Instruments(TI)は、2008年5月13日、同社初となる1,920×1,200ピクセルの解像度を持つ WUXGA プロジェクタ向けの「.95 WUXGA DLP チップ」を発表した。
    国内 社会保険庁の国民年金保険料クレジットカード収納業務を GMO-PG が受託(パブリック - ニュース 5月16日 17:30)
    非対面クレジットカード決済事業を展開する、GMO ペイメントゲートウェイ株式会社(GMO-PG)は、2008年8月1日から2009年3月31日まで、社会保険庁の国民年金保険料のクレジットカード収納に係るカード番号管理等の業務を受託すると発表した。
    海外 【中国】中国移動、中国 TD 規格を5月末に 3.5G 規格にアップグレード(携帯・ワイヤレス 5月16日 17:00)
    5月15日、中国国内メディアの報道によれば、中国移動(チャイナ・モバイル)は5月末に TD 規格(TD-SCDMA:中国独自の 3G 通信規格)を3.5G 規格(TD-HSDPA)にアップグレードさせることを明らかにしたという。
    トピックス
    > オススメのIT系求人情報【毎週月曜日更新】
    footer_301.gif


    リサーチ
    > デイリーリサーチDLサイト
    > OnlineResearchPortal (リサーチデータバンク)
    > モバイルリサーチ with goo
    footer_301.gif
    キーワード
    > Youtube > BlackBerry
    > CGM > SaaS
    > アクセス解析 > LPO
    > テーマ一覧はこちら
    footer_301.gif
    セミナー情報
    > 第1回インターネットコムマーケティングセミナー「新規クライアントを効率的に獲得する Web マーケティング手法とは」(3月26日)多数のご参加ありがとうございました
    footer_301.gif
    デベロッパー
    > DevX
    > CodeGuru
    > developer.com
    footer_301.gif
    j.i.c.ブログ
    ブログ一覧
    Graphic Design Forum 【Graphic Design Forum】
    経済の混乱とフリーランス (5月16日)
    データメーション 【データメーション】
    IT 業界の女性について:(ハッと息をのむ)ある少女の観点(5月16日)
    ジュピターメディア創設者がITを斬る 【ジュピターメディア創設者がITを斬る】
    CNET が CBS に買収(5月16日)
    ベンチャー専門家の目利きブログ「なぜこの企業は伸びるのか?」 【ベンチャー専門家の目利きブログ「なぜこの企業は伸びるのか?」】
    「微生物、たんぱく質に隠された無限の可能性に挑戦!!」/株式会社サティス製薬(5月16日)
    japan.internet.com テクノログ 【japan.internet.com テクノログ】
    5月4日(日)〜5月10日(土)(5月13日)
    最新テクノロジーの意外な処方箋 【最新テクノロジーの意外な処方箋】
    アクセンチュア・テクノロジー・ラボプロジェクト:REST(Reducing Effort in Script-based Testingスクリプトテストの負荷軽減)(5月12日)
    footer_301.gif
    最新コラム一覧
    IT マネジメント IT マネジメント

    Steve Ballmer 氏が辞任すべき理由(5月16日)
    15 seconds 15 seconds

    AJAX SlideShowおよびTreeViewコントロールを使用してスライドショーを作成する(5月16日)
    最新アフィリエイト事例にみる成功の法則 最新アフィリエイト事例にみる成功の法則

    アフィリエイト市場動向(5月16日)
    最新ハイテク講座 最新ハイテク講座

    全自動からオゾンの力まで!ハイテク洗濯機の最新事情(5月16日)
    百式のネットビジネス研究 百式のネットビジネス研究

    手書き入力で中国語を検索できる辞書サイト「nciku」(5月16日)
    週刊-サイト別アクセス状況データ 週刊-サイト別アクセス状況データ

    ビデオリサーチインタラクティブ調査(月間インターネットオーディエンスデータ)(5月15日)
    「IT の耳」 「IT の耳」

    【書評】『ウェブを変える10の破壊的トレンド』(5月15日)
    検索エンジンマーケティング 検索エンジンマーケティング

    中国検索エンジン市場シェアを巡る攻防(5月15日)
    気になるオープンソースソフトウェア 気になるオープンソースソフトウェア

    オープンソースのアプリケーションサーバー Apache Geronimo(5月15日)
    気になるトレンド用語 気になるトレンド用語

    ネットの危機?自由が奪われる「青少年インターネット規制法案」(5月14日)
    footer_301.gif
    専門チャンネル
    > セキュリティチャネル > テレコムチャネル
    > サーチエンジンウォッチ
    footer_301.gif
    海外のインターネットコム アメリカ韓国ドイツトルコ
    関連企業のサイト:ストックフォト イラスト ネットストリート ホテル予約サイト タウン情報 出張 事業継承 シミュレーション トランクルーム 優待映画チケット 田舎暮らしガイド オリジナルTシャツ ニタコエ
    Copyright 2008 Jupitermedia Corporation All Rights Reserved. http://www.internet.com/
    space.gif space.gif