Technology
テクノロジー
知識データはなぜ非定型なのか?
■ Prolog でもやってみる?
知識を共有して活用するためのシステムは非定型データに基づくものになる傾向があります。そもそも、知識とかノウハウというものは、十分な粒度をもってデータに分解しにくい側面があります。
例えば知識やノウハウが命題の形に表現できると考えます。この命題の形にブレークダウンされた知識のデータベースに対してパターマッチングを行って推論をするのが Prolog ですが、このアプローチにはフレームの問題といわれるものが存在し、有益な結論を導き出すにはフレームの制限を行う必要があります。
さらにデータベースを作るために知識を整理したり矛盾する事項に対して検討を加えたりしなければ実用的ではありません。命題の粒度でデータを揃えたとしても結論を導き出すのに手間と時間がかかるのであれば知識データベースとして妥当ではありません。
文章や会話の内容をブレークダウンして命題に落とす作業自体がすでに知識の一部を犠牲にしている可能性もあります。文書の順序とか美的な表現とか、コンテキストに基づく状況とかそういったものは定型命題からは失われがちです。
■ 知識はとにかくたくさん集めよう
命題よりも大きく括った知識の形式として文章であったり会話内容であったりを考えると、非定型なデータを考えるということになります。自然な文章には一面的な捉え方では捕らえきれない知識がつまっています。「いったいこれは知識として共有すべきなのか?」と考えてしまうような些細な事項であっても自分の想定もしない別の問題に直面している人にとっては非常に有用なこともあります。
また、直接的に役に立たなくても、アナロジーとしてでも参考にはなる知識もあるでしょう。アンケートのように多くの人から応答を得られると価値が増すものもあります。どれがどういう局面で役に立つかわからないからこそ、いろいろな知識をデータベースの中に揃えておく必要があります。
無駄な情報に関してはまた別の機会に考察を加えるとして、ここでは知識データベースは多ければ多いほど良い、と言い切ってしまいましょう。「知識は大量に収集してこそ意味がある」ということです。大量に収集するにあたっては、情報の発信者から見ると「容易に情報が発信できる」ということは非常に重要なポイントとなります。効果的な知識共有システムは情報を供給しやすいシステムである、といえるでしょう。
■ 定型だと書き込みにくい
情報発信をする際にデータの定型要素は増えれば増えるほど情報発信の敷居が高くなります。例えば、書き込みに際して「日時」「場所」「提案製品」「同行者」「顧客側担当者情報」などと定型データを書き込むような画面が表れたとしましょう。
このシステムは明らかに営業日誌に相当する定型データで、SFA(Sales Force Automation)に書き込むような感じがするでしょう。「このシステムにはなんでも書き込んでいいよ」といわれていた場合でも、「昨日の夜、前から気になっている立ち飲みバルに行ってみたけど、料金リーズナブルでよかったよ」というような情報は書き込みにくいでしょう。
なぜ伏せておきたい「同行者」を記述する欄があるのか、まったく「顧客側担当者」については考えないで出かけたのだが、いけないのか?とか書き込みを中断させるデータ型になっています。(ところで、アンケート回答は自由回答より定型にチェックをつけるだけのやり方のほうが回答しやすいと思われますね。確かにそうですが、知識データベースに入れるべき内容はアンケート結果であって、これは非定型といえます。そのデータを得るためにインターネットもしくは双方向マスコミュニケーション的な手法を使うということです。上でデータの多さに価値がある話をした際にアンケートに言及しているので、一応念のために述べておきます。)
■ Blog は書きやすい
その点、日記(同じではありませんが細かい定義論は本質的でないので Blog と呼んでおきましょう)という形態は「書き込みに際しての時間」「タイトル」「本文」「書き手」程度の項目で、定型性のほとんど感じられないフォーマットでかかれるため、書き込む際の障壁は少なくなっています。
ここに Blog が知識共有の方法論の最前線にクローズアップされている理由があります。発信者が書き込みやすい形態はどういったものか?という問いに非常に説得力のある形(つまり多くの個人が Blog という形態を使ってインターネットで情報を発信しているという現実)で書き込みのしやすさが評価されていると考えます。Blog で書いてたくさん情報を共有しようということです。
■ 予告
共有ができたらそのデータベースをいかに活用して結果を出すかという話になりますが、その前にもう少しデータ供給者として人間側の側面を考えてみたいと思います。そこで、次回は知識の共有において集団の雰囲気とか匿名アプローチの意義などについて検討をしてみましょう。
知識を共有して活用するためのシステムは非定型データに基づくものになる傾向があります。そもそも、知識とかノウハウというものは、十分な粒度をもってデータに分解しにくい側面があります。
例えば知識やノウハウが命題の形に表現できると考えます。この命題の形にブレークダウンされた知識のデータベースに対してパターマッチングを行って推論をするのが Prolog ですが、このアプローチにはフレームの問題といわれるものが存在し、有益な結論を導き出すにはフレームの制限を行う必要があります。
さらにデータベースを作るために知識を整理したり矛盾する事項に対して検討を加えたりしなければ実用的ではありません。命題の粒度でデータを揃えたとしても結論を導き出すのに手間と時間がかかるのであれば知識データベースとして妥当ではありません。
文章や会話の内容をブレークダウンして命題に落とす作業自体がすでに知識の一部を犠牲にしている可能性もあります。文書の順序とか美的な表現とか、コンテキストに基づく状況とかそういったものは定型命題からは失われがちです。
■ 知識はとにかくたくさん集めよう
命題よりも大きく括った知識の形式として文章であったり会話内容であったりを考えると、非定型なデータを考えるということになります。自然な文章には一面的な捉え方では捕らえきれない知識がつまっています。「いったいこれは知識として共有すべきなのか?」と考えてしまうような些細な事項であっても自分の想定もしない別の問題に直面している人にとっては非常に有用なこともあります。
また、直接的に役に立たなくても、アナロジーとしてでも参考にはなる知識もあるでしょう。アンケートのように多くの人から応答を得られると価値が増すものもあります。どれがどういう局面で役に立つかわからないからこそ、いろいろな知識をデータベースの中に揃えておく必要があります。
無駄な情報に関してはまた別の機会に考察を加えるとして、ここでは知識データベースは多ければ多いほど良い、と言い切ってしまいましょう。「知識は大量に収集してこそ意味がある」ということです。大量に収集するにあたっては、情報の発信者から見ると「容易に情報が発信できる」ということは非常に重要なポイントとなります。効果的な知識共有システムは情報を供給しやすいシステムである、といえるでしょう。
■ 定型だと書き込みにくい
情報発信をする際にデータの定型要素は増えれば増えるほど情報発信の敷居が高くなります。例えば、書き込みに際して「日時」「場所」「提案製品」「同行者」「顧客側担当者情報」などと定型データを書き込むような画面が表れたとしましょう。
このシステムは明らかに営業日誌に相当する定型データで、SFA(Sales Force Automation)に書き込むような感じがするでしょう。「このシステムにはなんでも書き込んでいいよ」といわれていた場合でも、「昨日の夜、前から気になっている立ち飲みバルに行ってみたけど、料金リーズナブルでよかったよ」というような情報は書き込みにくいでしょう。
なぜ伏せておきたい「同行者」を記述する欄があるのか、まったく「顧客側担当者」については考えないで出かけたのだが、いけないのか?とか書き込みを中断させるデータ型になっています。(ところで、アンケート回答は自由回答より定型にチェックをつけるだけのやり方のほうが回答しやすいと思われますね。確かにそうですが、知識データベースに入れるべき内容はアンケート結果であって、これは非定型といえます。そのデータを得るためにインターネットもしくは双方向マスコミュニケーション的な手法を使うということです。上でデータの多さに価値がある話をした際にアンケートに言及しているので、一応念のために述べておきます。)
■ Blog は書きやすい
その点、日記(同じではありませんが細かい定義論は本質的でないので Blog と呼んでおきましょう)という形態は「書き込みに際しての時間」「タイトル」「本文」「書き手」程度の項目で、定型性のほとんど感じられないフォーマットでかかれるため、書き込む際の障壁は少なくなっています。
ここに Blog が知識共有の方法論の最前線にクローズアップされている理由があります。発信者が書き込みやすい形態はどういったものか?という問いに非常に説得力のある形(つまり多くの個人が Blog という形態を使ってインターネットで情報を発信しているという現実)で書き込みのしやすさが評価されていると考えます。Blog で書いてたくさん情報を共有しようということです。
■ 予告
共有ができたらそのデータベースをいかに活用して結果を出すかという話になりますが、その前にもう少しデータ供給者として人間側の側面を考えてみたいと思います。そこで、次回は知識の共有において集団の雰囲気とか匿名アプローチの意義などについて検討をしてみましょう。
記事提供:
アリエル・ネットワーク株式会社
New Topics
Special Ad
| “超高速無線 LAN 時代”の幕開け--新規格 11ac(Draft)に対応したバッファロー最新ルーターの潜在能力を試す | |
![]() |
バッファローは次世代無線 LAN 規格 IEEE802.11ac(Draft)通信速度最大 1,300Mbps 対応無線 LAN ルーター「WZR-1750DHP」を3月下旬に販売開始。今回、同機器を入手できたので、使用感や便利な機能についてレポートしたい。⇒詳細記事へ |
Hot Topics
IT Job
今週のIT求人情報
Interviews / Specials
Follow japan.internet.com
Popular
Access Ranking
Partner Sites










