4/28集合知とウェブサービス~ウェブが今、面白い~

今回は、集合知とウェブサービス~ウェブが今、面白い~という題で、東京大学大学院工学研究科技術経営戦略学専攻の井川さんが、集合知の発想、その可能性の大きさについて素人にも分かりやすく説明してくれました。時代の先端をゆくテーマを、かなりポジティブに噛み砕いて説明してくれたので、聞いていてわくわくすることが多かったとともに、議論も盛り上がりました。まずは、数年前から話題のキーワード、WEB2.0から話が始まりました。共通点として、HTMLが分からなくても使えるということ、個人でも簡単に情報発信できるということ、そして現実世界とウェブが近いということをあげていました。WEB2.0以降、情報は相互方向になりました。企業と個人の関係でいえば、基本的に企業側から個人側への一方的な情報の流れしかなかった状態から、個人から企業側への流れもできました。例えば、以前であればマクロミルに依頼したり、1000人にアンケートを取って得ていた情報を、ブログのアクセス解析を行うことで得られるようになりました。また、お店ならフーム、ぐるなびといったサービスが、音楽であればLastfmのような、WEB2.0ならではのサービスが続々と生まれています。こういった状況から、集合知の発想というものが生まれてきます。ここでいう集合知(Collective Intelligence)とは、普通の人の集団と一握りの天才とを比較したときに、一般的な判断については、普通の人の集団の判断の方が優れているという考えが成り立つとし、個々人の意見を集約するものです。(Wikipediaのように1部の人が編集するものを集合知と呼ぶ場合もありますが、ここではCollective Intelligenceを指します。)身の回りの集合知について挙げてみると、クイズミリオネアのオーディエンス、Yahoo知恵袋、Googleページランク、はてなブックマーク等がすぐに浮かびます。Googleのページランクはリンクを貼ること即ち口コミという仕掛けであり、はてなブックマークではGoogleでは上位にランクされないページでも、たくさんブックマークされているページあるかもしれないといった発想からブックマーク数を見ているものです。次に集合知の研究の話に移ります。ここでも、いくつも例を挙げて分かりやすく説明してくれました。初めに、アメリカ人の心情を調べた研究の例です。ブログでGreat、Happyが使われた数から2009年のアメリカについて調べたところ、一番アメリカ人が喜んだ日はオバマが就任した日、悲しかった日はMJが亡くなった日であると分かったという興味深いものでした。2番目に株価予測。美人コンテストとも揶揄されるそうですが、ブログに明日の為替、日経平均の予測が書かれている情報をすべてクローリングしたところ、30日間クローリングL+株購入でプラスになったということです。3番目に地震速報。これはtoretterでは震源地、津波の有無は分からないが、twitterのつぶやきからより速く自信の情報を速報できるのではないか、というものです。4番目は金融商品。ローンを払えなくなる条件を履歴から抽出し、プラン変更を提示するものです。その他、インターネット民主党、CAPTAを応用した古書の解析、画像処理と個人が入力した料理情報を集積しているフードログ、電話のログなどから抽出している音声認識技術の話など、本当に身近な生活に関連する、興味深いものばかりでした。次に、集合知の作り方、そして知恵を抽出するための方法についての話がありました。実際に挙げていたものとしては、データマイニング、協調フィルタリング、Linuxのようなオープンソースインテリジェンス、クラウドソーシング等があります。協調フィルタリングとは、アマゾンのRecommend等で使われているもので、ベクトルの内籍計算によってデータを抽出しています。また、クラウドソーシングとは、集合に仕事を投げるという考え方です。例えば、賞金5万円でロゴ作成依頼をすれば、投票結果によっていいものが残ることを期待できます。他に、マイクロファイナンス、オープンソースインテリジェンス、リコメンダーシステムなどを挙げていました。また、おすすめの書籍として、「集合知プラグラミング」を挙げていたので、みなさん読んでみるといいでしょう。そして、井川さんの卒論発表の話がありました。井川さんは卒論で、「テレビの番組推薦」というテーマでその人の試聴履歴から抽出して他に推薦される番組を提示するリコメンダシステムについて取り組んだそうです。抽出の具体的な手法として形態素解析や構文解析を用いたそうで、番組の紹介文を文字列に分けてテキストベースで嗜好度を探す、等の方法を取ったそうです。また、リコメンダの結果の評価方法としては、適合率、再現率、F値を用いたそうです。今回の発表の中でも最も印象に残ったのは、”Database is next intelligence”という言葉でした。今、ウェブサービスでビジネスをやろうと思ったら、SNSとかやっている場合じゃなくて、とにかく解析していないデータを見つける、集めることだと言っていたのが印象に残りました。また、セキュリティ上の問題から1か所に集めてはいけない供行っていました。他に、発表後の参加者の感想の中でも何かと物議をかもしていたのが集合知の研究のところで出てきた古書の解析の話で、これは普段私たちがなにかしらのサービスに登録するときによく目にしている、読みづらい文字・・・、あのパスワードとして打ち込む文字は実は、古書からスキャンした画像のうち不鮮明でテキスト化できなかったものをユーザーに打ち込んでもらうことで同時に古書の解析をしているという話です。勝手に協力させられているのはどうなのか、といった意見が何人かから出ました。ここでは、形は違えどウェブ以前の時代にも、知らずに(公共の)何かしらの活動に協力させられていることはあったという意見もあり、議論が盛り上がりました。また、「集合知」と称されるものが(誤って)一部の偏った意見から形成される危険性についての議論もありました。それから、発表後には今回の発表では非常にポジティブな面ばかりを押し出しているが、実際にそのポジティブな面に至る過程はいいことばかりではないといった、実際に業界に関わる人からの意見もありました。限りない可能性を秘めながら、同時にそこで何が起こっているのか分からない人々にとっては不安要素になるといった陰の面も持つ集合知とウェブサービス。今後どのように活かされていくのかが、本当に楽しみだと思いました。

あわせて読みたい

コメントを残す