☆学びing株式会社 企画営業部 課長 メディアプランナー
スtラッシュドット 横田 真俊氏
影響力がもっとも強いのはやるおなのではないか
■SBMの特徴
オンラインで完結
階層型でない
他社との共有
タギング、コメント
■SBMの歴史
・オンラインブックマークはいつからはじまったのか?
デリシャスが最初ではない
1996年 itListが世界初のオンラインブックマークを開始
96-99年 様々なオンラインブックマーク業者が登場
2000年 日本でもスタートダッシュやBlinkの日本語版が登場
ドットコムバブル崩壊
○itList
ブックマークのバックアップ的な意味が強かった
○blink
○del.icio.us
1億ブックマーク
なんで成功したのか?
-人気の可視化
-ブログのパーマリンク
-ソーシャルタギング
-人、タグのつながり
-最大の理由はストレージから日々のツールになったこと
○MyClip ドリコム
2004年にはじめたものの
2006年に終了
○はてなブックマーク
2005年リリース
2.SBMの利用状況
SBMの認知度は低い 6.9%しか使っていない
3.今後のSBM
・専門SBM
-4U
-メディアマーカー
専門SBMは伸びている
・社内SBM
イントラSBM
・モバイルSBM
盛り上がりに欠ける
mixiやモバゲーなどのサイト内ニュースが閉じられたSBMとなっている
キーワードは閉鎖空間
by Tomohiko Kezuka at 7/12/2008 1:46:56 AM
質疑応答
by Tomohiko Kezuka at 7/12/2008 1:47:24 AM
Q.ユーザーの質が下がるのはタギングや重み付けなどの技術的な解決をするべきではないのか?それはできないのか?
by Tomohiko Kezuka at 7/12/2008 1:48:45 AM
別にクローズドといっても一般の人に見せないということではない。オープンなSBMが広まって使ってもらえるのがいいが、一般の人はあまり使わないのではないか。
まずは偏ったユーザーに使ってもらって、そこから情報拾ったほうが便利。
by Tomohiko Kezuka at 7/12/2008 1:50:51 AM
休憩中
by Tomohiko Kezuka at 7/12/2008 1:50:59 AM
11:00~11:50
☆東京工業大学 大学院理工学研究科 集積システム専攻 助教 博士(工学) 宮田 高道
☆東京工業大学 大学院理工学研究科 集積システム専攻 博士課程 佐々木 祥
「SBMデータを用いたwebコンテンツ推薦」
by Tomohiko Kezuka at 7/12/2008 1:54:39 AM
by Tomohiko Kezuka at 7/12/2008 1:57:31 AM
○SBMと研究
分類のパラダイムシフト
FolksonomyがTaxonomyのアンチテーゼとして登場
SBMはFolksonomyは実現できるのか?
実際には課題が残っている
○タグ付けにおける問題
・多義性
・同義性
生のタグでは、itemの分類が困難
これをどうにかしようというのが最初の研究
○SBM研究の分類
・SBMの分析
・SBMデータの補正
・SBM推薦
○SBMの分析
Golder, 2005, "the structure of collaborative tagging system"
タグを機能別に7種類に分類
タグの
タグの持つ検索能力とその推移
時間がたつにつれて文章のエントロピーはどんどん上昇していく
タグのエントロピーは収束していうく
タグがコンテンツを特定する能力は時間がたつにつれて定価している
・人気のタグはみんなが使うため
タグの補正を行ってなんとか検索できるようにしよう
-複数のタグをひとまとめにする(clustering)
⇒タグをクエリとしたitem検索を容易化
明らかに関連しているタグは階層化していい
○SBMデータを使った情報推薦
多くの検討が講義の協調フィルタリングを活用
・協調フィルタリングの限界
ユーザーの趣味があらゆる側面で全て一致することは少ない
⇒SBMのタグを使えばユーザー-ユーザー推薦以外の推薦が可能
・Niwa,2006 "Web Page Recommender System based on Folksonomy Mining"
・中本
推薦してくれる人と、されたい人が
タグ付けの傾向がどれくらい似ているのか
タグクラスタをまとめることによって推薦精度を上げる
時系列データを用いた推薦が流行
特定にSBMに登録した人は
既存手法の課題:古典的CF
itemの正しい分類、
タグに使われているワードなんて飾り、タグの役割はグルーピング
by Tomohiko Kezuka at 7/12/2008 2:27:29 AM
ここまでパートA
by Tomohiko Kezuka at 7/12/2008 2:28:02 AM
■パートB
SBMを利用したWebコンテンツ推薦
SBM履歴からの自動的な嗜好予測
いずれは自分の興味のあるものを自動的に予測して推薦する
情報共有ツールの延長上にあるもの
○研究の新規性
・タグの名称を使わない anti-folksonomyな推薦
・統計的信頼性を考慮した協調フィルタリング
○従来研究 folksonomy
同じようなタグをクラスタ化すれば表記のゆらぎを吸収できる
○アンチテーゼ
そもそもタグのゆらぎは単なる記述結果の違いではないのではないか?
SBMerはコンテンツを解説する義務はない
みんな好き勝手にタグをつけている
-顔文字など
こんなデータをクラスタリングしても推薦できない
○推薦にfolksonomyは必要か
多くのSBMを用いた推薦研究
タグの名称に着目してしまう
-どうやってセマンティックを見出すか
-タグの表記揺らぎを解決するには
タグによる個人のグルーピングに着目
○研究アプローチ タグ名をみない
あるユーザがタグでまとめたコンテンツ群に着目
コンテンツクラスタの共起性で推薦
○提案システムの概要
1.クエリコンテンツクラスタをシステムに入力
2.SBM中の複数居の推薦元コンテンツクラスタとの類似度算出
3.推薦元コンテンツクラスタからwebコンテンツを推薦
○コンテンツクラスタ
SBMに登録されている
従来の協調フィルタリングと問題点
○研究の内容
jaccard型だと分母が小さいときの信頼性が低くなる
⇒ベルヌーイ試行モデル化
2つのコンテンツクラスタへの共起をモデル化
任意のコンテンツをベルヌーイ試行を行い、
類似度を数値化
類似度の和で推薦度を定義
実験方法
詳細は論文を見る
・比較研究
-比較1.タグ名称のランキング
-比較2.jaccard 係数による類似度算出
by Tomohiko Kezuka at 7/12/2008 2:46:34 AM
○質疑応答
Q.実験結果のグラフの見方がわからない
A.再現率と精度の両方が高いとよい結果
Q.タグが収束するのはインターフェースによるものなのか、
それとも単純に多くの人が同じものを使うのか?
A.インターフェースによるところが大きい。
これによってタグでコンテンツを探すのが難しくなってしまっている
by Tomohiko Kezuka at 7/12/2008 2:54:23 AM
12:55-13:45
☆コモンズ・メディア代表 星暁雄 / 「Webの世界に「気付き」を集積するコモンズ・マーカー」
by Tomohiko Kezuka at 7/12/2008 3:58:15 AM
・人間に頼る旧来の出版業界は10年間縮小しつづけている
・Web企業の成功パターンは「人間と機械の共生」による「動的なメディア」
○歴史
ソクラテス
「静的な書物は動的な対話に劣る」と考えた。なので著書を残さなかった
1945年 MEMEX
1960年 「人間と機械の共生」
リックライダーの論文
1963年 「情報産業論」
梅禎
脱工業化をこの時点で予言
京大コードの提唱者
1967年 KJ法
1973年頃 暫定ダイナブック
1987年 Hyper Card
1991年 World Wide Web
1995年 Wiki
1999年頃 Blog
2003年 del.icio.us
2005年 はてなブックマーク
○欲しかったもの
・Webページに赤入れ
・さくさくWeblog
(web引用+コメント)
・全部共有(コモンズ)
○位置づけ
・あのテーション
・ミニブログ
・引用箇所へのポインタを持つSBM
○デモ
ウィジェットがコメントの該当箇所に自動でスクロールして
どこにどういうコメントがついているのかがわかるようになっている
マークブラウザーと本文を比較できるようにしたところがインターフェースの肝
○マークブラウザ
・付箋メタファを捨てた
○Webに対話を
・ほとんどのWebページは、対話のない静的な存在だった
・Blogコメント欄と本文の連携が弱い
・コモンズ・マーカーは、静的なWebを動的に変える
○Webに出会いを
・マークブラウザを使い仲間と「読み」を共有する
・マークブラウザの一覧性が
○仕事尾を楽しく
・原稿や甲制止への「赤入れ」は面倒でつらい作業だった。
・楽しい
○今後の展開
・マーク付けによる「Web Publishing」
・Blogはメディア、マークもメディア
・グループでの情報共有(法人向け)
-新聞や雑誌の切り抜きのように社内での情報共有ができる
○開発陣
・ソフトカルチャー id:elm200
・アドバイザーとしてyuguiさん
○質疑応答
Q.Webページの変更にどう対応するのか?
A.静的なページのみに対応している。動的なページでページの内容が変わってしまうと、あわない部分にマークされてしまう。今後は対応していきたい
Q.スケーラビリティは、大量にマークされると対応できないのでは?
A.1ページにつき100~200入るようにしておけばいいのではないか。それ以上になった場合は別のページに飛ばすなどをして対応する。100個で十分なのではないか
Q.全てのページに対応するのか?
A.99%のサイトで動く
Q.テキストだけでなく音声や絵などの入力形式も考えているのか
A.今のところ難しい
Q.校正するために特化したツール
A.出版の校正用だとマーケットが小さすぎる
すごく専門性の高いサービスとしては作りこむのは長期的な視点で考えるかも
Q.テキスト以外の別の種類の書き込みができるようにするのか?(アイコンなど)
A.感情表現の文化をコモンズマーカー内で創ることもできるのではないか。AAのように。
by Tomohiko Kezuka at 7/12/2008 4:41:06 AM
星さんのプレゼン終了
Q&A部分のメモはだいぶ怪しいです。。。
by Tomohiko Kezuka at 7/12/2008 4:41:49 AM
13:50-14:40
☆フランステレコム株式会社 (France Telecom R&D Tokyo)
早稲田大学大学院 理工学研究科 情報・ネットワーク専攻 博士後期課程
井口 誠
「お前のモノ(ブックマーク)は俺のモノ、俺のモノ(ブックマーク)も俺のモノ」
by Tomohiko Kezuka at 7/12/2008 4:49:58 AM
○自己紹介
フランステレコムはフランスのNTTみたいな会社
日本技術のTechnology Scouting
ユーザープロファイリング技術&P2P技術応用に関する研究開発
早稲田理工のドクター
○別研究会の紹介
電子情報通信学会 HCG 第2種研究会
-マイニング、情報検索、抽出、要約など
-あのテーション作成支援、セマンティックウェブ、リンク解析
-情報可視化、パーソナライゼーション
※企業の参加が多い
有益な情報源
1.みんなで分類:tagging
タグ付けで分類
http://これはひどい.gaasuu.com/
2.みんなで評価:ranking
ブックマーク登録数におけるランキング
じわじわ来てるエントリー http://k52.org/jwjw/
3.みんなでコメント:annotation
ブックマークエントリーにコメント書ける
他の人がブックマーク先の内容に対してどういう意見を持っているのかを見ることができる
4.みんなで推薦: recommendation
はてなアンテナでは自分の登録ページと似た傾向のあるアンテナへのリンクがある
また、おとなりアンテナが登録している確率の高いページをおすすめページとして提案している
ブックマークのオススメサイト
それぞれオーバーラップしている部分もあるが、
この分類で説明
○特にみんなで推薦
・他人のブックマークをチラ見
-集合知を活用した未知との遭遇
・Bookmarkをたくさん公開
-より精度の高い推薦がもらえる
-より精度の高いブックマーク
○ブックマークを公開するのに抵抗があるのが普通
・一般的なインターネットユーザーは自分のお気に入りを他人に晒すのは
恥ずかしいという考え
・BM=己の欲望=己のコアな趣味
○OpenIDの到来
・OpenID=ひとつのIDで、複数のWebサービスを利用
・サイトをまたいでユーザーを一意に同定可能
○あわせ技、一本の可能性
・様々なWebサービスに、様々な情報を提供している事実 ex:Google
・同定されると思わぬ事態になるかも?
⇒もう少し公開することに意識をもったほうがいいのでは?
とはいえ、、、
・同じようなページを見ている人が、どんなページを見ているかは興味がある」
・マニアックなサイトであればあるほど、関連ブックマークをチラ見したいのではないか
○じゃいあにずむ実現のためのP2P
・己のBMは手元で管理したいけど、他の人には晒したくない
⇒匿名P2PネットワークによるBM共有はどうでしょう
○やりたいこと
匿名のネットワーク上で同じ嗜好を持った人同士で
ブックマークの情報を交換する
Profile Algorithmは既存のもの
・BM「からプロファイルを算出する
キーワードとスコアを使ってプロファイルするなど、外部の何らかの手段を使って
算出する
ベクトルの内積を計算するなど
○プライバシーへの配慮
・プロファイルの隠匿
・BM供給元の隠匿
○コネクション確立フェーズ
通常のP2Pだともらったプロファイルをそのまま転送するので、第3者にプロファイルを持っていることがばれるが、転送する際にプロファイルを偽装して送る
ノード情報は嘘だらけになるが、ルート情報としては有用
○ブックマークの共有フェーズ
・BMが繰り返しノード間で転送されるので供給もとの判定が困難に
・転送対象BMをdata repository とcache repository より選択するため、BM供給元の特定が困難に
○シミュレーション結果
いくつかのパラメータにおいて、実験したところ、
ノード情報の中が嘘になっていき、8割が嘘の状態になっている
deta recall
正解BMの7,8割くらいが集められている
まとめ
・手元でBMを管理しつつ、SBMみたいなメリットを享受できる手段の1つとして匿名
○Q&A
Q.なんで集中型でなくてP2Pにしたのか?
A.複数のサイトにまたがった場合に全て公開されてしまう
Q.系全体だとdeta depositoryでもcash depositoryを特定できるのではないか
A.参加している個人が特定できないということを考えている
by Tomohiko Kezuka at 7/12/2008 5:40:03 AM
休憩中
質疑応答は勉強不足でよくわかりませんでした。。。
by Tomohiko Kezuka at 7/12/2008 5:40:38 AM
14:50-15:40
☆独立行政法人 産業技術総合研究所 小島 一浩
「ソーシャルグラフってどうよ?」
by Tomohiko Kezuka at 7/12/2008 5:50:04 AM
by Tomohiko Kezuka at 7/12/2008 6:42:48 AM
15:50-16:40
☆ 筑波大学大学院システム情報工学研究科 コンピュータサイエンス専攻 博士前期過程 神林 亮
私がチャレンジしたSBMデータマイニング
by Tomohiko Kezuka at 7/12/2008 6:53:43 AM
by Tomohiko Kezuka at 7/12/2008 7:40:36 AM
紹介されてた論文リスト
by Tomohiko Kezuka at 7/12/2008 7:42:53 AM
by Tomohiko Kezuka at 7/12/2008 7:44:13 AM
by Tomohiko Kezuka at 7/12/2008 7:45:33 AM
by Tomohiko Kezuka at 7/12/2008 7:45:43 AM
by Tomohiko Kezuka at 7/12/2008 7:46:21 AM
by Tomohiko Kezuka at 7/12/2008 7:47:16 AM
by Tomohiko Kezuka at 7/12/2008 7:47:34 AM
by Tomohiko Kezuka at 7/12/2008 7:48:45 AM
by Tomohiko Kezuka at 7/12/2008 7:49:38 AM
☆みずほ情報総研の方が自己紹介中
by Tomohiko Kezuka at 7/12/2008 7:50:11 AM
☆ECナビの宇佐美さんが自己紹介中
by Tomohiko Kezuka at 7/12/2008 7:52:12 AM
■パネルディスカッション
吉川さん、宇佐美さん、横田さん、宮田さん、佐々木さん
・ソーシャルブックマークを使い出したきっかけ
・ソーシャルブックマークの魅力は? >横田さん
良質なはてなブックマークを選ぶ
見たページを検索しながらやっていた
ブックマークで効率化できた
・研究者との魅力 >宮田さん、佐々木さん
コメントを隠しながらとか、タグの意味があまりないのではないか
コメントは評価しづらい、タグをクラスタリングして類似した言葉がまとめられる
・Buzzurlの満足しているところと課題 >宇佐美さん
使う人が多くなればなるほど面白くなる
ユーザー数が爆発する段階まで至っていない
スパム的な登録が増えている
40~50%くらいはスパム
どうやって通常の投稿と分けるのかが課題
■社内SBMの実態についてのプレゼン みずほ情報総研 吉川さん
・最初ははてなブックマークを使って社内で情報共有していた
-情報を公開しているのはまずい
・他の会社にも声かけたが、結局マイネットジャパンと一緒に作った
・newsingの認証部分の最低限な追加を行い、そのまま利用開始(6人)
・他の部署の30人くらいに使ってもらった。
・知っていて当然のニュースを共有するのに便利
・社員にID配っていても全員使ってくれない
○導入にあたっての工夫点
・セキュリティ対策(認証、アクセスログ)
・コメント機能(何回でも書けるように)
・デザインを社内向けに変更
・社内文章対応(右クリックで社内文書が登録できるように)
・システム管理機能の強化
・メルマガ機能
・タグエリアを複数に分割
-組織タグ
-カテゴリタグ
あらかじめタグを用意しておく。タグは自由につけられるが、あまりつけないようにように
○利用状況
部間で使ったときのほうが効果的だった
・知らないニュースソースを知ることができた
・社内文書のクリップはあまり使われていない
○登録されたニュースを読む基準
・誰が登録したかが重要
・同じプロジェクトのメンバーが登録したニュースはプロジェクトチーム全体で共有できる
○大規模展開時に必要な機能
・UIの改善や目的の共有などが必要
・全体に広める必要はないという意見が多数
■Buzzurl Plusの紹介 ECナビ宇佐美さん
・社内でも大多数がブックマークを使わない
・ページを見た人の足跡が残るようになっている
・手軽にどんどんSBMを新規に作って、使われないものは埋もれていくし、使われるものは残るというような状態にする
横田さんの感想とニッチなSBMについて
ニッチなところからはじめて、少しずつ広めていったほうがよい
紙で配っている社内報をSBMで代替できる
-一部の業界紙がインターネットで見られないので、一部が紙で残るならあまり変わらないという感覚
Q.buzzurlでの面白い使い方は?
A.ブックマークにコメントすることができない
他の人のブックマークにコメントできるのでスレッドみたいに
Q.レコメンドや社内フィルタリング
A.宇佐美さん ユーザ間のシンクロ率を掲載している
週に一回ユーザがブックマークしそうなサイトをメルマガで配信している
商品のブックマークだけだと継続して使い続けないのでレコメンデーションができない
商品でひも付けてレコメンドするよりも、いったんユーザ間の関連性に着目していく
Q.時系列を見るSBMの研究は?
A.イノベーターやアーリーアダプターを見つけるための研究はあるが、
それ以外で時系列を使うものはない
Q.類似度だけで推薦を行うとつまらないものになってしまうのでは?
A.発見性や意外性を数値化する??
Q.社内SBMは部署ごとに分けたほうが情報が薄まらなくていいのでは?
A.全体で1日10個程度に落ち着いているので問題ない
Q.一般のSBMと社内SBMはルールがかなり違うと思うが、どう管理しているか
部署間でもやり取りしたらまずい情報があるのでは?
A.社内で今のところ問題は発生していない
周りに行動を見られるので、それを意識した行動を取るようになる
buzzurl plusの場合は社内の人を指名で質問したりすることがある
顔がお互い見えているとコミュニケーションの質が変わる
by Tomohiko Kezuka at 7/12/2008 8:59:20 AM
by Tomohiko Kezuka at 7/12/2008 1:17:39 PM
by Tomohiko Kezuka at 7/12/2008 1:19:27 PM
毛受, 2008 “ブックマークの時系列情報を利用したソーシャルブックマークにおける注目度予測”
~de/DEWS/DEWS2008/proceedizngs/files/b9/b9-5.pdf
by Tomohiko Kezuka at 7/12/2008 1:21:25 PM
by Tomohiko Kezuka at 7/12/2008 1:25:57 PM
プレゼンされた東工大の宮田さんと佐々木さんの研究
;FILTER=%B5%DC%C5%C4%B9%E2%C6%BB;LOGIC=and
by Tomohiko Kezuka at 7/12/2008 1:28:46 PM
www.net.ss.titech.ac.jp;FILTER=%B5%DC%C5%C4%B9%E2%C6%BB;LOGIC=and
by Tomohiko Kezuka at 7/12/2008 1:28:53 PM
by Tomohiko Kezuka at 7/12/2008 3:15:40 PM
by Tomohiko Kezuka at 7/13/2008 3:12:24 PM
皆さんの感想はこちらからどうぞ
by Tomohiko Kezuka at 7/14/2008 12:39:30 AM
by Tomohiko Kezuka at 7/14/2008 12:39:52 AM
by Tomohiko Kezuka at 7/14/2008 12:41:05 AM
by Tomohiko Kezuka at 11/10/2008 8:42:23 AM
第2回の
by Tomohiko Kezuka at 12/10/2008 8:51:19 AM
by Tomohiko Kezuka at 12/10/2008 8:51:53 AM