2011年06月28日

(続編)相関係数を応用した「協調フィルタリング方式」のレコメンデーション

前回、「細かい説明は別の機会にさせてください。」と書いていた、相関係数を応用した「協調フィルタリング方式」のレコメンデーション

ちょっと調べてみたら、特許庁のWebサイトに「標準技術書」として掲載されていました。

http://www.jpo.go.jp/shiryou/s_sonota/hyoujun_gijutsu/net_koukoku/134.html

これは比較的簡単に書かれており、他の文献より分かりやすいが、それでもまだ分かりにくい。

この「技術書」はまだ分かりやすほうです。

しかし、「技術書」というのは高い技術を持った人が、誰に向けて書いたものなのかと、思うくらい読み込むために根気を要することが多い。

根気を要するだけならまだしも、ワケがわからないことも多々。

それとも、高い技術と知識を持った人が自分のインテリジェンスを自己顕示するためのものか?

技術は使われてこそ技術。
知識は普通の人に理解されてこそ、知識。

いかに素晴らしいものであっても、難しくて活用できない技術と分かりにくい知識は、ただのガラクタです。

技術も知識も持っていながら、それをわかりやすく表現できていないのはただの怠慢。

「簡単」でなければなりませんね。

さて、相関係数を応用した「協調フィルタリング方式」のレコメンデーションの解説です。

相関係数は、数字の大小に関係なくそれをグラフにしてみたときに「山の形」が似ているかどうかです。

例えば「富士山」と「利尻富士」は山の形が比較的似ています。
富士山→http://www.yamanashi-kankou.jp/chinese_t/chinese_t002.html
利尻富士→http://www.mgphoto.jp/rishire/0002.html

当然、それぞれの山の高さは違います。
富士山の標高:3,776m
利尻富士の標高:1,721m

重要なのは、「山の形」であり、「山の高さ」は関係ないのです。

例えば、「2009年の月別の売上」と「2010年の月別の売上」を比較した時、
2009年の売上高は全体的に低いけど、両方に共通する特長として「夏・冬のボーナス時期」の売上が高いということがあったとします。

これをグラフにしてみると、「山の形」は似ているが「山の高さ」が違う。

そういうのが、相関係数が高くなったりします。
そして、それらが統計的にどのくらい似ているのか(何%似ているのか)を数字にできるのが相関係数です。(本当は「相関係数」では何%似ているのか?は表現できないのですが、わかりやすく説明しています。)

さて、本題に戻ります。

まず
「AさんとBさんの好みが似ていれば」→「同じものを好むはずだ!」
という(強引な?)前提で考えることから始めます。

その上で、
「Aさんが買っていない物があれば」→「その物はAさんも好きなはずだ!」
という(強引な?)理屈で、「その物」をオススメするというものです。

ここでポイントとなるのは、
「Aさん」と好みが似ている人をどうやって探すのか?
で、ここが「相関係数」の出番です。

「相関係数」は2つのものが統計的にどのくらい似ているのかを数字で表すことができる便利なものなので、その仕組を利用します。

グラフ化してみて、「Aさん」と山の形が似ている人を探して、一番「山の形」が近い人(相関係数が高い)を「好みが似ている」と認定します。

その上で、「好みが似ている」人が買っているが「Aさん」は買っていない物を「おすすめします」

ここで、Aさんが好む商品のカテゴリ(本なのか、家電なのか)は全く関係ありません。
重要なのは、統計的に数字が近いかどうか。

なので、大きく外れることもあれば「意外な気づき」があることもあります。

相関係数を応用した「協調フィルタリング方式」のレコメンデーション
(ダウンロード-Excel形式)

posted by Ryo ASADA at 00:27| Comment(0) | TrackBack(0) | マーケティング | このブログの読者になる | 更新情報をチェックする

2011年06月20日

スーパーコンピューター世界一の座はどの国に?(速報)

ドイツ・ハンブルグで開催中の世界的な国際会議・展示会の「ISC'11」で
最新の「TOP500」が発表された。
TOP500とは、世界で最も高速なコンピュータシステムの上位500位までを定期的にランク付けし、評価するプロジェクトである。1993年に発足し、スーパーコンピュータのリストの更新を年2回発表している。ハイパフォーマンスコンピューティング(HPC)における傾向を追跡・分析するための信頼できる基準を提供することを目的としており、ランク付けはLINPACKと呼ばれるベンチマークにより行われている。リストの作成はマンハイム大学、テネシー大学、ローレンス・バークレイ米国立研究所の研究者らによって行われる。
---wikipediaより

前回(2010/11)に第1位だった「天河一号」は第2位に後退し、久しぶりに日本のスーパーコンピュータが第1位を獲得した結果となった。


●第1位は、我が日本のスーパーコンピュータ「京」(独立行政法人 理化学研究所)
実効性能は、8,162テラフロップス(≒8.1ペタフロップス)

●第2位は、「天河一号」(中国:国防科学技術大学)
実効性能は、2,566テラフロップス(≒2.5ペタフロップス)

●第3位は、「ジャガー」(アメリカ:オークリッジ国立研究所)
実効性能は、1,759テラフロップス(≒1.7ペタフロップス)

●第4位は、「星雲(ネビュラ)」(中国:国立スーパーコンピュータセンター深セン)
実効性能は、1,271テラフロップス(≒1.2ペタフロップス)

●第5位は、我が日本のスーパーコンピュータ「tsubame 2.0」(東京工業大学)
実効性能は、1,192テラフロップス(≒1.1ペタフロップス)

http://www.top500.org/
posted by Ryo ASADA at 18:06| Comment(0) | TrackBack(0) | マーケティング | このブログの読者になる | 更新情報をチェックする

顧客提案の「先回り」

proposal.jpg

顧客に新しいモノや仕組みを顧客のために企画し、提案する。
提案をした時、「顧客は既にまさにそれを実行中だった!」という経験はありませんか?

私は結構あります。
しかもごく最近、そんな経験をしました。

さて、顧客提案は大きく分けて2つ。

●「顧客の御用聞き」
あらかじめ顧客のご用件を聞いた上で、それに沿った形の提案をする場合。
ごく普通の提案の形ですし、顧客の用件にいかに細かく対応できるかという提案力が求められます。

●「先回り提案」
顧客が置かれている状況をしっかり考え、「こうあるべきだ」という姿を想像しながら切り込んで行く提案で、難しい。

顧客の目線から大きく外れると、ただの「空想論」。
しかし、考え抜いた提案を作ったとしても「顧客は既に実行中だった」ということも良くある話です。

私が直近で体験したのは、「先回り提案」でしかも「顧客は既に実行中だった」という体験・・・・これは大変くやしい。


しかし、ここで大切な「気づき」ありました。

「先回り提案」で「顧客は既に実行中だった」のは、歓迎すべきことだということ。

それは、自分の考え方が「顧客の目線に極めて近い」ということが言えるからです。

顧客の立場に立って、今すべきことを真剣に考え抜くと、自然と「顧客と考えることが一緒」になるのは当たり前の話です。

がんばって企画を作ったのに、通らなくても、メゲげはいけません。
むしろ、「顧客と目線が極めて近い」ことを喜び、次の提案に繋げましょう。

あと一歩。
提案が通る日は近い。
posted by Ryo ASADA at 14:44| Comment(0) | TrackBack(0) | マーケティング | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。