2013年3月23日土曜日

第25回データマイニング勉強会+WEB東京に参加してきた。

はじめに。

http://www.slideshare.net/hamadakoichi/tokyo-webmining-openingtalk


自己紹介。全員 ^o^;
ところどころメモ。


○コンバージョン
http://www.okuramkt.com/dic/effect/conversion.html


○Hadoop from PFI
http://www.slideshare.net/pfi/hadoop-2525724/36


○WEBHIVE from リクルート
https://github.com/recruitcojp/WebHive


○Cloudera Impala:HIVEをより早くしたもの(x10~30、x2~3、最速はx97)
→cloudera manager
→Impala:METAデータを自動で更新しない
http://www.slideshare.net/shiumachi/tokyo-webmining-20130323slideshare?ref=https://twitter.com/search?q=%23TokyoWebmining&src=hash


○データ分析する上で、SQLとか基本的な部分は押させておかないといかん。


○レコメンデーション運用
サービスをもっとよくする取り組み。
Amazonみたいなやつ。
PCとスマホ。
たくさん使ってくれる人にパーソナライズする。

予習・復習が出せたら面白いだろうな。

○ネット調査モニター
マーケティングリサーチ会社intage
動機付け。
理解出来なかった場合、わからなかった場合どうする?
ずっと同じデータだったらいい加減なんじゃないかと推測出来る。

楽しさ、達成感
→感情的なアプローチ

構造方程式モデリング SEM
:複数の要因感の関係を分析する統計手法。

測定値の背後に構成概念をつける。その集合として潜在変数を数値化。

例えば「学力」も潜在変数。各強化の得点や環境でなんとなく割り出されるもの。
SEMモデルと分析データを比較し、推論が合っているかどうか確認する手法。


多母集団同時解析
:2つの集団が異なる母集団と認めた上で、集団間に回答傾向の差が生じているのか検討する

→グラフィカルモデリング


○Hadoopと~
fusionIO

ムーアの法則
TOCの理論
ROI


知らないことたくさん聞けて楽しかった。
次回は解析手法と最適解探索アルゴリズムにつながる機械学習の話とかも聞けたら嬉しい。

0 件のコメント:

コメントを投稿