5/18 機械学習ハッカソン に参加して、教えてもらい実装した、オンライン線形分離器
http://connpass.com/event/6178/
特徴は、軽い、早い、賢いです。
データの順序にも影響を受けにくく、頻度が低い特徴量でも分離に使用できなるなど色々といい面が多いようです。
■以下、実装に際して困った(つまづいた)部分
・Rでcsvの読み込み方を忘れていた!
→というか、R忘れていた。
・単位行列Iを忘れていた!
・正規分布でηを決めたときにφが定数になることに気がつかなかった。
→説明のときに入力データごとに分布が変わると聞いていたので、
φの後のルートホゲホゲ数式が正規分布の形状(平均、分散)を決めるものと勘違いしてじっくり眺めていた。
※ロス関数算出の時につまづいた理由!
論文を本当に何の工夫も無く、アホかという愚直さで実装しました。 (ある意味参加条件だと思いますので、恥を忍んでアップロードしておきます)
http://connpass.com/event/6178/
なお、入力に使用しているデータはこちら。
https://github.com/IshitaTakeshi/Hackathon
講師いしたーさん、開催者 いそべさん、その他の参加者さんに感謝!