分析をはじめる前に

分析をはじめる前に気をつけること

  • 標本数 = f(effect size, 検定力, α)

  標本数はいくつ…? effect sizeは標本数によって影響を受けない検定力。性質がわからない場合は0.2, 0.5, 0.8で辺で定める。
  検定力は望ましいとされる0.8で設定。標本があまり取れない場合は0.7を最低ラインとして考える。
  αは1%〜5%。

Rでpower.t.hogeを使う。

検定力分析入門 豊田秀樹 著(2009/11)より

R言語で機械学習。関数(簡単に)まとめ 

R言語での機械学習をするため、使えそうな関数を簡単にまとめます。
今回は例として"hoge"と言うデータを扱うとします。

  • install.packages()

  今回はSVMを利用したのでinstall.packages("kernlab")とした。

  • library()

  ライブラリの読み込み。library(kernlab)

  • 学習・予測データの作成
    • rowdata<-nrow(hoge)

    hogeのデータの行数を取得

    • random_num<-sample(rowdata, rowdata*0.5)

    rowdataからRandomに行数を抽出し、学習データ作成に利用。
    0.5は前データの半分をサンプルとするため。

    学習データを作成します。hoge_trainingに格納。

    予測データを作成します。hoge_predictに格納。

  • 学習と評価
    • ksvm()

    hoge_trainingを使ってksvm関数で学習。

    • predict()

    hoge_predictデータの評価。



参照ページ
Y's note(2012/08/30)

グレースケール

画像処理におけるグレースケール化は、NTSC系により定められた値を用いる。これは日本やアメリカで採用されている放送方式で、カラー信号が白黒のフォーマットを拡張されて出来たもの。


NTSC
NTSC(National Television Standards Committee)とは - IT用語辞典 e-Words
CIE表色系
http://www005.upp.so-net.ne.jp/fumoto/linkp11.htm