- PCA for GWAS data
- できるだけnumpy以外のライブラリを使わないで実装してみる
- numpy
- pandas
- plink形式でGWASデータを取得
- pedファイルから、SNPのデータを切り出す
- 頻度に基づき、ATGCに0か1を割り当て、ホモ:0 or 2、ヘテロ:1とする ー> 人数 x SNP数のマトリクスを得る:SNP_data.npz
- PCA.pyを用いて、PCAを実行する (比較のために、scikit-learnを用いたPCAも用意しています: PCA_sklearn.py)