Git Product home page Git Product logo

biohack-jsbi2013's Introduction

###「BioHack@JSBi2013」で使用したソースコード

https://github.com/dbcls/jsbi2013/wiki/BioHack

=======

Taxonomy ID, Taxonomy Name, Gene Symbolの対応関係をまとめるパイプライン

my image

データ解析手順

  1. まず、NCBIのFTPサーバにある、gene_infoというファイルをダウンロードする (ftp://ftp.ncbi.nih.gov/gene//DATA/gene_info.gz)

  2. gene_infoのうち1,3列目だけ切り出す

./extract_TAXID_GENESYMBOL.sh

TAXID_GENESYMBOL.txtというファイル(1列目はTaxonomy ID、2列目はGene Symbol)が生成される。ただし、2列目の一部にNEWENTRYという関係ない文字列が含まれている

  1. TAXID_GENESYMBOL.txtのうち、NEWENTRYがある行を削除する。また、Taxonomy IDだけ別途抽出する
R CMD BATCH extract_TAXID.R log1.txt

TAXID.txt(Taxonomy ID)、TAXID_TAXNAME.txt(NEWENTRYが無い行だけ抽出)、log1.txt(ログファイル)というファイルが生成される。

  1. TAXID.txtに記述されたTAXIDをもとに、Ensemblにアクセスし、Taxonomy Nameをダウンロードする。
perl download.pl

TAXID_TAXNAME.txtというファイル(1列目がTaxonomy ID、2列目がTaxonomy Name)が生成される

  1. 最後に、TAXID_GENESYMBOL.txtとTAXID_TAXNAME.txtを、同じTAXID同士でマージする
R CMD BATCH make_table.R log2.txt

TABLE.txt、log2.txt(ログファイル)、Dictionary.txt(今回考慮した誤変換が起きる疑いがある文字列集)が生成される

データ可視化手順

  1. Rのtagcloudパッケージを利用して、検出頻度が高かった誤変換されるGene Symbolを強調する図を作成
cd TagCloud
R CMD BATCH tagcloud.R log3.txt
cd ..

tagcloud_symbol.jpeg, tagcloud_symbol.png, tagcloud_symbol.eps等画像ファイルが生成される

  1. Cytoscapeを利用して、Taxonomy Name - Gene Symbolの共起ネットワークを作成

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.