mojaveazure / angsd-wrapper Archived

NOTE: ANGSD-wrapper の最新版は ANGSD-wrapper/angsd-wrapper

このリポジトリのバージョンは古いので、上記のリンク先のバージョンに行ってください。

ANGSD-wrapper は次世代シーケンスデータの解析支援に開発されたユーティリティです。 ユーザーはこのスイートで以下のことができます。

  • サイト周波数スペクトルの計算
  • 対応するFST推定値を含む2Dサイト周波数スペクトルの計算
  • ABBA/BABAテストの実行BAMファイルからFASTA配列を抽出する
  • 遺伝子型尤度を計算する
  • シータや各種中立性統計量を推定する
  • 1つあたりの個人近親交配係数
  • 混血割合

次世代シーケンスデータから要約統計量を計算するために、ANGSDでは尤度に基づくアプローチが使用されます。 ラッパースクリプトとドキュメントは、ANGSDがユーザーにとって使いやすいように設計されています。

ANGSD-wrapperのインストール

ANGSD-wrapperをインストールするには、以下の手順に従います。 GitHubからダウンロード

git clone https://github.com/mojaveazure/angsd-wrapper.git

ANGSD-に移動します。wrapper ディレクトリ

cd angsd-wrapper/

セットアップコマンドを実行

./angsd-wrapper setup dependencies

サンプルデータセットをダウンロード(任意)

./angsd-wrapper setup data

インストール終了

source ~/.bash_profile

BAM ファイルに関するメモ

ANGSD には入力として BAM ファイルが必要である. ANGSD-wrapperは、BAMファイルのリストをANGSDに渡します。 これらのBAMファイルにはいくつかの要件があります。

  • BAMファイルには「@HD」ヘッダ行が必要です
  • BAMファイルにはインデックスが必要です(.bai)

BAMファイルに’@HD’ヘッダーラインがあるかどうかを確認するには、サンプルリストに対して以下を実行します:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

‘@HD’ ではなく ‘@SQ’ で始まるサンプルがあると、ANGSD および ANGSD-wrapper は失敗します。 このGistは、BAMファイルに@HDヘッダー行を追加します。

インデックスファイルは、BAMファイルの後に生成する必要があります。 SAMTools を使用して BAM ファイルのインデックスを作成するには、サンプル リストで以下を実行します:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

システムに GNU Parallel をインストールしている場合、この処理を高速化することが可能です。

cat ~/path/to/sample_list.txt | parallel samtools index {}

基本的な使い方

ANGSD-wrapperを実行するには、run

angsd-wrapper <wrapper> <config>

ここでwrapperはANGSD-wrapperが実行できる方法の一つ、configは対応する構成ファイルへの相対パスとなります。

利用可能なラッパーのリストを見るには、

angsd-wrapper

設定ファイル

angsd-wrapper.を通して利用できる各メソッドの設定(config)ファイルがあります。設定ファイルはラッパーが使用する変数を保持します。 ここで,指定したメソッドで angsd-wrapper を実行する前に,サンプルに合わせて変数を修正し保存する必要があります(インデックス付き BAM ファイル/CRAM ファイル,FASTA ファイル,サンプルリストなどのファイルパスを指定する). あなたのサンプルに合うように、それらを修正する必要があります。 各変数が何に使われ,どのように指定されるかは,設定ファイルやwikiを参照してください.

設定ファイルの例は、angsd-wrapper setup data を実行すると Example_Data/Configuration_Files に見つかります。

詳細情報

ANGSD-wrapper についての詳細、ANGSD-wrapper で利用できるメソッド、および総合チュートリアルについては、wiki を参照してください。

依存関係

このパッケージは、以下の依存関係を必要とします。

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

これらは angsd-wrapper インストール時に自動的にダウンロード・インストールされます

他にもインストール時に自動的にダウンロードされていない依存関係が幾つか存在します。

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Supported methods

  • Site frequency spectrum (SFS)
  • Thetas estimations
  • 2D SFS とFST
  • がインストールされます。

  • ABBA/BABA
  • Ancestral sequence extraction
  • Genotype likelihood estimates
  • Inbreeding coefficients calculations
  • Principal component analysis
  • Admixt analysis

Citing ANGSD- (英語)。wrapper

ANGSD-wrapperがMolecular Ecology Resourcesに掲載されました。 もし、あなたの仕事でこれを使用する場合は、その論文を引用してください。 BibTeXをお使いの場合、引用は以下のようになります:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

コメントする