NOTE: ANGSD-wrapper の最新版は ANGSD-wrapper/angsd-wrapper
このリポジトリのバージョンは古いので、上記のリンク先のバージョンに行ってください。
ANGSD-wrapper は次世代シーケンスデータの解析支援に開発されたユーティリティです。 ユーザーはこのスイートで以下のことができます。
- サイト周波数スペクトルの計算
- 対応するFST推定値を含む2Dサイト周波数スペクトルの計算
- ABBA/BABAテストの実行BAMファイルからFASTA配列を抽出する
- 遺伝子型尤度を計算する
- シータや各種中立性統計量を推定する
- 1つあたりの個人近親交配係数
- 混血割合
次世代シーケンスデータから要約統計量を計算するために、ANGSDでは尤度に基づくアプローチが使用されます。 ラッパースクリプトとドキュメントは、ANGSDがユーザーにとって使いやすいように設計されています。
ANGSD-wrapperのインストール
ANGSD-wrapperをインストールするには、以下の手順に従います。 GitHubからダウンロード
git clone https://github.com/mojaveazure/angsd-wrapper.git
ANGSD-に移動します。wrapper ディレクトリ
cd angsd-wrapper/
セットアップコマンドを実行
./angsd-wrapper setup dependencies
サンプルデータセットをダウンロード(任意)
./angsd-wrapper setup data
インストール終了
source ~/.bash_profile
BAM ファイルに関するメモ
ANGSD には入力として BAM ファイルが必要である. ANGSD-wrapperは、BAMファイルのリストをANGSDに渡します。 これらのBAMファイルにはいくつかの要件があります。
- BAMファイルには「@HD」ヘッダ行が必要です
- BAMファイルにはインデックスが必要です(.bai)
BAMファイルに’@HD’ヘッダーラインがあるかどうかを確認するには、サンプルリストに対して以下を実行します:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
‘@HD’ ではなく ‘@SQ’ で始まるサンプルがあると、ANGSD および ANGSD-wrapper は失敗します。 このGistは、BAMファイルに@HD
ヘッダー行を追加します。
インデックスファイルは、BAMファイルの後に生成する必要があります。 SAMTools を使用して BAM ファイルのインデックスを作成するには、サンプル リストで以下を実行します:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
システムに GNU Parallel をインストールしている場合、この処理を高速化することが可能です。
cat ~/path/to/sample_list.txt | parallel samtools index {}
基本的な使い方
ANGSD-wrapperを実行するには、run
angsd-wrapper <wrapper> <config>
ここでwrapper
はANGSD-wrapperが実行できる方法の一つ、config
は対応する構成ファイルへの相対パスとなります。
利用可能なラッパーのリストを見るには、
angsd-wrapper
設定ファイル
angsd-wrapper.
を通して利用できる各メソッドの設定(config)ファイルがあります。設定ファイルはラッパーが使用する変数を保持します。 ここで,指定したメソッドで angsd-wrapper を実行する前に,サンプルに合わせて変数を修正し保存する必要があります(インデックス付き BAM ファイル/CRAM ファイル,FASTA ファイル,サンプルリストなどのファイルパスを指定する). あなたのサンプルに合うように、それらを修正する必要があります。 各変数が何に使われ,どのように指定されるかは,設定ファイルやwikiを参照してください.
設定ファイルの例は、angsd-wrapper setup data
を実行すると Example_Data/Configuration_Files
に見つかります。
詳細情報
ANGSD-wrapper についての詳細、ANGSD-wrapper で利用できるメソッド、および総合チュートリアルについては、wiki を参照してください。
依存関係
このパッケージは、以下の依存関係を必要とします。
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
これらは angsd-wrapper インストール時に自動的にダウンロード・インストールされます
他にもインストール時に自動的にダウンロードされていない依存関係が幾つか存在します。
- SAMTools
- GNU Scientific Library
- Git
- Wget
Supported methods
- Site frequency spectrum (SFS)
- Thetas estimations
- 2D SFS とFST
- ABBA/BABA
- Ancestral sequence extraction
- Genotype likelihood estimates
- Inbreeding coefficients calculations
- Principal component analysis
- Admixt analysis
がインストールされます。
Citing ANGSD- (英語)。wrapper
ANGSD-wrapperがMolecular Ecology Resourcesに掲載されました。 もし、あなたの仕事でこれを使用する場合は、その論文を引用してください。 BibTeXをお使いの場合、引用は以下のようになります:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}