mojaveazure / angsd-wrapper Archivováno

POZNÁMKA: Nejnovější verze ANGSD-wrapper je na adrese ANGSD-wrapper/angsd-wrapper

Verze v tomto úložišti je zastaralá, přejděte prosím na verzi odkazovanou výše.

ANGSD-wrapper je nástroj vyvinutý na pomoc při analýze dat sekvenování nové generace. Uživatelé mohou s touto sadou provádět následující činnosti:

  • Vypočítat frekvenční spektrum lokalit
  • Vypočítat 2D frekvenční spektrum lokalit s odpovídajícími odhady FST
  • Provádět testy ABBA/BABA
  • .

  • Extrahovat sekvenci FASTA ze souborů BAM
  • Vypočítat pravděpodobnosti genotypů
  • Odhadnout Thetas a různé statistiky neutrality
  • Vypočítat per-individuální koeficient inbreedingu
  • Zjistit podíly příměsí

Přístupy založené na věrohodnosti se v ANGSD používají k výpočtu souhrnných statistik z dat sekvenování nové generace. Obalové skripty a dokumentace jsou navrženy tak, aby byl ANGSD uživatelsky přívětivý.

Instalace ANGSD-wrapper

Pro instalaci ANGSD-wrapper, stáhněte z GitHubu

git clone https://github.com/mojaveazure/angsd-wrapper.git

Přejděte do ANGSD-wrapper

cd angsd-wrapper/

Spustit příkaz setup

./angsd-wrapper setup dependencies

Stáhnout příkladovou sadu dat (nepovinné)

./angsd-wrapper setup data

Ukončit instalaci

source ~/.bash_profile

Poznámka k souborům BAM

ANGSD vyžaduje jako vstup soubory BAM, a ANGSD-wrapper předává ANGSD seznam souborů BAM. Tyto soubory BAM mají několik požadavků:

  • Soubory BAM musí mít řádek záhlaví ‚@HD‘
  • Soubory BAM musí být indexované (.bai)

Chcete-li zjistit, zda soubory BAM mají nebo nemají řádek záhlaví ‚@HD‘, spusťte na svém seznamu vzorků následující příkaz:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Pokud některé vzorky začínají ‚@SQ‘ místo ‚@HD‘, ANGSD a ANGSD-wrapper selžou. Tento Gist přidá @HDřádky záhlaví do vašich souborů BAM.

Indexové soubory musí být vygenerovány až po souborech BAM. Chcete-li indexovat soubory BAM pomocí nástroje SAMTools, spusťte na seznamu vzorků následující příkaz:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Pokud máte v systému nainstalovaný GNU Parallel, lze tento proces urychlit:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Základní použití

Pro spuštění nástroje ANGSD-wrapper spusťte

angsd-wrapper <wrapper> <config>

Kde wrapper je jedna z metod, které může ANGSD-wrapper spustit, a config je relativní cesta k příslušnému konfiguračnímu souboru.

Chcete-li zobrazit seznam dostupných wrapperů, spusťte příkaz

angsd-wrapper

Konfigurační soubory

Pro každou metodu je k dispozici konfigurační (konfigurační) soubor prostřednictvím angsd-wrapper. Konfigurační soubory obsahují proměnné používané wrappery. Zde je třeba upravit a uložit proměnné (tj. zadat souborové cesty indexovaných souborů BAM/CRAM, souborů FASTA, seznamů vzorků atd.) tak, aby vyhovovaly vašim vzorkům, než spustíte angsd-wrapper s danou metodou.

Výchozí konfigurační soubory najdete v adresáři Configuration_Files. Budete je muset upravit tak, aby vyhovovaly vašim vzorkům. V konfiguračních souborech nebo na wiki najdete informace o tom, k čemu se jednotlivé proměnné používají a jak by měly být zadány. Pokud spustíte angsd-wrapper bez argumentů, vrátí hlášení o použití.

Ukázkové konfigurační soubory najdete v adresáři Example_Data/Configuration_Files po spuštění angsd-wrapper setup data.

Další informace

Další informace o ANGSD-wrapper, metodách dostupných prostřednictvím ANGSD-wrapper a obsáhlý návod najdete na wiki.

Závislosti

Tento balíček vyžaduje následující závislosti:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Tyto závislosti jsou staženy a nainstalovány automaticky při instalaci nástroje angsd-wrapper

Existuje několik dalších závislostí, které nejsou automaticky staženy během instalace:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Podporované metody

  • Frekvenční spektrum na místě (SFS)
  • Odhady Thetas
  • 2D SFS a FST
  • .

  • ABBA/BABA
  • Extrakce sekvencí předků
  • Odhady pravděpodobnosti genotypu
  • Výpočty koeficientů příbuzenské plemenitby
  • Analýza hlavních komponent
  • Analýza příměsí

Citace ANGSD-.wrapper

ANGSD-wrapper byl publikován v Molecular Ecology Resources; pokud jej použijete ve své práci, citujte prosím tento článek. Pro uživatele BibTeXu je citace následující:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Napsat komentář