POZNÁMKA: Nejnovější verze ANGSD-wrapper je na adrese ANGSD-wrapper/angsd-wrapper
Verze v tomto úložišti je zastaralá, přejděte prosím na verzi odkazovanou výše.
ANGSD-wrapper je nástroj vyvinutý na pomoc při analýze dat sekvenování nové generace. Uživatelé mohou s touto sadou provádět následující činnosti:
- Vypočítat frekvenční spektrum lokalit
- Vypočítat 2D frekvenční spektrum lokalit s odpovídajícími odhady FST
- Provádět testy ABBA/BABA
- Extrahovat sekvenci FASTA ze souborů BAM
- Vypočítat pravděpodobnosti genotypů
- Odhadnout Thetas a různé statistiky neutrality
- Vypočítat per-individuální koeficient inbreedingu
- Zjistit podíly příměsí
.
Přístupy založené na věrohodnosti se v ANGSD používají k výpočtu souhrnných statistik z dat sekvenování nové generace. Obalové skripty a dokumentace jsou navrženy tak, aby byl ANGSD uživatelsky přívětivý.
Instalace ANGSD-wrapper
Pro instalaci ANGSD-wrapper, stáhněte z GitHubu
git clone https://github.com/mojaveazure/angsd-wrapper.git
Přejděte do ANGSD-wrapper
cd angsd-wrapper/
Spustit příkaz setup
./angsd-wrapper setup dependencies
Stáhnout příkladovou sadu dat (nepovinné)
./angsd-wrapper setup data
Ukončit instalaci
source ~/.bash_profile
Poznámka k souborům BAM
ANGSD vyžaduje jako vstup soubory BAM, a ANGSD-wrapper předává ANGSD seznam souborů BAM. Tyto soubory BAM mají několik požadavků:
- Soubory BAM musí mít řádek záhlaví ‚@HD‘
- Soubory BAM musí být indexované (.bai)
Chcete-li zjistit, zda soubory BAM mají nebo nemají řádek záhlaví ‚@HD‘, spusťte na svém seznamu vzorků následující příkaz:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Pokud některé vzorky začínají ‚@SQ‘ místo ‚@HD‘, ANGSD a ANGSD-wrapper selžou. Tento Gist přidá @HD
řádky záhlaví do vašich souborů BAM.
Indexové soubory musí být vygenerovány až po souborech BAM. Chcete-li indexovat soubory BAM pomocí nástroje SAMTools, spusťte na seznamu vzorků následující příkaz:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Pokud máte v systému nainstalovaný GNU Parallel, lze tento proces urychlit:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Základní použití
Pro spuštění nástroje ANGSD-wrapper spusťte
angsd-wrapper <wrapper> <config>
Kde wrapper
je jedna z metod, které může ANGSD-wrapper spustit, a config
je relativní cesta k příslušnému konfiguračnímu souboru.
Chcete-li zobrazit seznam dostupných wrapperů, spusťte příkaz
angsd-wrapper
Konfigurační soubory
Pro každou metodu je k dispozici konfigurační (konfigurační) soubor prostřednictvím angsd-wrapper.
Konfigurační soubory obsahují proměnné používané wrappery. Zde je třeba upravit a uložit proměnné (tj. zadat souborové cesty indexovaných souborů BAM/CRAM, souborů FASTA, seznamů vzorků atd.) tak, aby vyhovovaly vašim vzorkům, než spustíte angsd-wrapper s danou metodou.
Výchozí konfigurační soubory najdete v adresáři Configuration_Files
. Budete je muset upravit tak, aby vyhovovaly vašim vzorkům. V konfiguračních souborech nebo na wiki najdete informace o tom, k čemu se jednotlivé proměnné používají a jak by měly být zadány. Pokud spustíte angsd-wrapper
bez argumentů, vrátí hlášení o použití.
Ukázkové konfigurační soubory najdete v adresáři Example_Data/Configuration_Files
po spuštění angsd-wrapper setup data
.
Další informace
Další informace o ANGSD-wrapper, metodách dostupných prostřednictvím ANGSD-wrapper a obsáhlý návod najdete na wiki.
Závislosti
Tento balíček vyžaduje následující závislosti:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Tyto závislosti jsou staženy a nainstalovány automaticky při instalaci nástroje angsd-wrapper
Existuje několik dalších závislostí, které nejsou automaticky staženy během instalace:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Podporované metody
- Frekvenční spektrum na místě (SFS)
- Odhady Thetas
- 2D SFS a FST
- ABBA/BABA
- Extrakce sekvencí předků
- Odhady pravděpodobnosti genotypu
- Výpočty koeficientů příbuzenské plemenitby
- Analýza hlavních komponent
- Analýza příměsí
.
Citace ANGSD-.wrapper
ANGSD-wrapper byl publikován v Molecular Ecology Resources; pokud jej použijete ve své práci, citujte prosím tento článek. Pro uživatele BibTeXu je citace následující:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}