UWAGA: Najnowsza wersja ANGSD-wrapper znajduje się pod adresem ANGSD-wrapper/angsd-wrapper
Wersja w tym repozytorium jest nieaktualna, proszę przejść do wersji podlinkowanej powyżej.
ANGSD-wrapper jest narzędziem opracowanym w celu pomocy w analizie danych sekwencjonowania następnej generacji. Użytkownicy mogą wykonać następujące czynności za pomocą tego pakietu:
- Obliczyć spektrum częstotliwości miejsc
- Obliczyć spektrum częstotliwości miejsc 2D z odpowiednimi estymacjami FST
- Wykonać testy ABBA/BABA
- Ekstrakcja sekwencji FASTA z plików BAM
- Obliczanie prawdopodobieństw genotypów
- Oszacowanie Thetas i różnych statystyk neutralności
- Obliczanie współczynnika inbredu na-indywidualny współczynnik inbredu
- Oznacz proporcje domieszek
.
Podejścia oparte na prawdopodobieństwie są używane w ANGSD do obliczania statystyk zbiorczych z danych sekwencjonowania następnej generacji. Skrypty i dokumentacja zostały zaprojektowane tak, aby ANGSD było przyjazne dla użytkownika.
Instalowanie ANGSD-wrapper
Aby zainstalować ANGSD-wrapper, pobrać z GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Przejść do katalogu ANGSD-wrapper
cd angsd-wrapper/
Uruchom polecenie setup
./angsd-wrapper setup dependencies
Pobierz przykładowy zestaw danych (opcjonalnie)
./angsd-wrapper setup data
Zakończ instalację
source ~/.bash_profile
Uwaga o plikach BAM
ANGSD wymaga plików BAM jako danych wejściowych, a ANGSD-wrapper przekazuje listę plików BAM do ANGSD. Te pliki BAM mają kilka wymagań:
- Pliki BAM muszą mieć linię nagłówka '@HD’
- Pliki BAM muszą być indeksowane (.bai)
Aby sprawdzić, czy pliki BAM mają linię nagłówka '@HD’, wykonaj następujące czynności na swojej liście próbek:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Jeśli jakiekolwiek próbki zaczynają się od '@SQ’ zamiast '@HD’, ANGSD i ANGSD-wrapper zawiodą. Ten Gist doda @HD
linii nagłówkowych do twoich plików BAM.
Pliki indeksowe muszą być generowane po plikach BAM. Aby zaindeksować pliki BAM za pomocą SAMTools, wykonaj następujące czynności na swojej liście próbek:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Jeśli masz zainstalowany GNU Parallel w swoim systemie, proces ten może zostać przyspieszony:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Podstawowe użycie
Aby uruchomić ANGSD-wrapper, uruchom
angsd-wrapper <wrapper> <config>
Gdzie wrapper
jest jedną z metod, które ANGSD-wrapper może uruchomić, a config
jest względną ścieżką do odpowiedniego pliku konfiguracyjnego.
Aby zobaczyć listę dostępnych wrapperów, uruchom
angsd-wrapper
Pliki konfiguracyjne
Dla każdej metody dostępnej przez angsd-wrapper.
istnieje plik konfiguracyjny (config), w którym przechowywane są zmienne używane przez wrappery. To tutaj należy zmodyfikować i zapisać zmienne (np. określić ścieżki plików indeksowanych plików BAM/CRAM, plików FASTA, list próbek, itp.), aby dopasować je do swoich próbek przed uruchomieniem angsd-wrapper z określoną metodą.
Domyślne pliki konfiguracyjne można znaleźć w katalogu Configuration_Files
. Będziesz musiał je zmodyfikować, aby pasowały do twoich próbek. Proszę zapoznać się z plikami konfiguracyjnymi lub wiki, aby zobaczyć do czego każda zmienna jest używana i jak powinna być określona. Jeśli uruchomisz angsd-wrapper
bez żadnych argumentów, zwróci on komunikat o użyciu.
Przykładowe pliki konfiguracyjne można znaleźć w Example_Data/Configuration_Files
po uruchomieniu angsd-wrapper setup data
.
Dalsze informacje
Więcej informacji o ANGSD-wrapper, metodach dostępnych przez ANGSD-wrapper oraz wyczerpujący samouczek można znaleźć na wiki.
Zależności
Ten pakiet wymaga następujących zależności:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Zależności te są pobierane i instalowane automatycznie, gdy angsd-wrapper jest instalowany
Jest kilka innych zależności, które nie są automatycznie pobierane podczas instalacji:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Obsługiwane metody
- Site frequency spectrum (SFS)
- Thetas estimations
- 2D SFS i FST
- ABBA/BABA
- Wyciąganie sekwencji przodków
- Oszacowania prawdopodobieństwa genotypu
- Obliczenia współczynników wsobności
- Analiza składowych głównych
- Analiza domieszek
.
Cytowanie ANGSD-.wrapper
ANGSD-wrapper został opublikowany w Molecular Ecology Resources; jeśli użyjesz tego w swojej pracy, proszę zacytuj tę pracę. Dla użytkowników BibTeX, cytowanie wygląda następująco:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}
.