mojaveazure / angsd-wrapper Archived

UWAGA: Najnowsza wersja ANGSD-wrapper znajduje się pod adresem ANGSD-wrapper/angsd-wrapper

Wersja w tym repozytorium jest nieaktualna, proszę przejść do wersji podlinkowanej powyżej.

ANGSD-wrapper jest narzędziem opracowanym w celu pomocy w analizie danych sekwencjonowania następnej generacji. Użytkownicy mogą wykonać następujące czynności za pomocą tego pakietu:

  • Obliczyć spektrum częstotliwości miejsc
  • Obliczyć spektrum częstotliwości miejsc 2D z odpowiednimi estymacjami FST
  • Wykonać testy ABBA/BABA
  • .

  • Ekstrakcja sekwencji FASTA z plików BAM
  • Obliczanie prawdopodobieństw genotypów
  • Oszacowanie Thetas i różnych statystyk neutralności
  • Obliczanie współczynnika inbredu na-indywidualny współczynnik inbredu
  • Oznacz proporcje domieszek

Podejścia oparte na prawdopodobieństwie są używane w ANGSD do obliczania statystyk zbiorczych z danych sekwencjonowania następnej generacji. Skrypty i dokumentacja zostały zaprojektowane tak, aby ANGSD było przyjazne dla użytkownika.

Instalowanie ANGSD-wrapper

Aby zainstalować ANGSD-wrapper, pobrać z GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Przejść do katalogu ANGSD-wrapper

cd angsd-wrapper/

Uruchom polecenie setup

./angsd-wrapper setup dependencies

Pobierz przykładowy zestaw danych (opcjonalnie)

./angsd-wrapper setup data

Zakończ instalację

source ~/.bash_profile

Uwaga o plikach BAM

ANGSD wymaga plików BAM jako danych wejściowych, a ANGSD-wrapper przekazuje listę plików BAM do ANGSD. Te pliki BAM mają kilka wymagań:

  • Pliki BAM muszą mieć linię nagłówka '@HD’
  • Pliki BAM muszą być indeksowane (.bai)

Aby sprawdzić, czy pliki BAM mają linię nagłówka '@HD’, wykonaj następujące czynności na swojej liście próbek:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Jeśli jakiekolwiek próbki zaczynają się od '@SQ’ zamiast '@HD’, ANGSD i ANGSD-wrapper zawiodą. Ten Gist doda @HD linii nagłówkowych do twoich plików BAM.

Pliki indeksowe muszą być generowane po plikach BAM. Aby zaindeksować pliki BAM za pomocą SAMTools, wykonaj następujące czynności na swojej liście próbek:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Jeśli masz zainstalowany GNU Parallel w swoim systemie, proces ten może zostać przyspieszony:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Podstawowe użycie

Aby uruchomić ANGSD-wrapper, uruchom

angsd-wrapper <wrapper> <config>

Gdzie wrapper jest jedną z metod, które ANGSD-wrapper może uruchomić, a config jest względną ścieżką do odpowiedniego pliku konfiguracyjnego.

Aby zobaczyć listę dostępnych wrapperów, uruchom

angsd-wrapper

Pliki konfiguracyjne

Dla każdej metody dostępnej przez angsd-wrapper. istnieje plik konfiguracyjny (config), w którym przechowywane są zmienne używane przez wrappery. To tutaj należy zmodyfikować i zapisać zmienne (np. określić ścieżki plików indeksowanych plików BAM/CRAM, plików FASTA, list próbek, itp.), aby dopasować je do swoich próbek przed uruchomieniem angsd-wrapper z określoną metodą.

Domyślne pliki konfiguracyjne można znaleźć w katalogu Configuration_Files. Będziesz musiał je zmodyfikować, aby pasowały do twoich próbek. Proszę zapoznać się z plikami konfiguracyjnymi lub wiki, aby zobaczyć do czego każda zmienna jest używana i jak powinna być określona. Jeśli uruchomisz angsd-wrapper bez żadnych argumentów, zwróci on komunikat o użyciu.

Przykładowe pliki konfiguracyjne można znaleźć w Example_Data/Configuration_Files po uruchomieniu angsd-wrapper setup data.

Dalsze informacje

Więcej informacji o ANGSD-wrapper, metodach dostępnych przez ANGSD-wrapper oraz wyczerpujący samouczek można znaleźć na wiki.

Zależności

Ten pakiet wymaga następujących zależności:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Zależności te są pobierane i instalowane automatycznie, gdy angsd-wrapper jest instalowany

Jest kilka innych zależności, które nie są automatycznie pobierane podczas instalacji:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Obsługiwane metody

  • Site frequency spectrum (SFS)
  • Thetas estimations
  • 2D SFS i FST
  • .

  • ABBA/BABA
  • Wyciąganie sekwencji przodków
  • Oszacowania prawdopodobieństwa genotypu
  • Obliczenia współczynników wsobności
  • Analiza składowych głównych
  • Analiza domieszek

Cytowanie ANGSD-.wrapper

ANGSD-wrapper został opublikowany w Molecular Ecology Resources; jeśli użyjesz tego w swojej pracy, proszę zacytuj tę pracę. Dla użytkowników BibTeX, cytowanie wygląda następująco:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

.

Dodaj komentarz