mojaveazure / angsd-wrapper Archived

NOTA: A última versão do ANGSD-wrapper está em ANGSD-wrapper/angsd-wrapper

A versão neste repositório está desatualizada, por favor vá para a versão ligada acima.

ANGSD-wrapper é um utilitário desenvolvido para auxiliar na análise da próxima geração de dados sequenciais. Os usuários podem fazer o seguinte com esta suíte:

  • Calcular um espectro de frequência do site
  • Calcular um espectro de frequência do site 2D com estimativas FST correspondentes
  • Executar testes ABBA/BABABA
  • Extrair uma sequência FASTA dos ficheiros BAM
  • Calcular as probabilidades do genótipo
  • Estimar os gostos e várias estatísticas de neutralidade
  • Calcular por…coeficiente de consanguinidade individual
  • Conhecer proporções de mistura

As abordagens baseadas na probabilidade de erro são usadas em ANGSD para calcular estatísticas resumidas a partir de dados de sequenciamento da próxima geração. Os scripts e a documentação do wrapper são projetados para tornar o ANGSD de fácil utilização.

Instalando o ANGSD-wrapper

Para instalar o ANGSD-wrapper, download de GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Vá para o ANGSD-wrapper directory

>

cd angsd-wrapper/

>

Executar o comando de configuração

>

>

./angsd-wrapper setup dependencies

>

>

Download do conjunto de dados de exemplo (opcional)

>

>

./angsd-wrapper setup data

Finalizar a instalação

>

>

source ~/.bash_profile

>

>

Uma nota sobre arquivos BAM

ANGSD requer arquivos BAM como entrada, e ANGSD-wrapper passa uma lista de arquivos BAM para ANGSD. Estes ficheiros BAM têm alguns requisitos:

  • Os ficheiros BAM devem ter uma linha de cabeçalho ‘@HD’
  • Os ficheiros BAM devem ser indexados (.bai)

Para ver se os arquivos BAM têm ou não uma linha de cabeçalho ‘@HD’, execute o seguinte na sua lista de amostras:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Se qualquer amostra começar com ‘@SQ’ em vez de ‘@HD’, o ANGSD e o ANGSD-wrapper irão falhar. Este Gist adicionará uma linha de cabeçalho @HD aos seus arquivos BAM.

Os arquivos de índice devem ser gerados após os arquivos BAM. Para indexar os arquivos BAM usando o SAMTools, execute o seguinte na sua lista de exemplo:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Se você tem o GNU Parallel instalado no seu sistema, este processo pode ser acelerado:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Uso básico

Para executar o ANGSD-wrapper, execute

angsd-wrapper <wrapper> <config>

Onde wrapper é um dos métodos que o ANGSD-wrapper pode executar e config é o caminho relativo para o arquivo de configuração correspondente.

Para ver uma lista de wrappers disponíveis, execute

angsd-wrapper

Ficheiros de configuração

Há um ficheiro de configuração (config) para cada método disponível através de angsd-wrapper. Os ficheiros de configuração contêm variáveis utilizadas pelos wrappers. Aqui é onde você precisa modificar e salvar as variáveis (ou seja, especificar caminhos de arquivo de arquivos BAM indexados/CRAM, arquivos FASTA, listas de amostras, etc.) para se adequar às suas amostras antes de executar o angsd-wrapper com um método especificado.

Os arquivos de configuração padrão podem ser encontrados no diretório Configuration_Files. Você precisará modificá-los para se adequarem aos seus samples. Consulte os arquivos de configuração ou o wiki para ver para que cada variável é usada e como elas devem ser especificadas. Se você executar angsd-wrapper sem nenhum argumento, ele retornará uma mensagem de uso.

Example config files podem ser encontrados em Example_Data/Configuration_Files ao executar angsd-wrapper setup data.

Futher Information

Para mais informações sobre o ANGSD-wrapper, os métodos disponíveis através do ANGSD-wrapper, e um tutorial abrangente, por favor veja o wiki.

Dependências

Este pacote requer as seguintes dependências:

>

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Estas são baixadas e instaladas automaticamente quando o angsd-wrapper é instalado

Existem algumas outras dependências que não são baixadas automaticamente durante a instalação:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Métodos suportados

  • Site frequency spectrum (SFS)
  • Thetas estimations
  • 2D SFS e FST
  • ABBA/BABA
  • Excepções de sequência ancestral
  • Estimativas de probabilidade genotípica
  • Cálculos de coeficientes consanguíneos
  • Análise de componentes primitivos
  • Análise de misturas

Citando ANGSD-wrapper

ANGSD-wrapper foi publicado em Molecular Ecology Resources; se você usar isso em seu trabalho, por favor, cite o artigo. Para usuários do BibTeX, a citação é a seguinte:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Deixe um comentário