NOTA: A última versão do ANGSD-wrapper está em ANGSD-wrapper/angsd-wrapper
A versão neste repositório está desatualizada, por favor vá para a versão ligada acima.
ANGSD-wrapper é um utilitário desenvolvido para auxiliar na análise da próxima geração de dados sequenciais. Os usuários podem fazer o seguinte com esta suíte:
- Calcular um espectro de frequência do site
- Calcular um espectro de frequência do site 2D com estimativas FST correspondentes
- Executar testes ABBA/BABABA
- Extrair uma sequência FASTA dos ficheiros BAM
- Calcular as probabilidades do genótipo
- Estimar os gostos e várias estatísticas de neutralidade
- Calcular por…coeficiente de consanguinidade individual
- Conhecer proporções de mistura
As abordagens baseadas na probabilidade de erro são usadas em ANGSD para calcular estatísticas resumidas a partir de dados de sequenciamento da próxima geração. Os scripts e a documentação do wrapper são projetados para tornar o ANGSD de fácil utilização.
Instalando o ANGSD-wrapper
Para instalar o ANGSD-wrapper, download de GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Vá para o ANGSD-wrapper directory
>
cd angsd-wrapper/
>
Executar o comando de configuração
>
./angsd-wrapper setup dependencies
>
>
Download do conjunto de dados de exemplo (opcional)
>
./angsd-wrapper setup data
Finalizar a instalação
>
source ~/.bash_profile
>
>
Uma nota sobre arquivos BAM
ANGSD requer arquivos BAM como entrada, e ANGSD-wrapper passa uma lista de arquivos BAM para ANGSD. Estes ficheiros BAM têm alguns requisitos:
- Os ficheiros BAM devem ter uma linha de cabeçalho ‘@HD’
- Os ficheiros BAM devem ser indexados (.bai)
Para ver se os arquivos BAM têm ou não uma linha de cabeçalho ‘@HD’, execute o seguinte na sua lista de amostras:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Se qualquer amostra começar com ‘@SQ’ em vez de ‘@HD’, o ANGSD e o ANGSD-wrapper irão falhar. Este Gist adicionará uma linha de cabeçalho @HD
aos seus arquivos BAM.
Os arquivos de índice devem ser gerados após os arquivos BAM. Para indexar os arquivos BAM usando o SAMTools, execute o seguinte na sua lista de exemplo:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Se você tem o GNU Parallel instalado no seu sistema, este processo pode ser acelerado:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Uso básico
Para executar o ANGSD-wrapper, execute
angsd-wrapper <wrapper> <config>
Onde wrapper
é um dos métodos que o ANGSD-wrapper pode executar e config
é o caminho relativo para o arquivo de configuração correspondente.
Para ver uma lista de wrappers disponíveis, execute
angsd-wrapper
Ficheiros de configuração
Há um ficheiro de configuração (config) para cada método disponível através de angsd-wrapper.
Os ficheiros de configuração contêm variáveis utilizadas pelos wrappers. Aqui é onde você precisa modificar e salvar as variáveis (ou seja, especificar caminhos de arquivo de arquivos BAM indexados/CRAM, arquivos FASTA, listas de amostras, etc.) para se adequar às suas amostras antes de executar o angsd-wrapper com um método especificado.
Os arquivos de configuração padrão podem ser encontrados no diretório Configuration_Files
. Você precisará modificá-los para se adequarem aos seus samples. Consulte os arquivos de configuração ou o wiki para ver para que cada variável é usada e como elas devem ser especificadas. Se você executar angsd-wrapper
sem nenhum argumento, ele retornará uma mensagem de uso.
Example config files podem ser encontrados em Example_Data/Configuration_Files
ao executar angsd-wrapper setup data
.
Futher Information
Para mais informações sobre o ANGSD-wrapper, os métodos disponíveis através do ANGSD-wrapper, e um tutorial abrangente, por favor veja o wiki.
Dependências
Este pacote requer as seguintes dependências:
>
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Estas são baixadas e instaladas automaticamente quando o angsd-wrapper é instalado
Existem algumas outras dependências que não são baixadas automaticamente durante a instalação:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Métodos suportados
- Site frequency spectrum (SFS)
- Thetas estimations
- 2D SFS e FST
- ABBA/BABA
- Excepções de sequência ancestral
- Estimativas de probabilidade genotípica
- Cálculos de coeficientes consanguíneos
- Análise de componentes primitivos
- Análise de misturas
Citando ANGSD-wrapper
ANGSD-wrapper foi publicado em Molecular Ecology Resources; se você usar isso em seu trabalho, por favor, cite o artigo. Para usuários do BibTeX, a citação é a seguinte:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}