mojaveazure / angsd-wrapper Archivado

NOTA: La última versión de ANGSD-wrapper está en ANGSD-wrapper/angsd-wrapper

La versión en este repositorio está desactualizada, por favor vaya a la versión enlazada anteriormente.

ANGSD-wrapper es una utilidad desarrollada para ayudar en el análisis de datos de secuenciación de próxima generación. Los usuarios pueden hacer lo siguiente con esta suite:

  • Calcular un espectro de frecuencias de sitios
  • Calcular un espectro de frecuencias de sitios 2D con las correspondientes estimaciones FST
  • Realizar pruebas ABBA/BABA
  • Extraer una secuencia FASTA de archivos BAM
  • Calcular probabilidades de genotipo
  • Estimar Thetas y varios estadísticos de neutralidad
  • Calcular porindividuo
  • Encontrar proporciones de mezcla

En ANGSD se utilizan enfoques basados en la verosimilitud para calcular estadísticas de resumen a partir de datos de secuenciación de nueva generación. Los scripts de envoltura y la documentación están diseñados para que ANGSD sea fácil de usar.

Instalación de ANGSD-wrapper

Para instalar ANGSD-wrapper, descárgalo desde GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Entra en el directorio ANGSD-wrapper

cd angsd-wrapper/

Ejecuta el comando de instalación

./angsd-wrapper setup dependencies

Descarga el conjunto de datos de ejemplo (opcional)

./angsd-wrapper setup data

Finaliza la instalación

source ~/.bash_profile

Una nota sobre los archivos BAM

ANGSD requiere archivos BAM como entrada, y ANGSD-wrapper pasa una lista de archivos BAM a ANGSD. Estos archivos BAM tienen algunos requisitos:

  • Los archivos BAM deben tener una línea de cabecera ‘@HD’
  • Los archivos BAM deben estar indexados (.bai)

Para ver si los archivos BAM tienen o no una línea de cabecera ‘@HD’, ejecute lo siguiente en su lista de muestras:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Si alguna muestra comienza con ‘@SQ’ en lugar de ‘@HD’, ANGSD y ANGSD-wrapper fallarán. Este Gist añadirá una @HDlínea de cabecera a sus archivos BAM.

Los archivos de índice deben generarse después de los archivos BAM. Para indexar los archivos BAM usando SAMTools, ejecute lo siguiente en su lista de muestras:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Si tiene GNU Parallel instalado en su sistema, este proceso puede acelerarse:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Uso básico

Para ejecutar ANGSD-wrapper, ejecuta

angsd-wrapper <wrapper> <config>

Donde wrapper es uno de los métodos que ANGSD-wrapper puede ejecutar y config es la ruta relativa al fichero de configuración correspondiente.

Para ver una lista de wrappers disponibles, ejecuta

angsd-wrapper

Ficheros de configuración

Hay un fichero de configuración (config) para cada método disponible a través de angsd-wrapper.Los ficheros de configuración contienen variables utilizadas por los wrappers. Aquí es donde tiene que modificar y guardar las variables (es decir, especificar las rutas de los archivos BAM indexados / archivos CRAM, archivos FASTA, listas de muestras, etc.) para adaptarse a sus muestras antes de ejecutar angsd-wrapper con un método especificado.

Los archivos de configuración por defecto se pueden encontrar en el directorio Configuration_Files. Deberá modificarlos para adaptarlos a sus muestras. Por favor, consulte los archivos de configuración o la wiki para ver para qué se utiliza cada variable y cómo deben especificarse. Si ejecuta angsd-wrapper sin argumentos, devolverá un mensaje de uso.

Los archivos de configuración de ejemplo se pueden encontrar en Example_Data/Configuration_Files al ejecutar angsd-wrapper setup data.

Más información

Para más información sobre ANGSD-wrapper, los métodos disponibles a través de ANGSD-wrapper, y un tutorial completo, por favor vea el wiki.

Dependencias

Este paquete requiere las siguientes dependencias:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Se descargan e instalan automáticamente cuando se instala angsd-wrapper

Hay algunas otras dependencias que no se descargan automáticamente durante la instalación:

  • SAMTools
  • Librería científica GNU
  • Git
  • Wget

Métodos soportados

  • Espectro de frecuencias del sitio (SFS)
  • Estimaciones de tetas
  • SFS2D y FST
  • ABBA/BABA
  • Extracciones de secuencias ancestrales
  • Estimaciones de probabilidad del genotipo
  • Cálculos de coeficientes de endogamia
  • Análisis de componentes principales
  • Análisis de mezclas

Citar ANGSD-wrapper

ANGSD-wrapper fue publicado en Molecular Ecology Resources; si lo utiliza en su trabajo, cite el artículo. Para los usuarios de BibTeX, la cita es la siguiente:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Deja un comentario