NOTA: La última versión de ANGSD-wrapper está en ANGSD-wrapper/angsd-wrapper
La versión en este repositorio está desactualizada, por favor vaya a la versión enlazada anteriormente.
ANGSD-wrapper es una utilidad desarrollada para ayudar en el análisis de datos de secuenciación de próxima generación. Los usuarios pueden hacer lo siguiente con esta suite:
- Calcular un espectro de frecuencias de sitios
- Calcular un espectro de frecuencias de sitios 2D con las correspondientes estimaciones FST
- Realizar pruebas ABBA/BABA
- Extraer una secuencia FASTA de archivos BAM
- Calcular probabilidades de genotipo
- Estimar Thetas y varios estadísticos de neutralidad
- Calcular porindividuo
- Encontrar proporciones de mezcla
En ANGSD se utilizan enfoques basados en la verosimilitud para calcular estadísticas de resumen a partir de datos de secuenciación de nueva generación. Los scripts de envoltura y la documentación están diseñados para que ANGSD sea fácil de usar.
Instalación de ANGSD-wrapper
Para instalar ANGSD-wrapper, descárgalo desde GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Entra en el directorio ANGSD-wrapper
cd angsd-wrapper/
Ejecuta el comando de instalación
./angsd-wrapper setup dependencies
Descarga el conjunto de datos de ejemplo (opcional)
./angsd-wrapper setup data
Finaliza la instalación
source ~/.bash_profile
Una nota sobre los archivos BAM
ANGSD requiere archivos BAM como entrada, y ANGSD-wrapper pasa una lista de archivos BAM a ANGSD. Estos archivos BAM tienen algunos requisitos:
- Los archivos BAM deben tener una línea de cabecera ‘@HD’
- Los archivos BAM deben estar indexados (.bai)
Para ver si los archivos BAM tienen o no una línea de cabecera ‘@HD’, ejecute lo siguiente en su lista de muestras:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Si alguna muestra comienza con ‘@SQ’ en lugar de ‘@HD’, ANGSD y ANGSD-wrapper fallarán. Este Gist añadirá una @HD
línea de cabecera a sus archivos BAM.
Los archivos de índice deben generarse después de los archivos BAM. Para indexar los archivos BAM usando SAMTools, ejecute lo siguiente en su lista de muestras:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Si tiene GNU Parallel instalado en su sistema, este proceso puede acelerarse:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Uso básico
Para ejecutar ANGSD-wrapper, ejecuta
angsd-wrapper <wrapper> <config>
Donde wrapper
es uno de los métodos que ANGSD-wrapper puede ejecutar y config
es la ruta relativa al fichero de configuración correspondiente.
Para ver una lista de wrappers disponibles, ejecuta
angsd-wrapper
Ficheros de configuración
Hay un fichero de configuración (config) para cada método disponible a través de angsd-wrapper.
Los ficheros de configuración contienen variables utilizadas por los wrappers. Aquí es donde tiene que modificar y guardar las variables (es decir, especificar las rutas de los archivos BAM indexados / archivos CRAM, archivos FASTA, listas de muestras, etc.) para adaptarse a sus muestras antes de ejecutar angsd-wrapper con un método especificado.
Los archivos de configuración por defecto se pueden encontrar en el directorio Configuration_Files
. Deberá modificarlos para adaptarlos a sus muestras. Por favor, consulte los archivos de configuración o la wiki para ver para qué se utiliza cada variable y cómo deben especificarse. Si ejecuta angsd-wrapper
sin argumentos, devolverá un mensaje de uso.
Los archivos de configuración de ejemplo se pueden encontrar en Example_Data/Configuration_Files
al ejecutar angsd-wrapper setup data
.
Más información
Para más información sobre ANGSD-wrapper, los métodos disponibles a través de ANGSD-wrapper, y un tutorial completo, por favor vea el wiki.
Dependencias
Este paquete requiere las siguientes dependencias:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Se descargan e instalan automáticamente cuando se instala angsd-wrapper
Hay algunas otras dependencias que no se descargan automáticamente durante la instalación:
- SAMTools
- Librería científica GNU
- Git
- Wget
Métodos soportados
- Espectro de frecuencias del sitio (SFS)
- Estimaciones de tetas
- SFS2D y FST
- ABBA/BABA
- Extracciones de secuencias ancestrales
- Estimaciones de probabilidad del genotipo
- Cálculos de coeficientes de endogamia
- Análisis de componentes principales
- Análisis de mezclas
Citar ANGSD-wrapper
ANGSD-wrapper fue publicado en Molecular Ecology Resources; si lo utiliza en su trabajo, cite el artículo. Para los usuarios de BibTeX, la cita es la siguiente:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}