¿Cuál es la diferencia entre FASTA y FASTQ?

¿Cuál es la diferencia entre FASTA y FASTQ?

El diferencia clave Entre Fasta y Fastq es que FASTA es un formato basado en texto que solo almacena secuencias de nucleótidos o proteínas, mientras que FASTQ es un formato basado en texto que almacena la secuencia y los valores de calidad de la secuencia asociados.

La bioinformática es un campo que utiliza un software diferente para analizar y comprender los datos biológicos, especialmente cuando el conjunto de datos es complejo y grande. Este campo combina biología, química, física, informática, ingeniería de la información, matemáticas y estadísticas para analizar e interpretar datos biológicos. FASTA y FASTQ son dos formatos de representación de secuencia en el campo de la bioinformática para alinear y analizar secuencias. De hecho, FASTQ es un formato de archivo de secuencia que extiende el formato FASTA con la capacidad de almacenar la calidad de la secuencia.

CONTENIDO

1. Descripción general y diferencia de claves
2. Que es FASTA
3. Que es Fastq
4. Similitudes - FASTA y FASTQ
5. FASTA VS FASTQ en forma tabular
6. Resumen - FASTA VS FASTQ

Que es FASTA?

FASTA es un software de alineación para la secuencia de ADN y proteínas. El software FASTA utiliza formato FASTA. Es un formato basado en texto que representa secuencias de nucleótidos o secuencias de aminoácidos (proteínas). Aquí, los códigos de una sola letra representan ambas secuencias. FASTA es una herramienta importante en los campos de la bioinformática y la bioquímica. Este formato permite que los nombres de secuencias y los comentarios precedan a las secuencias.

Figura 01: secuencia FASTA

Este formato se originó en el software FASTA y fue presentado por David J. Lipmann y William R. Pearson en 1985. La herramienta FASTA tuvo muchas modificaciones con el tiempo, y la última versión consiste en programas para proteínas: proteína, ADN: ADN, proteína: ADN traducido (con desplazamiento de marco) y búsquedas de péptidos ordenadas o desordenadas. FASTA lee una secuencia de nucleótidos o aminoácidos dada y busca la base de datos de secuencia correspondiente mediante el uso de la alineación de secuencias locales para encontrar coincidencias de secuencias de base de datos similares.

Que es Fastq?

FASTQ es un software de alineación utilizado en el campo de la bioinformática, que almacena una secuencia biológica (generalmente secuencia de nucleótidos) y sus puntajes de calidad correspondientes. FASTQ se desarrolló originalmente para agrupar una secuencia formateada de FASTA y los datos de calidad relacionados por Wellcome Trust Sanger Institute. Con el desarrollo en el campo de la bioinformática, FastQ se convirtió en el estándar de facto para almacenar la salida de muchos instrumentos de secuenciación de alto rendimiento.

El formato FastQ usa cuatro líneas diferentes por secuencia. La línea 1 comienza con el personaje de @ y es seguido por un identificador de secuencia (similar a una línea de título de FASTA). La línea 2 consiste en letras de secuencia sin procesar. En la línea 3, la secuencia comienza con un carácter '+' y es opcionalmente seguido por el mismo identificador de secuencia. La línea 4 codifica los valores de calidad para la secuencia en la línea 2 y debe consistir en el mismo número de símbolos que las letras en la secuencia.

¿Cuáles son las similitudes entre FASTA y FASTQ??

  • FASTA y FASTQ son herramientas de alineación.
  • Son dos formatos de representación de secuencia.
  • Ambos están relacionados con el campo de la bioinformática.
  • Tanto Fast como FastQ son herramientas importantes para el almacenamiento y la secuenciación.
  • FASTQ es una extensión del formato FASTA con la capacidad de almacenar la calidad de la secuencia.

¿Cuál es la diferencia entre FASTA y FASTQ??

FASTA es un formato basado en texto que almacena solo secuencias de nucleótidos o proteínas, mientras que FASTQ es un formato basado en texto que almacena tanto la secuencia como los valores de calidad de secuencia asociados. Por lo tanto, esta es la diferencia clave entre FASTA y FASTQ. Además, FASTA almacena fragmentos de secuencia después de ser mapeado, mientras que FastQ almacena fragmentos de secuencia antes de mapear. Además, otra diferencia entre FASTA y FASTQ es que FASTA consiste en una línea de descripción, y FastAQ consta de cuatro líneas.

La siguiente infografía presenta las diferencias entre FASTA y FASTQ en forma tabular para la comparación de lado a lado.

Resumen -FASTA VS FASTQ

La bioinformática utiliza diferentes formatos de secuencias como FASTA y FASTQ, etc. FASTA almacena fragmentos de secuencia después de ser mapeado mientras Fastq almacena los fragmentos de secuencia antes de mapear. FASTA es un software de alineación para la secuencia de ADN y proteínas. Consiste en programas para proteínas: proteína, ADN: ADN, proteína: ADN traducido (con desplazamientos de marco) y búsquedas de péptidos ordenadas o desordenadas. FASTQ es un software de alineación utilizado en el campo de la bioinformática y almacena una secuencia biológica (generalmente secuencia de nucleótidos) y sus puntajes de calidad correspondientes. FASTA consta de una línea de descripción, y FASTQ consta de cuatro líneas. Entonces, esto resume la diferencia entre FASTA y FASTQ.

Referencia:

1. Akalin, Altuna. "Genómica computacional con R."7.1 formatos FASTA y FASTQ.
2. "Descripción del formato FASTA."Centro Nacional de Información de Biotecnología, u.S. Biblioteca Nacional de Medicina.

Imagen de cortesía:

1. "Alineación de histonas" de Thomas Shafee - Trabajo propio (CC por 4.0) a través de Commons Wikimedia