Diferencia entre similitud e identidad en la alineación de secuencias

Diferencia entre similitud e identidad en la alineación de secuencias

El diferencia clave entre la similitud y la identidad en la alineación de la secuencia es que La similitud es la semejanza (semejanza) entre dos secuencias en comparación, mientras que la identidad es el número de caracteres que coinciden exactamente entre dos secuencias diferentes.

La bioinformática es un campo interdisciplinario de la ciencia que involucra principalmente biología molecular y genética, informática, matemáticas y estadísticas. La alineación de secuencias es un término importante en bioinformática. Es el procedimiento en el que se organizan las secuencias de ADN, ARN o proteína para identificar regiones de semejanza que es consecuencia de una relación funcional, estructural o evolutiva entre las secuencias. Al final de la alineación, se presentarán como filas dentro de una matriz. Para alinear los caracteres idénticos en los columnos sucesivos, las brechas insertadas están presentes entre los residuos.

CONTENIDO

1. Descripción general y diferencia de claves
2. ¿Qué es la similitud en la alineación de la secuencia?
3. ¿Qué es la identidad en la alineación de la secuencia?
4. Similitudes entre similitud e identidad en la alineación de secuencias
5. Comparación de lado a lado - Similidad vs identidad en la alineación de secuencias en forma tabular
6. Resumen

Que es la similitud?

La similitud en la alineación de la secuencia es la semejanza entre dos secuencias en comparación. Este hecho depende de la identidad de las secuencias. La similitud representa la medida en que los residuos están alineados. Por lo tanto, secuencias similares contienen propiedades similares. En bioinformática, la similitud es una herramienta para evaluar la semejanza entre dos proteínas.

Figura 01: similitud en la alineación de secuencias

Hay dos pasos principales para secuencia del proceso de alineación. El paso inicial es la alineación de pares, lo que ayuda a encontrar la alineación óptima entre dos secuencias (incluidas las brechas) usando algoritmos como BLAST, FASTA y Lalign. El algoritmo coincidente encuentra el número mínimo de operaciones de edición; en los grifos y sustituciones para alinear una secuencia con la otra secuencia. Después de la alineación por pares, es necesario obtener dos parámetros cuantitativos de cada comparación de pares. Son identidad y similitud.

Que es la identidad?

La identidad en la alineación de la secuencia es el número de caracteres que coinciden exactamente entre dos secuencias diferentes. Por lo tanto, las brechas no cuentan al evaluar la identidad. La medición se considera relacional a la secuencia más corta entre las dos secuencias. Implica significativamente que tiene el efecto donde la identidad de secuencia no es transitiva. Si x = y e y = z, entonces x no es necesariamente igual a z. Esto se deduce en términos de la medida de distancia de identidad.

Figura 02: Identidad en la alineación de secuencias

Por ejemplo, X tiene una secuencia de AAGGCTT, Y tiene una secuencia de AAGGC y Z tiene una secuencia de AAGGCAT. La identidad entre x e y es 100% 5 nucleótidos idénticos / min [longitud (x), longitud (y)]. La identidad entre Y y Z también es 100%. Pero la identidad entre x y z es solo 85% (6 nucleótidos idénticos / 7).

¿Cuáles son las similitudes entre similitud e identidad en la alineación de secuencias??

  • Tanto la similitud como la identidad son dos términos que usamos en la alineación de secuencias.
  • Además, se refieren a la semejanza entre las dos secuencias.
  • Además, los expresamos como un valor porcentual.

¿Cuál es la diferencia entre similitud e identidad en la alineación de secuencias??

La similitud en la alineación indica la semejanza entre dos secuencias cuando se compara, mientras que la identidad en la alineación de la secuencia dice la cantidad de caracteres que coinciden exactamente entre dos secuencias diferentes. Por lo tanto, esta es la diferencia clave entre similitud e identidad en la alineación de la secuencia.

Resumen -Similitud vs identidad en alineación de secuencias

La alineación de la secuencia ayuda a identificar regiones de semejanza en el ADN, ARN o proteína resultó debido a la relación funcional, estructural o evolutiva entre las secuencias. Por lo tanto, la similitud y la identidad son dos términos clave en el contexto de la alineación de la secuencia. La diferencia clave entre estos dos términos es que la similitud es la semejanza entre dos secuencias en comparación, mientras que la identidad es el número de caracteres que coinciden exactamente entre dos secuencias diferentes. Por lo tanto, este es el resumen de la diferencia entre similitud e identidad en la alineación de la secuencia.

Referencia:

1. "Identidad y similitud: una medida cuantitativa."Identidad y similitud: una medida cuantitativa, disponible aquí.
2. "Alineación de secuencias."Alineación de secuencias - Bioinformática.Org Wiki, disponible aquí.

Imagen de cortesía:

1. "Filogenia basada en la alineación y sin alineación" por Kolekar Pandurang - Trabajo propio (CC por 3.0) a través de Commons Wikimedia
2. "BLAST SEAMT SALUT" por FDARDEL - Trabajo propio (CC BY -SA 3.0) a través de Commons Wikimedia