Recent Changes
Friday, September 11
-
home
edited
... 5. Bibliografía
6. Aportaciones al trabajo
Grupo Introducción Material y Métodos Resultados…
(view changes)...5. Bibliografía
6. Aportaciones al trabajo
Grupo Introducción Material y Métodos Resultados Discusión Conclusiones Aspecto global Aportaciones wiki Autoevaluación NOTA FINAL
11 0,45 0,95 1,95 2,4 0,9 0,5 2 0,5 96,50
8:58 am -
4. Conclusiones
edited
... - Nuestra proteína poseen pocos residuos de prolina por su impedimento de giro, muchos residuo…
(view changes)...- Nuestra proteína poseen pocos residuos de prolina por su impedimento de giro, muchos residuos de glicina alrededor del centro activo, que facilitan la flexibilidad de éste y alto porcentaje de aminoácidos pequeños. Además, contiene muchas laminas beta y pocas hélices alfa, que impiden el movimiento proteico. Estas modificaciones en la estructura permite flexibilizar la proteína para que pueda actuar en ambientes fríos.
- Nuestra proteína tiene estructura de barril TIM.
Bien, aunque se podrían haber clasificado en secciones.
8:01 am -
3. Resultados y discusión
edited
... La búsqueda de homólogos basándonos en el GeneName de la secuencia a estudiar en nuestro caso …
(view changes)...La búsqueda de homólogos basándonos en el GeneName de la secuencia a estudiar en nuestro caso es efectiva, debido a que ésta se encuentra muy conservada a lo largo de la evolución procariota y eucariota. Este hecho puede deberse a que tiene una función muy concreta como es la hidrólisis de un sustrato para obtener energía, tras su posterior degradación, por lo que las bacterias, sobre todo, han mantenido su secuencia a lo largo de la evolución. Sin embargo, nunca podemos tener la completa certeza de que el nombre del gen proporciona homólogos para su secuencia.
3.2. Búsqueda de secuencias homólogas usando la herramienta de búsqueda de similitud BLAST
...misma proteína. bien
En nuestro caso hemos elegido dos secuencias muy conservadas con nuestra proteína (pero no las más conservadas de todas, para poder así obtener mejores resultados en los alineamientos posteriores y en la búsqueda de dominio) y otras dos de organismos mucho más evolucionados que parecen tener cierta similitud en ciertos dominios proteicos, pero no serán homólogos completos de la betagalactosidasa. Mientras que las dos primeras presentan una similitud total con la proteína de estudio, las dos últimas sólo presentan una similitud parcial (tal y como muestra el esquema inferior, gráfico 2). Sin embargo, fueron los únicos organismos más alejados filogenéticamente que presentaban alguna similitud mencionable y con un e-value relativamente bajo pues, habiendo comparado con muchos otros grupos animales e incluso con organismos particulares, todos los alineamientos resultaban con un e-value muy alto, reflejando que cualquier similitud era azarosa:
- No hemos encontrado similitud con invertebrados (Por ejemplo: Caenorhabditis elegans à E-value = 3). El e-value más bajo encontrado para invertebrados fue en artrópodos y aun asi era muy alto. (E-value = 0,02).
...{file:///C:/Users/alberto/AppData/Local/Temp/msohtml1/06/clip_image004.jpg} Gráfico 2: Comparación de los alineamientos entre las secuencias elegidas por parecida identidad, con una BLOSUM 62, usando la herramienta BLAST.
Debemos hacer mención a que hemos usado las secuencias de aminoácidos para las secuencias homólogas y no los CDSs, por la degeneración del código genético, que podría eliminar organismos homólogos. Las secuencias aminoacídicas y nucleotídicas de estas proteínas han sido descargadas en formato multiFASTA para su posterior uso en el resto del trabajo. No pudimos encontrar las secuencias nucleotídicas (CDSs) de las proteínas de Sus scrofa y Homo sapiens, aunque sí sus secuencias de nucleótidos. Los 4 organismos fueron seleccionados por su alto grado de similitud y, en el caso de las secuencias de proteínas de cerdo y humano, por su distancia evolutiva con la secuencia de estudio. Tras la búsqueda de secuencias homólogas podemos verificar que nuestra proteína se encuentra muy conservada en organismos simples como bacterias, donde la evolución prácticamente no ha actuado en la modificación de su secuencia, aunque se encuentra muy alejada de otros organismos filogenéticamente lejanos, no existiendo prácticamente conservación. Podemos empezar a determinar una de las conclusiones del trabajo: nuestra proteína de estudio es una proteína de organismos simples, unicelulares.
muy bien
A continuación, las secuencias resultantes de la búsqueda de homólogos y de la búsqueda en bases de datos:
{MultiFASTA.txt} {MultiCDS.txt}
...- Últimas 1580 pb de Pseudoalteromonas haloplanktis
{Dibujo4.jpg}
...las secuenciasproteicasproteicas? de estos
Pseudoalteromonas haloplanktis vs. Thermotoga maritima
- Primeras 1540 pb de Pseudoalteromonas haloplanktis
...En un principio realizamos un alineamiento múltiple con las secuencias de las proteínas homólogas obtenidas, tanto por GeneName como por búsqueda de similitud con BLAST. Debemos mencionar que el análisis de los resultados obtenidos en los alineamientos múltiples son complicados debido al gran tamaño de la proteína, que se encuentra codificada por 1039 aminoácidos. El resultado de este alineamiento se muestra a continuación:
{alineamientos_residuos.jpg}
Muy completo
Los archivos obtenidos de los alineamientos se encuentran en los siguientes enlaces:
{multiFASTA.dnd} {multiFASTA.aln}
...- Un residuo de unión a sodio, vía óxido carbónico (posición 600) (Figura 8).
- Residuo de estabilización de la estructura en el estado de transición en las posiciones 356 y 390 (Figura 9).
...su sustrato.(excepto en mamíferos)
{Dibujo10.jpg} Figura 2: Residuo glutamínico que funciona como donador de protones del sitio activo totalmente conservado.
{Dibujo11.jpg} Figura 3: Residuo glutamínico que funciona como aminoácido nucleófilo.
...{Dibujo17.jpg}
Figura 9: Gran conservación de los residuos estabilizadores de la estructura
...de estudio. Muy bien
La región de unión a sustrato (Figura 1) debe estar conservada para que la especificidad de éste siga existiendo durante el proceso evolutivo y no se pierda la función principal de la proteína. Estos residuos se encuentran conservados en las proteínas procariotas y en Kluyveromyces lactis como secuencia consenso EY[AG]H, pero desaparecen en las proteínas de cerdo y hombre debido a que el sustrato utilizado por estas dos enzimas es distinto. La sustitución de Ala por Gly es irrelevante en el caso de la levadura, debido a que la sustitución se realiza entre aminoácidos de tamaño pequeño, que participan normalmente en el reconocimiento de sustratos.
Además, el sitio activo debe estar completamente conservado para llevar a cabo la reacción catalítica que convierte el sustrato, debido a que la reacción de hidrólisis es común a todas las proteínas estudiadas en este alineamiento. Por ello, el Glu460 (E), que actúa como donador de protones (Figura 2) se encuentra conservado, así como los aminoácidos que lo rodean. Se puede observar que la existencia de gaps cercanos a esta región son producidos por desapareamientos entre las secuencias de estudios con las secuencias de los dos organismos eucariotas más evolucionados que, al codificar una enzima con actividad diferente, aunque parecida a la de la enzima de referencia, tendrán una conformación distinta del sitio activo.
...36
100
...resultados comentadosguantedurante todo el
3.5. Búsqueda de dominios y motivos conservados en nuestra proteína de estudio
El análisis de dominios y motivos a través de la base de datos Pfam permite determinar los dominios proteicos presentes en nuestra proteína y validar los resultados obtenidos en los alineamientos múltiples anteriores. a partir de la información contenida en la ficha de nuestra proteína de Uniprot se estableció la presencia de un hipotético dominio Glyco Hydro 2 entre las posiciones 49 y 628, dividido en tres subdominios distintos (Glyco Hydro 2N, Glyco Hydro 2 y Glyco Hydro 2 C), y de un dominio Bgal Small N entre los residuos 796 y 949 de nuestra proteína de referencia, que se encontraban relativamente conservados en el alineamiento múltiple.
...3.6. Análisis de la expresión génica de la proteína de referencia
Para este análisis usamos la base de datos ArrayExpress, que proporciona multitud de experimentos sobre la expresión de genes. Introducimos el nombre del gen lacZ en el campo “Gene” y pulsamos sobre “Query”. Aparece una página en blanco que determina la no existencia de experimentos de expresión génica con nuestra proteína. Éste es un resultado esperable, debido a que nuestro gen pertenece a un organismo procariota y, por tanto, no tiene tanta relevancia la desregulación de su expresión. Según la bibliografía, para aumentar la expresión de este gen, éste se clona en el procariota modelo y más fácilmente utilizable (E. coli) y se produce una producción heteróloga de la proteína, clonando este gen tras un promotor fuerte e inducible.
Muy completo y bien discutido
8:00 am -
7:47 am
-
2. Materiales y métodos
edited
... Es una aplicación que genera un modelo gráfico tridimensional de una proteína a partir de su f…
(view changes)...Es una aplicación que genera un modelo gráfico tridimensional de una proteína a partir de su ficha PDB. Así, permite visualizar la estructura de la proteína de referencia y marcar regiones o aminoácidos de interés para el estudio posicional de cada uno. También podemos cambiar la orientación, el tamaño, el color de regiones, etc.
Nosotros hemos encontrado la ficha PDB de lacZ de E. coli, un homólogo muy similar a nuestra proteína de estudio, ya que no aparece la ficha PDB de nuestra proteína, a través de la base de datos Mod Base. (Ficha llamada 1jZ7).
Muy bien
7:44 am -
1. Introducción
edited
... Los objetivos del trabajo propuesto consisten en el análisis bioinformática del gen lacZ de Ps…
(view changes)...Los objetivos del trabajo propuesto consisten en el análisis bioinformática del gen lacZ de Pseudoalteromonas haloplanktis, el cual codifica la proteína betagalactosidasa. Para ello, se realizará un primer estudio en bases de datos moleculares y una búsqueda de similitud con otras proteínas relacionadas. Tras esto, se llevará a cabo un análisis exhaustivo de las secuencias conservadas en nuestra proteína por medio de matrices de puntos y alineamientos múltiples entre las proteínas relacionadas, con el fin de determinar qué regiones proteicas son importantes desde el punto de vista catalítico y estructural. A continuación, una búsqueda en bases de datos de motivos y dominios proteicos verificará los resultados obtenidos anteriormente y permitirá aclarar nuestras conclusiones, permitiendo enmarcar la proteína en una/s familia/s proteica concreta. Por último, un estudio minucioso de la estructura tridimensional de la betagalactosidasa en comparación con los resultados obtenidos en el resto del trabajo proporcionará información sobre la localización de los dominios catalíticos y motivos proteicos conservados, así como su papel en la actividad catalítica.
1.2. Elección del gen
...que estásuscrito.suscrito?. En concreto,
1.3. Biología de Pseudoalteromonas haloplanktis
Pseudoalteromonas haloplanktis es una bacteria marina gram negativa pricrófila antártica, en forma de varilla curvada (0.2 to 1.5 by 1.8 to 3 µm). Pertenece al domino Bacteria, filo Proteobacteria, clase Proteobacteria gamma, orden Alteromonadales, familia Pseudoalteromonadaceae, género Pseudoalteromonas. Esta bacteria no forma esporas, no es luminiscente y se mueve gracias a un flagelo polar. Se encuentra normalmente creciendo a temperaturas de entorno a -20ºC frente a las costas de la Antártida. Es un microorganismo aerobio sin metabolismo fermentativo, quimioautótrofo. Tan sólo se encuentra secuenciado parte del genoma de esta bacteria, aunque no se encuentra disponible en ninguna base de datos. Existe una cepa llamada TAC 125 que si tiene secuenciado su genoma, el cual consiste en 2 cromosomas circulares de una longitud total de 3,5 Mb, aunque ésta no contiene el gen lacZ (El cromosoma I tiene un contenido en G+C del 40%, codificando 2940 proteínas distintas; mientras que el cromosoma II codifica 546 proteínas y posee un contenido de G+C del 39%). Las proteínas de esta bacteria esta siendo objeto de estudio debido a que actúan con alta eficiencia a baja temperatura.
...La lactosa es uno de los principales azúcares que contiene la leche humana y de otras especies. En concreto, se trata de un disacárido formado por glucosa y galactosa. Para su digestión es necesaria la presencia de la enzima lactasa en el borde las células intestinales, que separa la lactosa en sus dos componentes. La falta de esta enzima en el organismo provoca el paso directo de la lactosa sin procesar al intestino grueso, lo que provoca un desequilibrio osmótico que conlleva una entrada de agua en el intestino. Además, las bacterias colonizadoras del intestino grueso son capaces de degradar la lactosa y producir gases y ácido. Todas estas reacciones indeseadas promueven en las personas intolerantes a la lactosa una serie de síntomas como las evacuaciones líquidas y ácidas y un aumento de los gases.
La intolerancia a la lactosa es un problema raro causado por la deficiencia congénita del gen de la lactasa que afecta a los humanos, normalmente, poco después del nacimiento. En concreto, ésta es una enfermedad rara que se transmite de forma autonómica recesiva y que conlleva la imposibilidad de absorción de la lactosa por la ausencia total de la enzima lactasa. Así también, existe una intolerancia adquirida a la lactosa que aparece frecuentemente después del segundo año de vida, tras el período de lactancia del bebé, hasta el cuál el niño toleraba la lactosa sin problemas, incrementándose su incidencia hasta llegar a edad adulta. Por último, existe igualmente un tipo de enfermedad frecuente en humanos que consiste en la intolerancia transitoria a la lactosa debido a un problema infeccioso, inflamatorio o alérgico intestinal que imposibilita la absorción de lactosa por la pérdida de la enzima lactasa, aunque, una vez corregido el problema, se revierte la intolerancia.
Muy bien
7:40 am
Wednesday, September 9
-
4. Conclusiones
edited
4. CONCLUSIONES
Podemos sacar varias conclusiones del estudio realizado sobre la proteín abetagala…
4. CONCLUSIONES(view changes)
Podemos sacar varias conclusiones del estudio realizado sobre la proteín abetagalactosidasa de Pseudoalteromonas haloplanktis:
- Nuestra proteína se encuentra muy conservada en organismos procariotas y en eucariotas simples, pero se pierde a lo largo de la evolución.
- Mientras que las secuencias aminoacídicas de las proteínas parecen tener una buena conservación, ésta es muy poco significativa en secuencias nucleotídicas y siendo menor cuanto más alejados evolutivamente se encuentren los organismos. este resultado es probable que se deba a la degeneración del código genético y al uso de codones.
- Nuestra proteína posee tres dominios muy conservados: Un dominio Glyco Hydro 2 N, uno Glyco Hydro 2, otro Glyco Hydro 2 C y uno Bgal Small N.
- La conservación del sitio activo (Glu460 y Glu536) es proácticamente total en organismos procariotas y eucariotas simples, aunque la divergencia hacia otro tipo de enzimas hidrolasas no ha conservado el aminoácido nucleófilo en eucariotas complejos.
- Nuestra proteína necesita como unión dos ligandos de magnesio y uno de sodio como mínimo para poder actuar.
- El dominio Bgal Small se incorporó más tarde en la evolución a una proteína con actividad hidrolasa para diversificar las posibilidades de sustrato del organismo.
- Nuestra proteína posee dos sitios consenso muy conservados alrededor de los aminoácidos del sitio activo.
- Se comprueba estructuralmente la presencia de un centro activo en forma de bolsillo que permite la entrada y catálisis del sustrato.
- Nuestra proteína poseen pocos residuos de prolina por su impedimento de giro, muchos residuos de glicina alrededor del centro activo, que facilitan la flexibilidad de éste y alto porcentaje de aminoácidos pequeños. Además, contiene muchas laminas beta y pocas hélices alfa, que impiden el movimiento proteico. Estas modificaciones en la estructura permite flexibilizar la proteína para que pueda actuar en ambientes fríos.
- Nuestra proteína tiene estructura de barril TIM.
12:51 am -
2. Materiales y métodos
edited
2. MATERIALES Y MÉTODOS
... de datos (No sé si poner las páginas webs o los enlaces cuando les…
2. MATERIALES Y MÉTODOS(view changes)
...de datos(No sé si poner las páginas webs o los enlaces cuando les doy al nombre)
2.1.1.
2.1.1. UniProt
El nombre de esta base de datos proviene del nombre en inglés Universal Protein. Es una de las bases de datos más importantes que existen sobre fichas proteicas, creada a partir de Swiss-Prot, TrEMBL y PIR. Para acceder a cada una de las fichas rellenamos el campo “Query” con el “GeneName” o nombre de la proteína de estudio y, pinchando en el botón “Fields” seleccionamos el campo “Organism [OS]” y ponemos el nombre del organismo que queramos en el campo “Term”. En cada entrada de UniProt aparece gran cantidad de información minuciosa sobre proteínas. Esta base de datos ha sido usada durante todo el trabajo. Dentro de toda esta información contenida en las fichas se pueden destacar varios apartados importantes como “general annotation” para la búsqueda de características moleculares y funciones biológicas y biotecnológicas; “sequence annotation” para la búsqueda de información de secuencia; “Sequences” para visualizar la secuencia aminoacídica de la proteína y descargarla en formato FASTA (aparece un botón con este nombre), que permite usarla en herramientas bioinformáticas; “References” para obtener bibliografía de ampliación; y “cross-reference”, que provee de referencias cruzadas hacia otras bases de datos como GeneID, Ensembl o GenBank. Las secuencias de cada proteína a estudian han sido descargadas en formato FASTA y puestas en formato multiFASTA para facilitar su uso en los distintos programas bioinformáticas utilizados. Esta base de datos también puede usarse para obtener homólogos de nuestra proteína de estudio, utilizando la herramienta Blast, que compara las secuencias de aminoácidos en formato FASTA y muestra todos los posibles organismos con secuencias homólogas para esta proteína. También hemos podido obtener una ficha de estructura 3D de un modelo proteico, con estructura aproximada a la de lacZ para llevar a cabo el análisis de estructura proteica, así como información general sobre los dominios presentes en las proteínas.
2.1.2. GeneBank
Esta
Esta base de...de DNA.
2.1.3.
2.1.3. Pfam
Pfam
Pfam es una...del recuadro.
2.1.4.
2.1.4. InterPro y Prosite
Estas base de datos también proporcionan información sobre dominios y motivos, siendo muy completas, aunque con una interfaz más complicada desde nuestro punto de vista. Sin embargo, en el caso de Prosite, permite integrar otras muchas bases de datos. Al haber obtenido buenos resultados con la base de datos Pfam, tan sólo usamos estas dos para confirmar los resultados obtenidos, aunque Interpro nos confirma mejor los resultados obtenidos.
(Completar CATH)2.1.5. PDB
2.1.5.
El sitio PDB es una base de datos que contiene información sobre estructuras tridimensionales de proteínas y ácidos nucleicos determinadas experimentalmente. Tan sólo hemos usado esta base de datos para la búsqueda infructuosa de nuestra proteína.
2.1.6. ModBase
Esta
Esta base de...galactosa (1jz7).
2.1.7.
2.1.7. CATH
Esta
Esta base de...los resultados.Para acceder a nuestra ficha, rellenamos el campo de la secuencia con la secuencia de nuestra proteína y elegimos la estructura con un e-value menor.
2.1.8. ArrayExpress
...pulsar “Query”.
2.
2. Software bioinformáticas
2.2.1.
2.2.1. BLAST
El
El algoritmo BLAST...archivo multiFASTA.
Hemos
Hemos usado la...más estrecha.
Con
Con este programa...resultados obtenidos.
2.2.2.
2.2.2. BioEdit Sequence Alignment Editor
Es
Es un programa...texto rico.
Se
Se utiliza para...la secuencia.
Por
Por las características...extensión .aln.
2.2.3.
2.2.3. ClustalX
Es
Es una aplicación...programa TreeView.
En
En nuestro trabajo,...alineamiento múltiple.
2.2.4.
2.2.4. TreeView
Éste es un programa cliente que permite abrir los archivos .dnd para el estudio de la filogenia de la familia proteica. Nos permite visualizar y comparar los árboles filogenéticos obtenidos desde los alineamientos de las secuencias de aminoácidos y nucleótidos. Permite ver el árbol de tres formas distintas: árbol sin raíz, cladograma o filograma. Además permite enraizar el árbol y ordenar las secuencias, ya que podemos definir un grupo externo, que se encuentre más alejado evolutivamente del resto de proteínas.
2.2.5. RasMol
Es
Es una aplicación...regiones, etc.
Nosotros
Nosotros hemos encontrado...llamada 1jZ7).
12:38 am -
3. Resultados y discusión
edited
... {Dibujo39.jpg} Figura 25: Estructura tridimensional de un monómero de nuestra proteína de refe…
(view changes)...{Dibujo39.jpg} Figura 25: Estructura tridimensional de un monómero de nuestra proteína de referencia con las glicinas marcadas en amarillo y el aminoácido catalítico Glu460 de color azul.
Así, parece que los residuos de glicina, de pequeño tamaño proporcionan movilidad a las proteínas que necesitan gran flexibilidad, como es el caso de las enzimas psicrófilas.
...datos CATH. Introducimos la secuencia de la proteína de estudio y obtenenemos la siguiente ficha con un e-value más bajo, correspondiente a la estructura de nuestra proteína:
{Dibujo40.jpg}
Este resultado posibilita afirmar tajantemente que nuestra proteína pertenece a la superfamilia homóloga de las glicosidasas como predecíamos anteriormente. además, como podíamos saber por la estructura del dominio Glyco Hydro 2, posee topología de barril TIM. Pertenece a las proteínas con arquitectura de barril alfa-beta y a la clase alfa-beta. con estos resultados podemos concluir que nuestra proteína parece conservar la estructura que hemos predicho con el modelo obtenido de la base de datos de ModBase. Además, el esquema de dominios parece indicar los mismos dominios que ya habíamos predicho.
3.6. Análisis de la expresión génica de la proteína de referencia
Para este análisis usamos la base de datos ArrayExpress, que proporciona multitud de experimentos sobre la expresión de genes. Introducimos el nombre del gen lacZ en el campo “Gene” y pulsamos sobre “Query”. Aparece una página en blanco que determina la no existencia de experimentos de expresión génica con nuestra proteína. Éste es un resultado esperable, debido a que nuestro gen pertenece a un organismo procariota y, por tanto, no tiene tanta relevancia la desregulación de su expresión. Según la bibliografía, para aumentar la expresión de este gen, éste se clona en el procariota modelo y más fácilmente utilizable (E. coli) y se produce una producción heteróloga de la proteína, clonando este gen tras un promotor fuerte e inducible.
12:36 am -
Dibujo40.jpg
uploaded
12:29 am