Palabras clave
INTRODUCCIÓN
El siglo XX se caracterizó por grandes éxitos en el conocimiento de muchos componentes de la célula, la descripción de receptores, de factores de transcripción, de genes implicados en diversos procesos fundamentales (división celular, apoptosis) y patológicos (oncogenes, genes de susceptibilidad), pero todo ello de manera individualizada. El siglo XXI ha iniciado su andadura con un salto cualitativo de una enorme magnitud, que probablemente no somos capaces de vislumbrar en el momento presente. Actualmente podemos estudiar el conjunto total de los componentes de las células o de los tejidos, fundamentalmente referido a los genes y proteínas, en un tiempo muy inferior al empleado hace tan sólo unos años en conocer un único componente1-3.
¿Cuáles son las razones que han originado este salto tan importante? En primer lugar, la descripción del genoma completo de diversos organismos (desde bacterias al ratón), y principalmente del genoma humano. Ahora disponemos del listado total de los genes que definen a la especie humana y que constituye una fuente inestimable para el entendimiento de las funciones celulares, fisiológicas y patológicas. La disponibilidad del genoma y de numerosas bases de datos genómicos y de proteínas son herramientas esenciales para una nueva visión de la célula y de los seres vivos4. En segundo lugar, la difusión y accesibilidad de numerosos navegadores y programas informáticos sencillos que permiten obtener información de las bases de datos genómicas y de proteínas. Hoy día es posible rastrear un genoma completo para localizar una secuencia particular de una proteína o de un gen en pocos segundos. Estas búsquedas se integran con otros programas que, a su vez, predicen la función de las proteínas identificadas, sus interacciones con otras proteínas, etc.5. En tercer lugar, el desarrollo de los chips de ADN, que contienen miles de secuencias de cADN o de oligonucleótidos, en un porta de los utilizados en microscopia óptica (2 x 5 cm), permiten detectar la expresión de miles de genes, simultáneamente, en pocas horas. Podemos observar «el sistema completo», el conjunto total de los genes expresados6. Sin embargo, la información contenida en esos miles de datos sobrepasa nuestra capacidad de interpretarlos intuitivamente, y por este motivo se necesitan nuevas herramientas que permitan integrar tales conjuntos ingentes de datos. Consiste en entender sistemas más que componentes individuales, relacionar estos sistemas y dar un sentido biológico a tal complejidad. Finalmente, la aparición y desarrollo de la proteómica, o genómica funcional, ha comenzado a desvelar la identidad y función de las miles de proteínas codificadas por los genes, que son las verdaderas moléculas que llevan a cabo las funciones celulares7.
De la genómica a la proteómica
Si la genómica es el estudio del conjunto de los genes (genoma) de un organismo, la proteómica es el estudio del conjunto de proteínas (proteoma) que puede expresar un genoma (fig. 1). Si la expresión de miles de genes de un organismo se ha conseguido analizar con la utilización de los chips de ADN, ¿por qué es necesaria la proteómica? Primero, porque cada gen, con frecuencia, no genera una única proteína, sino varias. Por religación alternativa, lectura de los codones en diversas fases o variaciones en los codones de parada, se generan diversas proteínas8. Segundo, porque las proteínas se modifican postraduccionalmente, mediante fosforilación, glucosilación, prenilación, acetilación, sulfatación, entre otras, y existen más de 200 tipos de modificaciones descritas. Estas modificaciones afectan a la estructura, localización, función y recambio, e implican funciones de activación, regulación, respuesta al entorno, etc., y asimismo son críticas para controlar los procesos de degradación de las proteínas. Por ejemplo, la fosforilación de diversas proteínas conduce a su conjugación con la ubiquitina que producirá la degradación de la proteína por el proteasoma 26S. Por tanto, muchas proteínas están presentes bajo múltiples formas moleculares (fig. 2). Esta información, esencial, sólo se obtiene estudiando las proteínas y no los genes. Tercero, no hay una correlación directa entre los niveles de expresión de ARN (transcripción) y de expresión de proteínas9. Un ARNm de vida media corta puede generar una proteína de vida media larga, y viceversa. Cuando la proteína está presente en la célula (y puede detectarse) el ARNm ya no se detectaría. La expresión de un ARNm no informa de la actividad de la proteína que codifica ni de las posibles combinaciones o interacciones con otras proteínas que generan nuevas funciones, etc.10. Finalmente, debe considerarse que la diana del 90% de los fármacos son las proteínas11.
Fig. 1. Esquema general de las relaciones entre genómica y proteómica y su objeto de estudio. La genómica funcional pretende determinar la función de cada gen, que en su gran mayoría la realizan las proteínas, que son las verdaderas moléculas efectoras de la célula.
Fig. 2. Durante el ciclo de vida de una proteína, ésta puede presentar diversas formas moleculares que están presentes simultáneamente, y generar una gran complejidad al proteoma (8).
El proteoma es una foto de la expresión de proteínas
Cada una de nuestras células contiene el genoma completo del ser humano. Sin embargo, no todos los genes se expresan en todas las células. La diferenciación celular para generar las distintas estirpes celulares y tejidos se debe a una expresión diferencial de genes. Así, aunque todas las células expresan unos genes comunes, cuyas proteínas proporcionan funciones esenciales (catabolismo de la glucosa, síntesis de ADN, etc.), cada tipo celular expresará selectivamente aquellos que codifican las proteínas necesarias para realizar las funciones que le son específicas. El proteoma de cualquier célula, en un momento dado, representa sólo una fracción de todas las proteínas posibles que puede expresar el genoma. Esto no indica que el proteoma sea más simple que el genoma, sino todo lo contrario. Las proteínas que se expresan o que se modifican varían en función de las circunstancias, ataques del entorno, acción de fármacos, requerimientos energéticos, etc. (fig. 3). El proteoma es un conjunto dinámico de proteínas cambiantes frente a un cierto carácter estático del genoma. Existe, por tanto, un genoma, pero multitud de proteomas, y es el proteoma el que va a reflejar fielmente el estado celular en cada momento12,13.
Fig. 3. La expresión de proteínas de cada célula está influida por numerosas condiciones ambientales, tratamientos farmacológicos, etc., de forma que el proteoma es cambiante y dinámico, y refleja la situación real en cada momento.
Cuando se ha conocido el número total de genes de diversos organismos se ha constatado que la complejidad de un organismo y el número de genes que posee no es una relación simple. Puede sorprender que el genoma humano sólo posea el doble de genes que el de un gusano; sin embargo, la complejidad biológica no procede simplemente del número de genes. El número de dominios o unidades estructurales de las proteínas que pueden generar los genes humanos es superior al de organismos inferiores, lo que por combinación genera un número superior de proteínas, con una regulación más compleja y una funcionalidad múltiple. La complejidad de nuestro organismo procede probablemente de la diversidad de proteomas que podemos generar, más que del número de genes que componen nuestro genoma14.
HERRAMIENTAS DE LA PROTEÓMICA
Aunque conceptualmente la proteómica es simple, la práctica es compleja. La estrategia clásica, común en proteómica, consiste en separar y cuantificar las proteínas de una muestra (célula, tejido o fluido) por electroforesis bidimensional (2-D)15 o cromatografía multidimensional16 (también por electroforesis capilar, pero su uso está menos extendido)17, y posteriormente identificar cada una de las proteínas mediante espectrometría de masas (MS)18. La mera cuantificación no refleja el estado funcional de la proteína, ni su localización o posibles interacciones con otras moléculas, por lo que la proteómica abarca muchas otras estrategias (caracterización de las modificaciones postraduccionales por MS, análisis estructural por difracción de rayos X o resonancia magnética, localización intracelular por microscopia confocal, etc.) que completan la descripción del proteoma8,14.
Electroforesis bidimensional
La 2-D es una técnica de separación de proteínas que consiste en una sucesión de dos modalidades de electroforesis distintas realizadas sobre una misma muestra15. El tejido o células que se han de analizar se solubilizan en tampones que contienen agentes disociantes y detergentes que facilitan la separación posterior de cada proteína individual. La primera dimensión es un electroenfoque, en el que las proteínas se separan en función de su punto isoeléctrico (pI) a lo largo de un gradiente de pH (p. ej., pH 3-10), y la segunda es una electroforesis en geles de poliacrilamida en presencia de un detergente (PAGE-SDS), en la que la separación se produce en función de la masa molecular de las proteínas (fig. 4).
Fig. 4. Representación esquemática de la realización de una electroforesis bidimensional. Las proteínas de una muestra (tejido, células) se aplican en un soporte o tira de electroenfoque y se separan según el punto isoeléctrico al aplicar un campo eléctrico. Se deposita entonces la tira sobre un gel de poliacrilamida y las proteínas se separan según su tamaño molecular, en una segunda electroforesis, al aplicar un campo eléctrico perpendicular al primero. Una vez teñido, se obtiene un gel 2-D (véase figura 8 con un gel real).
Hace 25 años que se conocen estas técnicas; sin embargo, sólo muy recientemente se han conseguido soportes para el electroenfoque con gradientes de pH estables, reproducibles y disponibles comercialmente. En la actualidad existen tales soportes (son una pequeña tira de 0,5 x 18 cm) con una variedad de gradientes, extendidos (pH 3-10) o expandidos (pH 4-5, 5-6, etc.)19. Los geles bidimensionales (2-D) resultantes se tiñen con colorantes específicos de proteínas (Azul Coomassie, tinción con plata, compuestos fluorescentes, etc.), se escanean y digitalizan mediante programas de imagen (Melanie, PDQuest), y se obtiene el conjunto de las proteínas de una muestra en un gel de 20 x 20 cm. En condiciones estándar, una muestra celular que contiene 100-300 μg de proteína total, genera 1.000-2.000 manchas (proteínas) y en condiciones particulares (geles de mayores dimensiones), en laboratorios especializados, hasta 10.00020.
Las proteínas presentes en muy baja concentración o de características particulares (proteínas muy básicas o de membrana muy hidrofóbica) se detectan con dificultad. La utilización de geles expandidos o el fraccionamiento previo de las muestras (obtención de membranas o mitocondrias, citoesqueleto, etc.) para estudiar subproteomas concretos evita esos inconvenientes e incrementa considerablemente los niveles de detección.
Cromatografía líquida multidimensional
La cromatografía líquida de alta resolución (HPLC) es otra opción para la separación y cuantificación de proteínas. Se trata de una técnica analítica que separa las moléculas en función del tipo de soporte (columna cromatográfica) que se utilice (cambio iónico, fase reversa, afinidad, etc.). La HPLC en tándem, de forma análoga a la 2-D, combina dos tipos diferentes de cromatografía mediante la conexión de dos columnas (fig. 5). Habitualmente la primera columna es de cambio iónico (separación por carga) y la segunda de fase reversa (separación por hidrofobicidad)16. Aunque este sistema permitiría la separación de mezclas de proteínas, se utiliza, por su mejor resultado, en la separación de péptidos. Por este motivo, una vez solubilizada una muestra celular o un tejido, el conjunto de las proteínas se digiere con una proteasa (habitualmente tripsina), y se produce una mezcla muy compleja de péptidos (miles), que se separan en la HPLC. Actualmente estos cromatógrafos utilizan columnas capilares (75-100 μm de diámetro interno y 5-10 cm de longitud) que permiten analizar muy poca cantidad de muestra (picomoles, fentomoles o incluso menos) rápidamente. Así, por ejemplo, se consiguen identificar péptidos de proteínas presentes en muy baja concentración en la célula, que normalmente no se detectan en los geles 2-D. Además, la HPLC se puede conectar directamente a un espectrómetro de masas, lo que permite la identificación automatizada de miles de péptidos --y, por tanto, las proteínas de las que proceden--, según van eluyendo de la HPLC21.
Fig. 5. Esquema de la separación por cromatografía multidimensional del conjunto de péptidos producto de la digestión de las proteínas de una muestra (biopsia, células). SCX: columna cromatográfica 1 (separación por carga); RP: columna 2 (separación por hidrofobicidad). Los péptidos eluidos se analizan por espectrometría de masas, habitualmente por un sistema de electrospray (ESI) (véase figura 7), y se obtiene su secuencia. Con ella, los programas de búsqueda (p. ej., SEQuest) en las bases de datos identifican la proteína de la que procede el péptido.
Espectrometría de masas
Una vez separadas y cuantificadas las proteínas por 2-D o por HPLC es preciso identificarlas. Esto se lleva a cabo con la MS, que es una técnica analítica que determina con alta sensibilidad y precisión las masas moleculares de compuestos químicos o biológicos. A partir de la masa pueden deducirse datos estructurales e identificar los compuestos18. En MS se requiere la conversión de los compuestos (en nuestro caso, proteínas y péptidos) en iones en fase gaseosa, utilizando diversos procedimientos. Los iones se separan en función de la relación de su masa (m) y su carga eléctrica (z) (m/z), utilizando un analizador de masas, y son captados con detectores de una gran sensibilidad18.
En proteómica se utilizan fundamentalmente dos tipos de espectrómetros de masas. En el llamado MALDI-TOF (MALDI, matrix assisted laser desortion ionization- time of flight)22 (fig. 6) la ionización se logra combinando la muestra (conjunto de péptidos) con compuestos orgánicos (denominado matriz), que cristalizan y que al someterse a un pulso (nanosegundos) de láser vaporizan los péptidos. Éstos se aceleran en un campo eléctrico (20-25 kV) y se envían a un tubo de vuelo (3 m), en cuyo extremo se sitúa el detector. Para un voltaje de aceleración dado (20-25 kV), el tiempo de vuelo (TOF), del orden de microsegundos, empleado en llegar al detector es proporcional a m/z. Así, las moléculas pequeñas vuelan más rápido que las mayores y se detectan en orden creciente de sus masas. El conjunto de las masas de los péptidos procedentes de una proteína dada proporciona una «huella peptídica» (fingerprinting) que permite compararla con las masas teóricas de los péptidos que se producirían al digerir las proteínas presentes en las bases de datos. Esta comparación permite identificar la proteína23-25.
Fig. 6. Análisis por espectrometría de masas con MALDI-TOF del conjunto de péptidos generados por digestión con tripsina de una proteína. Los péptidos se vaporizan con un pulso de láser (ampliado en la parte inferior) y se aceleran con alto voltaje (HV) hacia el tubo de vuelo. El ordenador recoge los datos del detector y presenta el resultado o espectro de masas, en el que las masas (en realidad m/z) de los péptidos y su intensidad se muestran ordenados de menor a mayor. Cada proteína genera un espectro característico o «huella peptídica» que permite identificar la proteína en las bases de datos.
El segundo tipo de espectrómetro vaporiza la muestra (péptidos, proteínas) directamente de la fase líquida en la que está en disolución mediante un «electrospray» (ESI, electrospray ionization) o nebulizador26 (fig. 7), de modo que se dispersa la muestra en microgotas que contienen los péptidos ionizados. Es un mecanismo similar al de los nebulizadores utilizados en perfumería, siendo un campo eléctrico la fuerza dispersante. Además de determinar la masa de los péptidos, en estos aparatos (trampa iónica, Q-TOF) puede seleccionarse un péptido de una cierta masa y romperlo en una cámara de colisión en presencia de un gas. Los fragmentos resultantes (o iones «hijos») se envían al detector, y se obtienen sus masas, de las que puede adquirirse la secuencia del péptido. A partir de la secuencia de uno o más péptidos, la búsqueda e identificación de la proteína en las bases de datos es unívoca y con una fiabilidad muy superior a la que proporciona la «huella peptídica» obtenida con el MALDI-TOF27.
Fig. 7. Esquema de un espectrómetro de masas (triple cuadrúpolo) con un sistema de electrospray (ESI) para vaporizar la muestra. El disolvente de las microgotas que contienen los péptidos se elimina con una cortina de N2 y los péptidos se dirigen al analizador de masas mediante campos eléctricos. En la cámara de colisión pueden fragmentarse los péptidos y obtenerse el espectro de masas de los fragmentos, lo que permite deducir la secuencia del péptido.
PROTEÓMICA Y ENFERMEDAD CARDIOVASCULAR
Las diversas enfermedades cardiovasculares pueden estar reflejadas, colectiva o individualmente, en los proteomas del músculo cardíaco y en los de los diversos componentes del sistema cardiovascular, incluso las células musculares lisas, endoteliales y células circulantes28-32.
Por ejemplo, los mecanismos moleculares de la disfunción ventricular son desconocidos, pero es lógico pensar que existan alteraciones significativas en la expresión de genes y proteínas del miocardio que caractericen este proceso y condicionen su desarrollo y desenlace28. Un estudio detallado de las proteínas y genes responsables puede establecer las bases moleculares de la disfunción ventricular, y podrían proporcionar nuevos marcadores diagnósticos y nuevas estrategias terapéuticas. En situaciones patológicas crónicas la expresión anormal de proteínas se refleja en concentraciones alteradas de éstas. Sin embargo, en condiciones agudas, donde la respuesta rápida no permite la síntesis de proteínas, se refleja en modificaciones postraduccionales de proteínas ya existentes. La proteómica estudia estos cambios, que pueden identificarse mediante diversas estrategias experimentales. Los cambios en el conjunto de las proteínas expresadas (perfil proteico)33 se detectan comparando las proteínas presentes en una muestra control frente a la patológica, e identificando y cuantificando las proteínas diferencialmente expresadas. En algunos casos no es necesaria la identificación de las proteínas. Por ejemplo, en estudios preclínicos, cuando se desea conocer el efecto de un conjunto de fármacos, es suficiente con constatar si el perfil de expresión proteico varía de manera similar con cada uno de ellos. Esto permite analizar de forma rápida las diferencias entre diversos tratamientos. Las modificaciones postraduccionales deben estudiarse individualmente sobre cada proteína, y de nuevo la MS supone un gran avance para la identificación y localización de estas modificaciones25.
Bases de datos de geles bidimensionales y proteínas del corazón
Una herramienta imprescindible en el estudio del proteoma cardíaco es establecer una base de datos que contenga el conjunto de las proteínas del miocardio. Un primer paso ha sido la elaboración de bases de datos de los geles 2-D con el inventario de las manchas (proteínas) que han logrado separarse. Algunas de ellas se han identificado posteriormente por MS34-43. En las imágenes de los geles 2-D puede seleccionarse la proteína de interés («clicando» con el ratón del ordenador) y obtener la información disponible (nombre, número de acceso en las bases de datos, masa molecular, pI, secuencia de aminoácidos, etc.).
Los primeros geles 2-D, con baja resolución, de proteínas de miocitos, al comienzo de la década de los noventa conseguían separar 200-250 manchas44,45. En 1994 se asignaron 1.500 manchas, según su posición en los geles 2-D, usando el pI y su masa molecular a modo de coordenadas39,40. Sin embargo, en 1996 se logró separar más de 3.300 manchas con geles 2-D de alta resolución (24 x 30 cm)41. Actualmente, en condiciones estándar, se separan 1.500-1.800 manchas (fig. 8) y más del doble con geles expandidos de una unidad de pH (pH 5-6 a lo largo de 24 cm) en la primera dimensión. En la tabla 1 se recogen las principales bases de datos de geles 2-D de muestras cardíacas y su dirección en Internet. Las bases de datos son federadas, esto es, deben cumplir una serie de requisitos, por ejemplo, permitir el acceso remoto, estar conectadas mediante enlaces, que exista un índice general con entradas únicas, ofrecer accesibilidad a cada proteína a partir de las imágenes de geles 2-D, etc.37. Del total de manchas (3.300), sólo se ha conseguido identificar hasta la fecha, en el conjunto de las especies estudiadas, un 10%45-60. Esto da una idea de la dificultad en la identificación de proteínas, máxime en aquellas especies animales, como la rata y el perro, en las que el genoma es escasamente conocido y existen multitud de proteínas muy parecidas (parálogas) que son muy difíciles de distinguir entre sí. En la tabla 2 se recoge una gran parte de las proteínas que se han identificado en tejido cardíaco, sobre todo en la zona ventricular. En este proceso de identificación de proteínas, la utilización de anticuerpos (immunoblotting) ha sido de gran ayuda38,41,50,53.
Fig. 8. Geles bidimensionales de corazón de rata normotensa e hipertensa en la que se observan las proteínas separadas y teñidas. En la figura se presenta sólo una fracción del gel. En la parte inferior se observa una ampliación, comparada, de una región en la que 2 proteínas se expresan diferencialmente. La figura procede del laboratorio de los autores, que vienen desarrollando un proyecto de proteómica cardiovascular desde hace un año. kD: kilodaltons; PM: peso molecular.
Perfil proteico de la miocardiopatía dilatada
Las miocardiopatías han sido un objetivo preferente en los estudios proteómicos del área cardiovascular, tanto en tejidos humanos como bovino y canino43,45,51,54,61-63. La miocardiopatía dilatada (MCD) es la causa más frecuente de trasplante cardíaco, y se conoce que cada año se presenta en 5-8 de cada 100.000 personas64. Sin embargo, su etiología es desconocida, aunque se ha asociado a diversos factores, particularmente genéticos31,32,65-67. Los geles 2-D de biopsias humanas en esta enfermedad revelan un menor nivel de expresión en 88 proteínas en comparación con el perfil de expresión de muestras con cardiopatía isquémica48,49. Entre ellas destaca la desmina, ATP sintasa, creatincinasa, la cadena ligera 2 de la miosina y varios miembros de la familia de heat shock proteins (HSP-60 y 70)50-52.
Entre los modelos animales, la MCD canina y, especialmente la bovina, presentan grandes similitudes con la humana. De hecho, los estudios proteómicos en músculo cardíaco de las tres especies son muy similares, caracterizados por una menor expresión de un conjunto de proteínas. En los modelos canino y bovino se observan alteraciones en diversas proteínas mitocondriales implicadas en la producción de energía (HSP-70, piruvato deshidrogenasa, triosafosfato isomerasa, β-enolasa, isocitrato deshidrogenasa, etc.) y proteínas estructurales, como la desmina y la actina53,54,68.
En el modelo bovino de MCD hereditaria destaca un incremento notable en la ubiquitina hidrolasa C-terminal63, situación que ha sido también verificada en miocitos humanos de corazones con esta enfermedad. La degradación de proteínas por el sistema ubiquitina-proteasoma ejerce un papel destos procesos celulares, incluyendo la regulación del ciclo celular, transcripción, procesamiento de antígeno o remodelado muscular. Todos los corazones humanos con MCD estudiados presentan un nivel de expresión incrementado de diversas enzimas (E1, E2) de este sistema. La ubiquitina C-terminal hidrolasa quintuplica su nivel en corazones MCD respecto a los controles sanos, hecho que ha sido confirmado histológicamente con anticuerpos específicos. Esta hiperexpresión conduce a un incremento en la ubiquitinación de diversas proteínas cardíacas que ven entonces reducida su expresión. Se considera que este incremento en la proteólisis de las proteínas debe ser un factor crítico que ocasiona una pérdida de la actividad celular normal del miocito en el corazón MCD y, finalmente, fallo cardíaco. De las 26 proteínas anormalmente ubiquitinadas identificadas, dieciséis se habían identificado previamente como proteínas con niveles alterados en la MCD humana. De hecho, las dieciséis presentan una expresión reducida. Con estos datos se ha planteado la hipótesis de que una conjugación alterada o inapropiada de la ubiquitina con enzimas reguladoras clave, durante la respuesta hipertrófica, puede alterar los procesos homeostáticos y constituir un mecanismo que contribuya en la transición de una hipertrofia compensada a un estado de fallo cardíaco descompensado. Este conjunto de datos ha hecho considerar a la ruta de la ubiquitina-proteasoma como una nueva diana de intervención terapéutica en la enfermedad cardíaca69.
Cuando se compararon las proteínas expresadas en el ventrículo izquierdo de perros a los que se les había inducido fallo cardíaco mediante la implantación de un marcapasos, con animales control, se observaron 62 proteínas, de un total de setecientas, con niveles incrementados. De éstas, veintitrés pudieron identificarse. Este estudio establece que el fallo cardíaco se asocia con cambios en tres sistemas celulares: a) proteínas mitocondriales cuya expresión está muy disminuida; b) enzimas glucolíticas que incrementan su expresión (quizá para compensar la pérdida de síntesis de ATP al estar afectadas las mitocondrias), y c) alteraciones en las proteínas del citoesqueleto60.
Análisis de subproteomas cardíacos
Este tipo de estrategia experimental se centra en el estudio de sólo una parte del proteoma total, de un subproteoma concreto. Suele utilizarse cuando un mecanismo molecular es parcialmente conocido y se han identificado algunas de las proteínas participantes, pero no todas. Uno de los ejemplos más notables fue el uso de anticuerpos monoclonales frente a la proteincinasa C (PKC), para coinmunoprecipitar todas aquellas proteínas implicadas en las cascadas de señalización de la PKC y analizarlas por 2-D e identificarlas por MS. De manera que pudo identificarse 36 proteínas que se asocian físicamente con la PKCε durante el «precondicionamiento» miocárdico70. Se habían acumulado datos que indicaban que la activación de la PKCε era un hecho esencial en el desarrollo del efecto cardioprotector del precondicionamiento isquémico, pero se desconocía su mecanismo molecular. El análisis proteómico ha puesto de manifiesto la participación de proteínas estructurales y del citoesqueleto (α-actina, prohibitina, villina, desmina, lap-2, etc.), proteínas de señalización (SRC tirosincinasa, LCK tirosincinasa, JNK1, JNK2, ERK1, ERK2, etc.) y proteínas de respuesta al estrés (iNOS, eNOS, COX-2, HSP-70, HSP-27, cristalin αβ, etc.) en este fenómeno. Además, se comprobó que la cardioprotección mediada por la PKCε estaba asociada no sólo con unas concentraciones alteradas de las proteínas antes citadas, sino también con modificaciones postraduccionales en 23 de las 36 proteínas estudiadas, aunque no fueron estudiadas70. Sin embargo, un estudio posterior ha podido demostrar la presencia de fosforilaciones en la cadena ligera 1 de la miosina en miocitos ventriculares de conejo, donde el precondicionamiento se indujo farmacológicamente con adenosina71. Los estudios con la PKCε han llevado a formular la hipótesis del «módulo de señalización» como medio de explicar, a nivel molecular, la cardioprotección mediada por esta isoforma de la PKC72.
Una estrategia experimental similar se ha utilizado con células musculares lisas de conejo para identificar 15 proteínas que se unen a la fosfatasa 1, una enzima que defosforila residuos de Ser y Thr en proteínas activadas por fosforilación. Estas proteínas controlan procesos celulares clave, como el metabolismo y contracción muscular o el ciclo celular y la expresión génica73. Igualmente, el conjunto de las proteínas del citoplasma o las que forman los miofilamentos son subproteomas que han empezado a estudiarse, en modelos animales (cerdo), por HPLC. En los corazones en los que se les indujo fallo cardíaco, por ligación de arterias coronarias, 2 proteínas modifican notablemente su expresión, la troponina T y la cadena pesada de la miosina74. Muy recientemente ha comenzado a estudiarse el proteoma mitocondrial de ratones normales y de ratones knockout para algunas proteínas clave, como la superóxido dismutasa mitocondrial. Los ratones deficientes en esta proteína presentan un fenotipo característico de la MCD, con un conjunto adicional de proteínas alteradas que están en proceso de identificación75. Se han llevado a cabo estudios similares que analizan las proteínas mitocondriales de ratones transgénicos deficientes en la enzima creatincinasa76 y las proteínas de la membrana nuclear en la MCD humana77.
PROBLEMAS ACTUALES Y PERSPECTIVAS FUTURAS
El objetivo de la proteómica cardiovascular es conocer las proteínas del miocito y del resto de los tipos celulares de este sistema e identificar su función, para así poder entender su papel en los procesos patológicos. En el momento actual se está acumulando un gran número de datos (tabla 2), con nuevas proteínas no implicadas previamente en los procesos patológicos, aunque todavía no existe una integración fisiopatológica de tales datos. Es más, no está estudiado el proteoma de las células involucradas en una enfermedad tan altamente prevalente como es la aterosclerosis78. El conocimiento de las proteínas de las células que integran la placa aterosclerótica y de las células circulantes, como los monocitos y las plaquetas, que interaccionan con ellas, podría proporcionar una nueva visión molecular de este proceso. De este modo, es probable que varias de estas proteínas pudieran constituirse en nuevas dianas terapéuticas en un futuro inmediato. Es más, las variaciones del patrón proteico en suero o en células circulantes en esta enfermedad tendrían probablemente un valor pronóstico mucho mayor que el análisis aislado de una sola proteína, como es el caso de la proteína C reactiva79. La reciente aparición de la quimiogenómica, que integra la bioinformática y la química combinatorial, se perfila como una potente metodología para generar nuevos fármacos a partir de los datos proteómicos y genómicos80.
A pesar de los grandes avances técnicos realizados en los últimos años, persiste una serie de problemas. Probablemente, el fundamental es la identificación de proteínas, que sigue siendo un proceso lento. La aparición de nuevos espectrómetros, altamente automatizados, como los denominados TOF-TOF, que proporcionan masas con gran exactitud y generan secuencias de los péptidos, así como la introducción de nuevos buscadores de Internet, basados en algoritmos complejos, pueden acelerar y mejorar estos procesos en un futuro próximo. Las bases de datos de proteínas son cada vez más completas y con menos errores, lo que redundará en una mayor fiabilidad en las identificaciones. La cuantificación de proteínas en los geles 2-D es otro aspecto que necesita mejorarse. Se han descrito nuevas sondas fluorescentes, para el marcaje de las proteínas en muestras control (en verde) y patológicas (en rojo), que facilitan la comparación de los niveles de expresión, al aplicar ambas muestras en un único gel y detectar las proteínas a cada longitud de onda (método DIGE)81. Han aparecido métodos similares, como el ICAT82,83, aplicables cuando la separación de proteínas se lleva a cabo por HPLC. El estudio de los distintos subproteomas va a proporcionar una enorme expansión del número de proteínas conocidas actuales y de conexiones e interacciones en multitud de sistemas intracelulares, de señalización, regulación, localización, etc. Por tanto, a pesar de los problemas, la proteómica posee un enorme potencial de futuro84.
Uno de los elementos que puede aportar mayor luz próximamente en la enfermedad cardiovascular es la comparación de los datos genómicos a partir de los chips de ADN85-96, con los proteómicos, analizando la correlación o no, entre los genes, las proteínas expresadas y sus modificaciones postraduccionales. Los primeros datos comparativos han comenzado a conocerse97, pero su descripción queda fuera de los límites de este trabajo.
GLOSARIO
Proteoma: es un término que deriva de unir proteína y genoma y hace referencia al conjunto de proteínas expresadas (sintetizadas y que están presentes) por el genoma de una célula (o tejido, plasma, líquido fisiológico, etc.) en un momento dado, en unas condiciones concretas. Debido a que las proteínas son las moléculas que realizan la mayoría de las funciones celulares, el proteoma refleja, a nivel molecular, la situación real (normal o patológica) de la célula. Conocer un proteoma implica establecer la identidad de las proteínas que lo constituyen, sus modificaciones postraduccionales, sus interacciones, localización, actividad, estructura tridimensional, entre otras. La proteómica tiene como finalidad el estudio de los diversos proteomas. Existen numerosas iniciativas internacionales para el estudio de los proteomas humanos y animales.
Proteasoma/ubiquitina: las proteínas, en las células, son degradadas y reemplazadas por nuevas proteínas (por síntesis). La degradación de proteínas en el citoplasma se lleva a cabo por un complejo multimolecular de diversas enzimas, llamado proteasoma. Está compuesto por 28 subunidades, organizadas en 4 grupos de siete, de forma que dejan una cavidad central entre ellos, en la que están los centros catalíticos de las enzimas que van a degradar las proteínas. Éstas se introducen en la cavidad central y se fragmentan (proteólisis) en pequeños péptidos. La ubiquitina es una pequeña proteína esencial en el proceso de degradación. Se une a las proteínas que se han de destruir formando una cadena, o poliubiquitina, que es la señal que reconoce el proteasoma para degradar la proteína.
Las alteraciones de esta ruta proteolítica ejercen un papel central en diversas enfermedades, especialmente en las neurodegenerativas. En estas situaciones, agregados ricos en ubiquitina (cuerpos de inclusión) se acumulan en las células, que mueren por apoptosis. Se han encontrado agregados similares en miocardiopatías hereditarias.
Transcripción/codones: cada cadena de la doble hélice del ADN está formada por unidades o nucleótidos. En una región dada del ADN (en el núcleo celular), sólo una de las hebras codifica una proteína. El proceso por el cual la región codificante se copia, mediante enzimas, a ARN mensajero (ARNm, que se desplaza al citoplasma) se denomina transcripción. Cada tres nucleótidos (triplete), del ADN o del ARNm, es un codón que codifica para un aminoácido. Qué aminoácido corresponde a cada codón constituye el código genético. Las proteínas se sintetizan uniendo los aminoácidos que son codificados por cada triplete o codón (proceso de traducción). De esta forma, la secuencia de codones produce la secuencia de aminoácidos. La estructura (y función) de cada proteína depende de su secuencia.
Modificaciones postraduccionales: una vez sintetizada una proteína como cadena de aminoácidos, sufre una serie de modificaciones posteriores que consisten fundamentalmente en la unión de diversos tipos de moléculas a alguno de sus aminoácidos: adición de azúcares o glucosilación, de lípidos (palmitoilación, prenilación, etc.), de grupos fosfato o fosforilación, entre otras. Estas modificaciones condicionan la localización intracelular, la activación o inactivación, las interacciones con otras moléculas, la vida media, entre otras, y constituyen un elemento esencial en la función de las proteínas. Tras las modificaciones, no puede deducirse a partir del genoma cómo es una proteína en su forma final, sino que debe estudiarse directamente sobre la propia proteína.
Ratones knockout: la función de los genes se ha estudiado tradicionalmente observando los efectos de mutaciones espontáneas en un organismo, y más recientemente analizando los efectos de mutaciones inducidas en células en cultivo. Sin embargo, uno de los mejores sistemas para conocer las funciones de un gen particular es generar un ratón «mutante», que no exprese el gen que se desea estudiar. Los ratones knockout tienen el gen de interés específicamente modificado (y no se expresa la proteína correspondiente) y se producen mediante diversas técnicas genéticas. La más habitual es inactivar en células madre embrionarias (in vitro) el gen escogido, mediante recombinación homóloga, y posteriormente estas células se introducen en blastocitos de ratón, los cuales se implantan en ratones hembra. En una proporción de los ratones producidos en la descendencia está presente el gen inactivado.
Correspondencia: Dr. F. Vivanco.
Servicio de Inmunología. Fundación Jiménez Díaz.
Avda. Reyes Católicos, 2. 28040 Madrid. España.
Correo electrónico: fvivanco@fjd.es