La proteína de la cápside principal P74-26 utiliza características arquitectónicas únicas -lastos, anillos y aletas- para mejorar la estabilidad de la cápside. Observamos un aumento de las interacciones hidrofóbicas en las interfaces subunidad-subunidad dentro de la cápside. Se estima que las interacciones hidrofóbicas son >2 veces mayores para P74-26 que para otros homólogos mesófilos (Tablas Suplementarias 3 y 4). Esta observación puede explicar en parte la mayor termoestabilidad de la cápside de P74-26, ya que el efecto hidrofóbico aumenta su fuerza a altas temperaturas32. Por el contrario, no observamos ninguna alteración significativa en el número de enlaces de hidrógeno o puentes salinos (Tablas Suplementarias 3 y 4), otras interacciones que se ha visto que confieren termoestabilidad a algunas proteínas globulares33,34,35,36.
No nos sorprendió especialmente encontrar un aumento de las interacciones hidrofóbicas en la cápside de P74-26. Numerosos estudios de proteínas globulares termófilas muestran un aumento de las fuerzas hidrofóbicas como un importante contribuyente a la estabilidad térmica33,37,38,39,40. Sin embargo, hay dos cosas que hacen de la cápside del P74-26 un sistema modelo único: (1) la alta presión interna del ADN fuertemente empaquetado induce una tensión mecánica en la cápside7,8,27 y (2) se trata de una estructura de autoensamblaje en la que la arquitectura y la topología de las intersubunidades desempeñan un papel importante en la estabilidad general. Podemos derivar estos principios comparando la estructura de P74-26 con las de numerosos homólogos mesófilos.
Encontramos que la cápside de P74-26 está estabilizada por varios bucles y extensiones que forman enlaces topológicos entre subunidades. El único lazo E se une al lazo G y al dominio P de una MCP vecina, que actúan como un poste de enganche para atar topológicamente el lazo. Además, los brazos N y C, junto con el brazo Dec, anillan completamente las hebras β del bucle E, otro elemento arquitectónico exclusivo de P74-26 (Fig. 5e). Por lo tanto, el bucle E está anillado hacia la base y se enlaza hacia la punta.
Un segundo lazo está formado por el brazo N, que forma interacciones tanto intracapsoméricas como intercapsoméricas. El brazo N se une al bucle E de una MCP vecina dentro de un capsómero a través de la hebra del brazo superior, la hélice del antebrazo y la región de la mano (Fig. 5a, c). Además, el codo, el antebrazo y la mano estabilizan las interacciones capsómero-capsómero mediante la unión con DecP74-26 y una subunidad MCP que se encuentra a través de los ejes doble/cuasi doble (Fig. 6a, b). Aunque el brazo N no es técnicamente un bucle cerrado, P74-26 cierra efectivamente el bucle utilizando el único bucle S para fijar la posición de las regiones del antebrazo y la mano (Fig. 6c). No encontramos una arquitectura de lazo del brazo N similar en los Caudovirus mesófilos31,41,42,43,44,45,46, lo que sugiere que esta arquitectura es importante para mejorar la estabilidad de la cápside.
Aunque los lazos no se encuentran en otros Caudovirus, los herpesvirus lejanamente relacionados contienen una arquitectura de lazo análoga en el brazo N del pliegue HK9747,48,49. Al igual que el brazo N del P74-26, los lazos del brazo N de los herpesvirus no son verdaderos bucles cerrados. A pesar de esta aparente similitud, los lassos de los herpesvirus funcionan de forma diferente. Estabilizan exclusivamente las interacciones intercapsoméricas, mientras que el lazo del brazo N del P74-26 estabiliza tanto las interacciones intracapsoméricas como las intercapsoméricas. Además, los pentones de las cápsides de los herpesvirus no presentan interacciones de lazo y las interacciones son variables dentro de las subunidades de los hexones, mientras que P74-26 tiene interacciones de lazo casi idénticas tanto en los pentones como en los hexones. Estas observaciones indican que la arquitectura del lazo probablemente evolucionó de forma independiente y destaca la flexibilidad de los mecanismos de estabilización topológica. Nuestra hipótesis es que la arquitectura de brazos extensibles facilita la evolución de interacciones más fuertes dentro de los sistemas de autoensamblaje, como las cápsides. Estos bucles abiertos pueden mejorarse fácilmente mediante la extensión en serie de un solo residuo. Tal vez esta facilidad de evolución es la razón por la que se encuentran lassos de brazo extendido tanto en el P74-26 como en los herpesvirus. Estos lazos extendidos son similares a las extensiones N y C-terminales que median el ensamblaje en otros virus (por ejemplo, las extensiones C-terminales en las proteínas de la cápside del SV4050). Anticipamos que estos tipos de lassos extendidos pueden ser útiles para la ingeniería de cápsides más estables y otras partículas autoensamblables.
Otra ventaja de la arquitectura del lazo es que puede adoptar una conformación menos extendida. El MCP P74-26 tiene dos lazos en cada extremo del pliegue HK97, ambos presumiblemente presentes en la procápside mucho más pequeña. Gracias a estas estructuras de lassos, P74-26 puede conservar una gran estabilidad, al tiempo que proporciona flexibilidad conformacional para expandirse durante la maduración. Nuestra hipótesis es que los lazos están menos extendidos en la procápside; al expandirse la cápside, los lazos alcanzan su máxima extensión, donde se bloquean. La extensión completa observada en la cápside madura proporcionaría integridad tensional, como discutimos a continuación.
P74-26 utiliza solapas entrelazadas para estabilizar topológicamente los contactos intercapsomeros. El bucle T estabiliza las interacciones entre capsómeros insertándose en una ranura del dominio P de una subunidad MCP en un capsómero vecino. Estas interacciones T-loop se encuentran anillando los ejes triple/cuasi-triple a lo largo de la cara interior de la cápside (Fig. 7b; Fig. Suplementaria 7b). Del mismo modo, las interacciones inter-capsoméricas dobles/cuasi-dobles se estabilizan en la cara exterior de la cápside por la disposición intercalada de los brazos N (Fig. 7c; Fig. suplementaria 7a). Estas estructuras superpuestas se asemejan a la disposición intercalada de las solapas en la parte superior de una caja móvil. De este modo, las caras exterior e interior de la cápside se estabilizan mediante dos interacciones separadas de solapas intercaladas. Proponemos que las disposiciones de caja móvil que se observan en los ejes de simetría y cuasi-simetría refuerzan en gran medida la cápside contra la presión interna porque son topológicamente difíciles de interrumpir. Sin embargo, estas disposiciones son también presumiblemente difíciles de ensamblar, lo que plantea la importante cuestión de cómo se ensambla la cápside P74-26 con una arquitectura intercalada.
La proteína de decoración P74-26 adopta igualmente una disposición estructural única, contribuyendo sustancialmente a la termoestabilidad de la cápside. Las proteínas de decoración aumentan la estabilidad de la cápside28,29,51, aunque se han postulado otras funciones52. Los ejes triple/cuasi-triple son estabilizados por el trímero DecP74-26. En comparación con los Caudovirus mesófilos, el trímero DecP74-26 interactúa con más subunidades a través de un área de interacción mucho mayor (Fig. 8a). El área de interacción total por subunidad de DecP74-26 es bastante notable: ~4100;Å2 para una proteína de 146 residuos. Nuestro estudio anterior demostró que DecP74-26 es sustancialmente más estable que sus homólogos mesófilos, y esta estabilización se debe principalmente a la formación de un trímero extraordinariamente apretado23. Sin embargo, las interacciones de trimerización sólo representan una pequeña fracción del área total de interacción de DecP74-26 (~18% del área total de interacción por subunidad de DecP74-26). Esto sugiere que la interacción de DecP74-26 con la cápside contribuye a una cantidad sustancial de estabilidad.
Las interacciones entre los trímeros de DecP74-26 forman una jaula que mantiene unida la cápside (Fig. 8b). Esta disposición es exclusiva de P74-26. Por ejemplo, los fagos lambda y TW1 utilizan un pliegue de la proteína de decoración muy similar23, pero la interacción de su brazo Dec con otras proteínas de la cápside es mucho más limitada29,44. Además, la proteína de decoración no relacionada del fago L no se conecta con los trímeros vecinos y, de hecho, falta en los ejes de los cuasi-trímeros52. El fago T4 está decorado con la proteína Soc que interactúa con las subunidades Soc vecinas en los ejes triple y cuasi-triple; sin embargo, Soc está presente en una ocupación relativamente baja (~50%), por lo que la jaula está incompleta41. Dado que las proteínas de decoración suelen estar ausentes en la procápside29, esperamos que la jaula de DecP74-26 se ensamble de forma cooperativa tras la expansión de la cápside para estabilizarla. Futuros experimentos interrogarán el papel de la cooperatividad en el ensamblaje y la estabilidad.
Las mejoras arquitectónicas en P74-26 MCP y Dec proporcionan estabilización contra la alta presión interna. ¿Cómo actúan las fuerzas de la presión interna sobre la cápside y cómo resiste la arquitectura de la cápside estas tensiones? Si asumimos que la presión del ADN encapsulado se distribuye uniformemente alrededor de la cápside isométrica, entonces todos los puntos de la cápside experimentan un vector de fuerza que es perpendicular a la superficie de la cápside. Por analogía, la cápside experimenta fuerzas similares a las de un globo. Así, la presión interna provoca tensiones laterales en las interacciones de la cápside. Mientras que la alta presión interna exhibida por el fago desafía la estabilidad de la cápside, puede permitir mecanismos de estabilidad que dependen de la tensegridad. Es posible que la presión interna pueda aprovecharse para producir una partícula estabilizada por la tensión de las subunidades individuales. En apoyo de esto, las cápsides de picornavirus, que se enfrentan a una presión interna considerablemente menor, pueden estabilizarse mediante pequeñas modificaciones en la cápside53.
La arquitectura de la cápside de P74-26 está construida para soportar la tensión lateral mediante la integridad tensional. La integridad tensional, o tensegridad, es un mecanismo generalizado para la estabilidad arquitectónica que implica regiones estructuradas que se mantienen unidas por una red de elementos flexibles que están bajo tensión continua54. En la cápside P74-26, los dominios A y P son las regiones estructuradas, y los lazos y brazos extendidos son los elementos flexibles que transmiten la tensión. Por ejemplo, el lazo E se tensará contra el poste de enganche formado por el lazo G y el dominio P del vecino. Del mismo modo, el lazo N forma un lazo cuyo extremo está sujeto por el lazo S, que se encaja en la ranura entre el antebrazo y la mano (Fig. 6c). Por lo tanto, predecimos que el lazo S mostrará las características de un enlace de captura, un enlace no covalente que se hace más fuerte bajo tensión55. Además, la cápside de P74-26 contiene varias solapas que se intercalan entre sí. Estas interacciones resistirían topológicamente las tensiones laterales y longitudinales de la presión interna. En conjunto, estos elementos de lazo y solapa utilizan la tensión para resistir el fallo estructural de la cápside. El mecanismo de tensegridad observado aquí es simplemente un ejemplo más elaborado de la tensegridad de la cápside sugerida por Caspar hace muchos años56.
Las interacciones del lazo, la solapa y el brazo se colocan de tal manera que la presión interna distribuye la tensión a través de múltiples enlaces. Por ejemplo, la hoja β del bucle E experimenta fuerzas a lo largo del eje de la hoja. Así, todos los enlaces que mantienen unida la lámina están bajo tensión, en lugar de la geometría ortogonal en la que la tensión está sólo en los enlaces del extremo de la lámina. El fallo de la cápside requeriría la ruptura simultánea de muchos enlaces (una geometría de cizallamiento), en lugar de una geometría de desprendimiento en la que los enlaces se rompen de uno en uno57. Los estudios pioneros de una sola molécula han demostrado que una geometría de cizallamiento requiere fuerzas mucho más elevadas para romperla que cuando las fuerzas actúan en una geometría de descifrado58,59,60. Así, la cápside de P74-26 está construida de tal manera que las fuerzas laterales actúan en una geometría de cizallamiento, lo que resulta en una alta tensegridad.
Además de la arquitectura estabilizadora única de la cápside, P74-26 también adopta un mecanismo no canónico para alterar la capacidad de la cápside. La cápside de P74-26 es más grande que en la mayoría de los Caudovirus, lo que se correlaciona con su genoma anormalmente grande. La mayoría de los Caudovirus T = 7 tienen tamaños de genoma entre 30 y 50 kb (Tabla Suplementaria 2), mientras que el genoma del fago P74-26 es casi el doble de largo, con 83 kb24. Basándonos en el tamaño del genoma, habíamos predicho que la cápside sería T = 12 (tamaño medio del genoma ~80 kb61), aunque T = 9 o T = 13 habrían sido posibles (tamaño medio del genoma ~70 o ~120 kb, respectivamente). La cápside de P74-26 alcanza este mayor tamaño aumentando significativamente el tamaño del capsómero en lugar de cambiar la complejidad icosaédrica. El capsómero es más grande porque el MCP de P74-26 cubre más superficie de lo normal, a pesar de tener una longitud típica para el MCP. En consecuencia, el capsómero es ligeramente más delgado de lo normal (Fig. 4b). Así, el número de residuos en el MCP no predice el área total cubierta, y el tamaño del genoma no predice el número de triangulación.
Recientemente, Bayfield et al.62 determinaron la estructura de un fago termófilo estrechamente relacionado T = 7, que de manera similar utiliza capsómeros agrandados para aumentar la capacidad de la cápside. Hasta donde sabemos, este es un mecanismo no canónico para aumentar la capacidad de la cápside. Hay dos mecanismos clásicos para aumentar la capacidad de la cápside: (1) el aumento del número de triangulación y (2) la conversión de una cabeza isométrica en prolata. En el primer caso, se añaden hexones a lo largo de todas las caras de la cápside, mientras que en el segundo, se añaden hexones a lo largo de diez de las caras icosaédricas de forma que la cápside se alarga en una dimensión (Fig. 9). En ambos casos, los capsómeros mantienen el mismo tamaño. Aquí, hemos identificado un tercer mecanismo para la evolución de una cápside más grande: aumentar el tamaño del capsómero.
Estos tres mecanismos tienen barreras evolutivas muy diferentes. Los dos mecanismos clásicos pueden implementarse mediante mutaciones simples y se han observado en numerosas ocasiones. En muchos virus, simples mutaciones puntuales modifican el número de triangulación5,63,64. Además, el número de triangulación de algunas cápsides puede alterarse sin cambiar la secuencia de MCP3,65,66. Asimismo, las mutaciones puntuales en el fago T4 convierten la cápside de prolada a isométrica o generan cabezas gigantes en las que el eje largo de la cabeza prolada se alarga4,67. Por tanto, las barreras evolutivas para alterar el volumen de la cápside a través de los dos mecanismos clásicos parecen ser bastante bajas. En cambio, la estrategia del capsómero agrandado identificada aquí requiere múltiples y extensas alteraciones en las secuencias de las proteínas de la cápside. La cápside P74-26 más grande requiere grandes cambios en las ocho modificaciones separadas de la estructura MCP, así como en el brazo Dec (Figs. 3a, b y 4c, d). Esto nos lleva a preguntarnos: ¿por qué el fago P74-26 utilizó esta estrategia evolutiva aparentemente más desafiante en lugar de las estrategias clásicas más fáciles? ¿Qué limitaciones impidieron la evolución de una cápside más grande a través de las rutas clásicas?
Nuestra primera hipótesis es que los lassos, las solapas y los brazos que estabilizan la cápside P74-26 requieren un capsómero más grande para funcionar. Es posible que los lassos necesiten un espacio extra para abrirse lo suficiente como para que se inserte una estructura de enganche. Del mismo modo, es posible que las solapas y los brazos requieran una cierta longitud para provocar su actividad estabilizadora. Si este fuera el caso, entonces los elementos arquitectónicos que estabilizan la cápside requieren capsómeros más grandes de lo normal. En este escenario, el capsómero más grande es la característica estructural seleccionada y la geometría T = 7 es un spandrel: una estructura biológica que es un subproducto de la evolución más que un resultado de la selección directa68. Sin embargo, no estamos a favor de esta hipótesis porque los lassos se encuentran en los herpesvirus, en los que el pliegue HK97 tiene un tamaño típico (los MCP de los herpesvirus tienen varios otros dominios en forma de torre que aumentan el tamaño, pero estos dominios no forman parte del piso principal de la cápside y no contribuyen al pliegue HK9749). Además, otras MCP de Caudovirus contienen largos brazos N (por ejemplo, el fago Sf631) o bucles E que se abren casi tanto como P74-26 (por ejemplo, el fago P2243), pero estas proteínas tienen un tamaño típico. No obstante, esta hipótesis sigue sin probarse.
Una segunda hipótesis es que el tamaño del genoma y la capacidad de la cápside coevolucionaron mediante pequeños aumentos concomitantes. Si el fago ancestral evolucionó con un genoma ligeramente más grande de lo que se puede acomodar en la cápside, entonces puede haber una presión selectiva para una cápside ligeramente más grande. El aumento del número de T o la transición a una cabeza prolada aumenta sustancialmente el volumen de la cápside, dando lugar a grandes caídas en la presión interna. Estas transiciones pueden desaconsejarse porque la presión interna debe mantenerse para la infección26. Para evitar grandes cambios en la presión interna, los capsómeros más grandes pueden coevolucionar lentamente con un genoma más grande.
Nuestra hipótesis final es que la geometría de la cápside tiene un efecto directo en la estabilidad general de la cápside. Nuestra hipótesis es que la geometría T = 7 es inherentemente más estable que los números de triangulación más altos debido a las conformaciones variables de los hexones. Todas las cápsides que son T = 9 o superiores tienen más de un tipo de hexón presente, mientras que todas las cápsides T ≤ 7 tienen exactamente un tipo de hexón (excepto T = 1, que no tiene hexones69,70). Por ejemplo, T = 7 tiene una conformación de hexón de un solo pliegue, mientras que T = 9 tiene hexones alados y planos (Fig. Suplementaria 11a, b). También observamos que las cápsides proladas tienen múltiples tipos de hexones (generalmente tres o más conformaciones de hexones; Fig. 9). Por lo tanto, las principales proteínas de la cápside en los virus T > 7 deben acomodar la heterogeneidad conformacional de los hexones, lo que puede afectar negativamente a la estabilidad.
La hipótesis es que la geometría T = 7 es la mayor complejidad (es decir, el mayor tamaño) que es inherentemente estable. Las geometrías más complejas introducirían inestabilidad a través de la variación de la conformación del hexón. Esta inestabilidad inherente puede requerir mecanismos adicionales de estabilización para mitigarla, como proteínas de decoración para cimentar la estructura en su lugar. Prevemos dos desventajas no excluyentes de la geometría T > 7. En primer lugar, cada una de las conformaciones separadas del hexón debe permanecer funcional y estable, lo que limitaría la evolución de las proteínas MCP para lograr una mayor estabilidad. El segundo beneficio es que un menor número de triangulación resulta en menos interfaces subunidad-subunidad, minimizando así el número de puntos débiles en la cápside. En apoyo de esta hipótesis, el virus arqueológico extremófilo HSTV-2 (Halorubrum sodomense tailed virus 2) empaqueta su genoma de ~68 kb en una cabeza T = 771. El HSTV-2 utiliza una cápside más grande de lo normal, y también tiene proteínas decorativas triméricas que se sitúan en los ejes triple/cuasi-triple. El hecho de que este mecanismo de ampliación de la cápside sólo se haya observado en los extremófilos apoya la idea de que la geometría T = 7 tiene un efecto beneficioso sobre la estabilidad. En apoyo adicional de nuestra hipótesis, todas las cápsides T > 7 conocidas utilizan proteínas de decoración (hasta donde sabemos), mientras que muchos virus T = 7 carecen de proteínas de decoración.
Si varios números de triangulación tienen diferente estabilidad inherente, esto sugeriría que cada geometría exhibe puntos débiles en diferentes regiones de la cápside, como se ha predicho a partir del trabajo teórico72. Nuestra hipótesis es que los ejes triple/cuasi-triple representan los puntos débiles en una red T = 7. En apoyo de esta hipótesis, las proteínas de decoración de los Caudovirus T = 7 se encuentran comúnmente en los ejes triple/cuasi-triple (Tabla Suplementaria 2)29,44,52. Además, estos ejes están estabilizados por enlaces cruzados covalentes en el fago HK9745 y los colgajos del T-loop en el P74-26 (Fig. 7b). Para examinar esta idea más a fondo, observamos que el fago T = 9 también utiliza proteínas de decoración en los ejes triples73,74, mientras que los fagos T = 12 y T = 13 utilizan proteínas de decoración en los centros de los capsómeros61,75,76.
Notamos que todo nuestro análisis se ha centrado principalmente en los Caudovirus. Estos virus generalmente no descomponen sus cápsides como parte de su ciclo de vida, por lo que la cápside no tiene presión selectiva para ser lábil. De hecho, la alta presión del ADN empaquetado presenta una alta presión selectiva para desarrollar cápsides estables. Es probable que otros tipos de virus utilicen mecanismos de estabilidad diferentes, especialmente los virus que desarman sus cápsides como parte necesaria de su ciclo vital.