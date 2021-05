–

La Navaja de Ockham es un principio metodol贸gico y filos贸fico, que se debe al fraile franciscano

ingl茅s Guillermo de Ockham de la Edad Media, seg煤n el cual 鈥渆n igualdad de condiciones, la

explicaci贸n m谩s sencilla suele ser la m谩s probable鈥. La expresi贸n inglesa keep it simple, stupid se

relaciona con este principio.

El problema del origen del SARS-CoV-2, tambi茅n hay que abordarlo con mentalidad de gen茅tica

forense. Los resultados basados en marcadores gen茅ticos siempre se expresan en t茅rminos

estoc谩sticos o probabil铆sticos. En gen茅tica no hay certezas absolutas, pero s铆 evidencias lo

altamente probables que permiten dictar sentencias de culpabilidad o determinar relaciones de

paternidad y/o maternidad. El origen del SARS-CoV-2, desde el punto de vista gen茅tico, no se

podr谩 demostrar como un teorema matem谩tico. Pero entre dos teor铆as en igualdad de

condiciones, que tienen las mismas consecuencia, la explicaci贸n m谩s sencilla ser谩 la correcta:

Navaja de Ockham.

Como ya hemos planteado en otros art铆culos (1,2), el origen del SARS-CoV-2 se puede reducir al

origen o adquisici贸n de una caracter铆stica molecular en su prote铆na S, el llamado 鈥渟itio de escisi贸n

de furina鈥, que facilita enormemente la interacci贸n del virus con las c茅lulas humanas, y su gran

capacidad de infecci贸n (pandemia). T茅cnicamente, es una 鈥済anancia de funci贸n鈥: ha habido una

inserci贸n en el gen S del virus que ha provocado que la prote铆na S haya ganado m谩s capacidad de

infectar. El SARS-CoV-2 pertenece al grupo de los Betacoronavirus (Sarbecovirus). Sorprende que

sea la 煤nica especie de Betacoronavirus que tenga dicho sitio de furina. De momento, nadie sabe

c贸mo y cuando le ha llegado. Esto genera controversia sobre su origen.

Querido lector, antes de seguir con el tema, es importante revisar algunos conceptos b谩sicos de

biolog铆a. En la materia viva, las prote铆nas son macromol茅culas que hacen las funciones (la prote铆na

S del virus, hace la funci贸n de facilitar la infecci贸n). Estructuralmente, las prote铆nas son cadenas de

otras mol茅culas peque帽as llamadas 鈥渁mino谩cidos鈥. El alfabeto del lenguaje de las prote铆nas est谩

constituido por 20 amino谩cidos (20 letras). Por otra parte, el ADN codifica las prote铆nas. El ADN

tambi茅n es una macromol茅cula constituida por una cadena de otras mol茅culas peque帽as llamadas

鈥渘ucle贸tidos鈥. El alfabeto del lenguaje del ADN est谩 constituido por 4 nucle贸tidos (4 letras). El

鈥渃贸digo gen茅tico鈥 traduce la informaci贸n codificada en un alfabeto de 4 letras (A,C,G,T), en otro de

20 letras.

El c贸digo gen茅tico usa tres unidades del ADN, para especificar cada unidad de amino谩cido de una

prote铆na. Cuando se leen en grupos de 3, los 4 tipos diferentes de unidades de ADN pueden

especificar 4 x 4 x 4 o 64 tripletes diferentes, o codones como se les llaman. Dado que solo hay 20

amino谩cidos, hay tripletes m谩s que suficientes para todos, lo que permite que algunos

amino谩cidos sean especificados por m谩s de un triplete. Hay amino谩cidos codificados por un 煤nico

triplete, y hay amino谩cidos codificados hasta por seis tripletes. Por ejemplo, el amino谩cido

鈥渁rginina鈥 (cuyo s铆mbolo es R), est谩 codificado por cualquiera de los 6 tripletes: AGG, AGA, CGA,

CGC, CGG, CGT.

Cada organismo (tambi茅n cada virus) tiene que fabricar sus propias prote铆nas (en biolog铆a, las

prote铆nas de una especie no sirven para otra). En la s铆ntesis de prote铆nas, cada amino谩cido no

utilizan por igual todos los tripletes que lo codifican. Por ejemplo, si un amino谩cido est谩 codificado

por s贸lo un triplete, no hay opci贸n; pero, si est谩 codificado por 2 tripletes, ambos no se utilizan al

50%. Si un amino谩cido est谩 codificado por m谩s de 2 tripletes, cada triplete es utilizado en una

determinada proporci贸n. En toda especie (incluyendo virus), siempre hay unos tripletes

mayoritarios y minoritarios. En este sentido, una huella de identidad (fingerprint) de una especie

es la tabla de frecuencias del uso de tripletes del ADN en la s铆ntesis de sus prote铆nas.

Volviendo al SARS-CoV-2, el sitio de furina se caracteriza por la inserci贸n de una secuencia de 4

amino谩cidos (PRRA), que corresponde con la inserci贸n de 12 nucle贸tidos (3 x 4). En el SARS-CoV-2,

el deblete RR del sitio de furina est谩 codificado por los tripletes CGG-CGG. Hay que decir que el

sitio de escisi贸n de furina, con el doblete RR es muy com煤n en el mundo de los virus (incluyendo

los Coronavirus, pero exceptuando los Betacoronavirus). La recombinaci贸n con otros virus, es la

explicaci贸n m谩s natural que se ha dado para la adquisici贸n de dicho sitio en el SARS-CoV-2. Para

analizar la verosimilitud de dicha recombinaci贸n, nosotros rastreamos las bases de datos (3),

obteniendo como resultado que no hay ning煤n doblete RR de sitios de furina de otros virus que

est茅 codificado por los tripletes CGG-CGG. Observamos que en estos RR, el triplete AGA es

mayoritario. En toda recombinaci贸n, siempre hay un donador y un aceptor de material gen茅tico; y

el c贸digo del donador pasa al aceptor. Si el SARS-CoV-2 ha adquirido el sitio de furina por

recombinaci贸n con otro virus, a partir de la informaci贸n disponible en las bases de datos

gen贸micas, no se puede saber cu谩l a ha podido ser.

Con estos resultados, tuvimos inter茅s en determinar el patr贸n de uso de los tripletes de arginina

del SARS-CoV-2 (3). Estudiando la composici贸n de todas sus prote铆nas, el resultado es: AGG (13%),

AGA (45%), CGA (5%), CGC (10%), CGG (3%), CGT (24%). El triplete AGA es el mayoritario, y

curiosamente, CGG es el minoritario. En el caso concreto de la prote铆na S, de las 42 argininas que

tiene, 20 est谩n codificadas por AGA, y solo 2 por CGG. Sorprende que esos 2 (CGG-CGG) sean los

que codifican el doblete RR del sitio de furina.

En este sentido, los tripletes de arginina son verdaderos marcadores gen茅ticos. En un estudio de

gen茅tica forense, tal como se puede enmarcar el origen del SARS-CoV-2, el poder disponer de

marcadores gen茅ticos 煤tiles es tambi茅n una 鈥渓oter铆a鈥. En ciencia, la suerte tambi茅n juega. En este

caso, el hecho de que el amino谩cido clave del sitio de furina del virus pand茅mico est茅 codificado

por 6 tripletes permite abordar la 鈥渢razabilidad鈥 de su origen. En la materia viva, otros amino谩cidos

est谩n codificados por 2 tripletes. Si este fuese el caso del amino谩cido arginina, una trazabilidad v铆a

c贸digo gen茅tico ser铆a muy dif铆cil. En este supuesto, una recombinaci贸n como mecanismo de

adquisici贸n del sitio de furina estar铆a aceptada. Es m谩s, el origen natural del virus no ser铆a objeto

de debate: no habr铆a caso!

Como se ha dicho, cada especie tiene su propio patr贸n de frecuencia de uso de los tripletes del

ADN. Por lo que se refiere al amino谩cido arginina, y en Homo sapiens, la frecuencia de uso de

tripletes es (4): AGG (20%), AGA (20%), CGA (11%), CGC (19%), CGG (21%), CGT (9%). Este patr贸n

en el genoma humano es muy distinto del patr贸n en el genoma del virus. En la especie humana, el

triplete CGG es el mayoritario (21%) y en el virus es el minoritario (3%). Sorprende que en el SARSCoV-2, el doblete RR del sitio de furina est茅 codificado por la secuencia CGG-CGG del triplete

mayoritario del genoma humano.

La teor铆a que sostiene un origen natural del SARS-CoV-2, debe contemplar que hayan ocurrido en

el tiempo dos procesos independientes: (i) la inserci贸n por mutaci贸n o recombinaci贸n de una

secuencia de 12 nucle贸tidos en un sitio estrat茅gico del gen S, codificando el sitio furina; y (ii) que la

secuencia insertada en el virus contenga el triplete de arginina mayoritario del genoma humano.

Dado que ambos procesos son independientes, todo sugiere una probabilidad baja.

La teor铆a que sostiene un origen de laboratorio del SARS-CoV-2, contempla que la inserci贸n del

sitio de furina en el genoma del virus ha sido de forma controlada, seleccionando la secuencia y el

lugar de inserci贸n. Considerando las aplicaciones de la ingenier铆a gen茅tica, en la actualidad se

insertan (se clonan) genes de ciertas prote铆nas humanas en microorganismos adecuados para su

fabricaci贸n comercial. Un ejemplo t铆pico es la producci贸n de insulina que se obtiene a partir de la

levadura Sacharomyces cerevisae. En estos procesos, el gen humano que se inserta se optimiza con

los tripletes mayoritarios del microorganismo receptor. En el caso del sitio de escisi贸n de furina, da

la impresi贸n de que haya sido clonado en el genoma de un virus, dando lugar al SARS-CoV-2.

Precisamente por el hecho de que el amino谩cido arginina tiene 6 tripletes en el c贸digo gen茅tico

universal, se vislumbra este indicio de clonaci贸n.

Este es el estado del arte sobre el origen del SARS-CoV-2. Probablemente, el principio de la Navaja

de Ockham ayudar谩 esclarecer la controversia.

Antonio Romeu1 y Enric Oll茅2

1

: Qu铆mico. Catedr谩tico de Bioqu铆mica y Biolog铆a Molecular de la Universidad Rovira i Virgili.

Tarragona. Espa帽a. Correo electr贸nico: antonioramon.romeu@iubilo.urv.cat

2

: Veterinario, Bioqu铆mico. Profesor Asociado del Departamento de Bioqu铆mica y Biotecnolog铆a de

la Universidad Rovira i Virgili. Tarragona. Espa帽a. Correo electr贸nico: enric.olle@urv.cat