|
新京報(bào)快訊(記者 李玉坤)《國(guó)家科學(xué)評(píng)論》3月3日在線(xiàn)發(fā)布了北大生命科學(xué)院研究員陸劍等人的論文,媒體對(duì)此論文解讀稱(chēng),新冠病毒已經(jīng)突變,演化為兩個(gè)亞型,其中一個(gè)亞型“傳染性”更強(qiáng)(aggressive)。
( N* c' O6 f0 a 3月11日晚,記者發(fā)現(xiàn)陸劍等人已經(jīng)重新提交了手稿,在文末解釋稱(chēng),“aggressive”(具有侵略性)用詞具有誤導(dǎo)性,他們沒(méi)有關(guān)于病毒致病性的結(jié)論。/ N" q8 r5 [8 f X) R6 r( s
新冠病毒變異后會(huì)更有“侵略性”?! k$ a* K6 c' H* y
論文作者補(bǔ)充聲明4 {1 R6 v) v S+ C! o$ m# R
陸劍等人研究了103個(gè)新冠病毒基因組發(fā)現(xiàn),由于一個(gè)蛋白編碼位點(diǎn)的突變產(chǎn)生的差別,將新冠病毒毒株清晰分為兩組,被媒體稱(chēng)為“亞型”。但有學(xué)者認(rèn)為,目前變異造成的差異不足以叫“亞型”,叫“分枝”(clade)比較合適。' B* I* W5 R4 d$ ^# u" r; ]
陸劍等人在重新提交的論文中,做了補(bǔ)充性聲明:
0 m F2 v4 U1 f8 m' w7 v “在我們最近發(fā)表的文章,分析結(jié)果顯示,103個(gè)SARS-CoV-2病毒基因組存在兩種不同的譜系;分別稱(chēng)之為‘L’和‘S’譜系。我們用來(lái)定義L和S譜系的氨基酸位點(diǎn)位于ORF8(開(kāi)放閱讀框8。所謂開(kāi)放閱讀框是指是DNA序列中具有編碼蛋白質(zhì)潛能的序列——記者注。)基因,這個(gè)基因還沒(méi)有發(fā)現(xiàn)具有任何已知的重要功能?;凇甃’譜系的頻率高于譜系S的發(fā)現(xiàn),我們將L譜系描述為‘a(chǎn)ggressive’(具有侵略性)。我們現(xiàn)在認(rèn)識(shí)到,在本研究闡述的內(nèi)容中,‘侵略性’一詞會(huì)具有誤導(dǎo)性,應(yīng)該用更精確的術(shù)語(yǔ)‘更高的頻率’代替。簡(jiǎn)而言之,盡管我們已經(jīng)發(fā)現(xiàn)這兩個(gè)譜系自然并存,但我們沒(méi)有提供任何證據(jù)支持關(guān)于SARS-CoV-2毒力或致病性的任何流行病學(xué)結(jié)論。因此,我們將在本文的印刷版本中進(jìn)行更正,以避免產(chǎn)生誤導(dǎo)?!?/font>
' M, S5 p+ Z4 V8 T/ [1 j/ x 在此前的報(bào)道中,媒體多用“亞型”這一表述。從聲明中可以看出,陸劍等人并不認(rèn)為突變產(chǎn)生了兩個(gè)“亞型”,而是用了“譜系”這一說(shuō)法。4 }8 x: s8 ~8 {+ q( ]9 j
在論文剛公布的時(shí)候,媒體報(bào)道,“新變異出的L亞型更具傳染性”。對(duì)于這個(gè)觀(guān)點(diǎn),陸劍等人做了重點(diǎn)更正,認(rèn)為此前用詞具有誤導(dǎo)性。, q" _9 n6 Y7 ?; T$ W2 x
新冠病毒有多愛(ài)突變?
# J7 G# q. J8 A; ~2 m) y3 Q 已記錄481個(gè)變異
: e+ n& m2 l& A6 q. f' ?5 A 湖北省疾控中心衛(wèi)生檢測(cè)檢驗(yàn)研究所流感參比實(shí)驗(yàn)室主任劉琳琳等人在另一篇論文中提到,根據(jù)數(shù)據(jù)庫(kù),新冠病毒的基因組大小從29,409bp到29,911bp不等,包括183個(gè)可變位點(diǎn)。4 y! |5 h) z1 U6 y+ B$ ?% m* ^
記者發(fā)現(xiàn),截至3月12日5時(shí),國(guó)家生物信息中心2019新型冠狀病毒信息庫(kù)中已經(jīng)記錄了482個(gè)新冠病毒的變異。
1 b5 F0 D, c7 M6 c: r1 j新型冠狀病毒信息庫(kù)記錄4種變異類(lèi)型,分別是SNP(單核苷酸多性態(tài),就是單個(gè)堿基的改變)、deletation(缺失,一個(gè)或者多個(gè)核苷酸丟失)、insertion(插入,多了一個(gè)或多個(gè)核苷酸)、indel(插入或缺失)。其中SNP最多,有461條。其次是deletation,有20條。因?yàn)樾鹿诓《臼荝NA單鏈,這種病毒SNP變異特別常見(jiàn)。
) X1 R, t |/ |7 V . V- q4 y. z4 n/ S* b- j
9 G. m) ~) _$ \+ w' O! z 新冠病毒各基因的變異情況。7 q8 Z1 y- z9 c6 o+ j* V
陸劍等人用來(lái)定義L和S譜系的氨基酸位點(diǎn)位于ORF8(開(kāi)放閱讀框8)。從新型冠狀病毒信息庫(kù)的數(shù)據(jù)來(lái)看,ORF8的變異不是最多的。并且,陸劍等人表示這個(gè)基因還沒(méi)有發(fā)現(xiàn)具有任何已知的重要功能。: Q6 |3 @- ^4 D% k6 {# f) _' z* u
記者了解到,S基因具有重要功能,這個(gè)基因用來(lái)生產(chǎn)S蛋白(spikeprotein,翻譯為棘突蛋白、長(zhǎng)釘?shù)鞍住⑺氲鞍祝?,棘突蛋白?huì)和病毒宿主細(xì)胞受體ACE2結(jié)合,使得病毒能夠侵入到細(xì)胞內(nèi)。
& E, R {$ ~& q- d$ L+ R' U 在S基因中,有一處重要突變一直是各國(guó)科學(xué)家研究的重點(diǎn)。南開(kāi)大學(xué)高山等人發(fā)現(xiàn),新冠病毒的受體結(jié)合基序中多了一個(gè)Furin蛋白酶切位點(diǎn),這在蝙蝠冠狀病毒和穿山甲冠狀病毒中都沒(méi)有發(fā)現(xiàn)。不同于SARS等其他大部分Beta冠狀病毒,這個(gè)變異使得新冠病毒可能采用了HIV等其他病毒的類(lèi)似的包裝機(jī)制,它的棘突蛋白獲得了更高的侵染細(xì)胞的效率,更具感染性。
3 w- x; }( K* E9 H- J5 S8 z9 O 兩個(gè)譜系有何差別?1 L* A ^, g/ Z5 z& ?0 Z5 T+ D
L型由S型衍化而來(lái)
! d7 R3 e7 M4 q' Z4 ~+ J- w$ T 陸劍等人用完全連鎖的SNP區(qū)分了新冠病毒的兩種譜系,在103株新冠病毒病毒株中,有101株表現(xiàn)出兩個(gè)SNP之間的完全連鎖:72株表現(xiàn)出“CT”單倍型(定義為“L”型,因?yàn)槭橇涟彼岬拿艽a子),29株在這兩個(gè)位點(diǎn)表現(xiàn)出“TC”單倍型(定義為“S”型,因?yàn)槭墙z氨酸的密碼子)。由此可見(jiàn),L為主要類(lèi)型(占70%),S為次要類(lèi)型(占30%)。
; S; Z$ H1 X+ ~8 R/ M& C 他們將新冠病毒和其他高度相關(guān)的病毒基因組比對(duì),發(fā)現(xiàn)S譜系的核苷酸與最密切相關(guān)的病毒的同源位點(diǎn)相同,L型比S型更多,但S型實(shí)際上更“老”。不過(guò),盡管L型是從古代S型新進(jìn)化而來(lái)的,但它在人類(lèi)群體中的傳播或復(fù)制速度更快,從而導(dǎo)致其積累的突變比S型更多。
# n+ D4 j& I8 } i+ v/ I& E 從武漢分離出的27種病毒中,有26種(96.3%)為L(zhǎng)型,只有1種(3.7%)為S型。但是,在武漢以外地區(qū)分離出的其他73種病毒中,L型為45種(61.6%),S型為28種(38.4%)。這種比較表明,L型在武漢比其他地方普遍得多。; J. O2 O$ {& t( o
% c) O; K" d7 [9 M
5 {( b- `% F' f: b! O 新冠病毒分化的兩個(gè)譜系。
2 d: o+ C4 m- ^7 T8 h9 `5 U3 _ 劉琳琳等人做的研究,也顯示出了類(lèi)似的進(jìn)化和分布關(guān)系。
" t/ q; S6 ?; [- ]9 F 他們通過(guò)分析146個(gè)基因組,發(fā)現(xiàn)了183個(gè)替換位點(diǎn),將新冠病毒分為80個(gè)單倍型。其中,與其祖先單倍型相比,一個(gè)被稱(chēng)為H3的單倍型及其衍生的單倍型數(shù)量很大,并在湖北(尤其武漢)廣泛分布。除中國(guó)外,其他15個(gè)國(guó)家提供的65個(gè)病毒樣本被分配給43個(gè)單倍型。其中,H3衍生出來(lái)的單倍型有27種,它的兩個(gè)祖先單倍型H14衍生的單倍型11種,H15衍生的單倍型3種。
/ G6 ~( Z" x+ E6 o6 o7 M) p / @' [# L2 @4 b$ a) p
j8 `2 p# o* C
各單倍型之間的衍化關(guān)系。
5 s; e0 [# L6 Z0 e4 [( s 值得一提的是,陸劍等人發(fā)現(xiàn),有兩個(gè)樣本包含了S和L兩種類(lèi)型,這兩個(gè)樣本都來(lái)自國(guó)外——美國(guó)和澳大利亞。他們猜測(cè),患者可能感染了至少兩種不同的新冠病毒。7 c& c( ~, o# A- z
直接來(lái)源到底是哪種動(dòng)物?8 a- T9 f* h% I: M
穿山甲不太可能5 J4 p9 f! _) y7 B, y$ p
陸劍等人除了研究新冠病毒的進(jìn)化外,還研究了新冠病毒的起源,著重分析了是來(lái)自蝙蝠還是穿山甲。" z& h* c. Z* Y/ F! a
全基因組系統(tǒng)發(fā)生樹(shù)表明新冠病毒最接近蝙蝠冠狀病毒(RaTG13),其次是穿山甲相關(guān)冠狀病毒,然后是人的SARS病毒。劉琳琳等人也得出了相同的結(jié)論,基于系統(tǒng)發(fā)生樹(shù),蝙蝠冠狀病毒(bat-RaTG13-CoV)與新冠病毒和兩個(gè)從廣東采集的穿山甲冠狀病毒的姊妹病毒的遺傳距離相對(duì)較大,穿山甲可能不是新冠病毒中間宿主。
) B0 D9 O( P+ p* d
, `' J* Q) R( s) w, z
$ s. c& z. ~0 i$ b 蝙蝠、穿山甲和人類(lèi)新冠病毒的遺傳距離。
6 {/ m/ w! D9 G- ~5 {' X- t 不過(guò),陸劍等人發(fā)現(xiàn),盡管新冠病毒與蝙蝠SARS相關(guān)冠狀病毒(SARSr-CoV-RaTG13)之間的基因組核苷酸差異僅4%,但中性位點(diǎn)的差異為17%,表明兩種病毒之間的差異比以前估計(jì)的要大要多。作者做了一個(gè)對(duì)比,這個(gè)差異是人與黑猩猩之間差距的14倍,是人與恒河猴之間差距的2倍。
" U- U2 t- ?+ y3 j- | 此外,有一些研究表明穿山甲可能為新冠病毒提供了部分棘突基因(上文說(shuō)的S基因)。棘突蛋白受體結(jié)合域中的6個(gè)關(guān)鍵氨基酸殘基,和SARS病毒相比,新冠病毒有5個(gè)殘基都不同,并且新冠病毒與受體ACE2的結(jié)合親和力更高。蝙蝠冠狀病毒(RaTG13)也是6個(gè)中只有1個(gè)相同,但有趣的是,穿山甲冠狀病毒和新冠病毒的6個(gè)關(guān)鍵氨基酸殘基是相同的。1 ~% C8 y. e+ W0 M! r+ M
有人提出,新冠病毒的棘突蛋白受體結(jié)合域可能是由穿山甲中最近的重組事件引起的。陸劍等人認(rèn)為,盡管棘突蛋白產(chǎn)生過(guò)重組,但新冠病毒和穿山甲冠狀病毒中相同的功能位點(diǎn)也可能是巧合的趨同進(jìn)化的結(jié)果,香港大學(xué)管軼等人在此前的論文中表達(dá)了相同的觀(guān)點(diǎn)。7 r1 m! p/ X2 }+ X; j
【主要參考論文】9 k" \. u$ S$ Z" c6 t
Genome-widedata inferring the evolution and population demography of the novel pneumonia coronavirus (SARS-CoV-2). bioRxiv2020.03.04.976662
) D+ y- g, t4 WOn the origin and continuing evolution of SARS-CoV-2. National Science Review, nwaa036
$ ~7 I2 U C0 }9 |0 p- ] 新京報(bào)記者 李玉坤
( T7 @$ N$ ?8 S3 b# s( y, A4 s) n$ Y2 u/ n5 s3 `
+ e9 k" r& i) w- N3 ]- o6 A( v4 E
) ^; P4 g2 p/ O S% a. n
! ?- }- l" w* X2 @1 x
' v9 [2 c& e0 k# p S4 X1 p* `0 x% z0 W! x p2 R7 a+ u5 Y
# M# \) Z$ e/ B3 p$ p \3 O0 ~( Q- s2 G, o1 L
9 j8 V3 M2 N( r( E
$ p$ }' E( W! Y! L; C- p
; ^8 F4 U5 e* ?+ B5 M5 W
7 T1 Z8 h- F3 c2 `- W3 k0 e7 f) X% K5 {4 R% i
. ]: u C/ U5 h
4 [/ F) v$ N" U' O& \
& G& R9 K! A* i! ?( E$ ^: g- A |
|