錯誤涉及我幾天前所發的文章“新冠君,你額頭的Lab金印怎麼洗”。
該文第7部分“7.SARS-CoV-2帶有實驗室載體pShuttle的核苷酸序列INS1378”說:
“SARS-CoV-2的基因序列中,有一個長度為1378的核苷酸序列INS1378,它來自實驗室多功能載體pShuttle SN vector。。。”
這一說法參考自美國匹茲堡大學高級研究員詹姆斯·萊昂斯-魏勒 (James Lyons-Weiler)的有關文章。
2020年1月30日,James Lyons-Weiler 在其個人網站發表了一篇題為“On the Origins of the 2019-nCoV Virus, Wuhan, China”的文章,
https://jameslyonsweiler.com/2020/01/30/on-the-origins-of-the-2019-ncov-virus-wuhan-china/
這篇文章還有一篇關聯文章:Moderately Strong Confirmation of a Laboratory Origin of 2019-nCoV
https://jameslyonsweiler.com/2020/02/02/moderately-strong-confirmation-of-a-laboratory-origin-of-2019-ncov/
文章的主要觀點包括:
1)最相似的蝙蝠冠狀病毒(CoVZC45)與2019-nCoV之間缺乏基因序列同源性;
2)新冠基因組中的核苷酸子序列INS1378與SARS刺突蛋白的序列高度相似;
3)INS1378與pShuttle-SN載體質粒也具有顯著的序列相似性,該載體可用於生產SARS疫苗;
4)2019-nCoV非常可能是實驗室用來製備SARS疫苗的重組病毒。
在審視、完善“新冠君,你額頭的Lab金印怎麼洗”一文過程中,我細讀了Lyons-Weiler的原文,也查閱了網上的相關文章。已有網友指出Lyons-Weiler的文章存在分析錯誤。在比較研究了正反兩方面的看法後,我的結論是:
Lyons-Weiler的邏輯與判斷確實存在問題,INS1378與實驗室載體pShuttle-SN並無必然關聯,含有INS1378,也並非新冠(即SARS-CoV-2)產生於實驗室的可靠證據;
我前文的第7.部分也存在相應的問題,“INS1378來自實驗室載體pShuttle-SN”這一判斷並不成立。
下面陳述我的理由。
1)INS1378與SARV-CoV刺突蛋白(S蛋白)的序列一致性(可匹配度)並不高,僅為67.77%;它與pShuttle-SN的序列一致性也並不顯著,同樣僅為67.77%。INS1378與pShuttle-SN,與所有SARV-CoV病毒株基因序列的一致性都是67.77%,對INS1378來說,pShuttle-SN與SARS-CoV並無不同。如果可以說,INS1378來自pShuttle-SN,那麼,也可以說INS1378來自SARS-CoV。
下圖是用NCBI(National Center for Biotechnology Information)工具Blast得到的INS1378在基因數據庫中的搜索匹配結果列表(部分),中間一行是INS1378與“Expression vector pShuttle-SN”的基因序列匹配情況,二者的序列一致性,或者說可匹配度為67.77%。


b)INS1378與兩種舟山病毒CoVZC45,CoVZXC21的一致性分別為70.31%,69.76%,皆高於其與pShuttle-SN或SARS-CoV的一致性(67.77%),與其說INS1378來自pShuttle-SN,那麼,還不如說INS1378來自CoVZC45或CoVZXC21。參見下圖。


c)Expression vector pShuttle-SN質粒基因序列共有5607個鹼基對,它自編號945開始的一段長為1525的鹼基對序列,與SARS-CoV(以病毒株SARS coronavirus BJ162代表)自編號21447開始的一段長為1526的鹼基對序列高度匹配,在1526個對應位置中,匹配的鹼基對有1520個,一致度(匹配度)高達1520/1526=99.61%。下圖為比照結果的截圖(匹配段序列較長,截圖只顯示了前面一小部分匹配段)。
Blast Job Title AY862402:Expression vector pShuttle-SN, complete...

Expression vector pShuttle-SN與SARS-CoV(SARS coronavirus BJ162)基因序列匹配情況
d)Expression vector pShuttle-SN與SARS-CoV二者長為1526的高度匹配區域,包含它們各自與INS1378的最佳匹配區域,因而,INS1378與二者的最佳匹配區域,幾乎沒有什麼不同,這就是INS1378與二者的一致性相同,皆為67.77%的原因。
e)Expression vector pShuttle-SN與SARS-CoV高度匹配的原因是,Expression vector pShuttle-SN中長為1525的序列,本來就是從SARS-CoV的S蛋白中克隆來的。在實驗室用SARS-CoV的S蛋白與(缺陷型)腺病毒合成SARS疫苗時,要將SARS-CoV的S蛋白,克隆到pShuttle質粒中,這一操作得到的一份含有SARS-CoV S蛋白的pShuttle質粒重組克隆體實例,就是Expression vector pShuttle-SN。2004年12月21日,中山大學腫瘤防治中心將Expression vector pShuttle-SN的基因序列,提交至國際基因庫GenBank。參見下圖。

關於腺病毒SARS疫苗的專利情況及疫苗製備方法,可參見下面兩個圖。


綜上所述,“7. SARS-CoV-2帶有實驗室載體pShuttle的核苷酸序列INS1378”這一說法並不成立,尚無事實和邏輯可得出“SARS-CoV-2中的核苷酸序列INS1378與實驗室載體pShuttle有關”這一判斷。
需要說明的是,雖然我認為,Lyons-Weiler就INS1378與pShuttle-SN關係的判斷是錯誤的,但他有些看法我仍然認同,例如:
a)2019-nCoV進化樹分支的bootstrap值(自展值)較低,僅為76,是進化樹各分支中最低的。這說明該分支(源於自然進化)的可信度較低。

b)2019-nCoV與蝙蝠冠狀病毒的基因序列同源性較差,且序列一致性關係不連貫,存在明顯的間斷gap,這也說明2019-nCoV不太可能由蝙蝠冠狀病毒自然進化產生。

SARS-CoV-2與舟山病毒CoVZC45序列一致性關係dot plot圖,圖中有非常明顯的間斷gap。NC_045512是SARS-CoV-2的NCBI refseq(登錄號),MG772933是CoVZC45的Accession number。
確實少了一道“金印”。但是,新冠君額頭的其它六道Lab“金烙印”仍赫然在目,“新冠君,你額頭的Lab金印怎麼洗”一文其它各部分的內容,分結論和文章總的結論依然成立。
有一個事實不知大家是否注意到了,早在2003-2004年間,中山大學就已經能夠用SARS-CoV的S蛋白與腺病毒骨架來合成人工病毒(疫苗)了。