猴痘病毒基因变异研究报告
赵盛烨,DOI:10.6084/m9.figshare.19835908
1 数据样本
研究选取两个数据样本,均来自NCBI数据库的猴痘病毒分组,样本1为2001年采样,2020年得出的测序结果,样本2为2022年5月20日采样并测序的结果,对应的基因编号分别是GenBank: MN702453.1、GenBank: ON563414.1,DNA长度分别是189632 bp、197128 bp。
样本1链接:
https://www.ncbi.nlm.nih.gov/nuccore/MN702453
样本2链接:
https://www.ncbi.nlm.nih.gov/nuccore/ON563414
样本1截图: 样本2截图:
2 方法过程
第1步,提取两个样本的完整DNA测序结果;
第2步,使用BLAST工具对两个基因序列进行对比,工具地址:
https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastSearch&PROG_DEF=blastn&BLAST_PROG_DEF=blastn&BLAST_SPEC=GlobalAln&LINK_LOC=BlastHomeLink
第3步,寻找对比结果中样本2比样本1多出的基因序列,阈值为20个碱基以上连续不同,并保存;
第4步,对多出的几部分基因序列进行研究,通过核苷酸序列查询对应的蛋白质构成,工具地址:
https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi
第5步,分析蛋白质性质和功能,得出结论。截图:
3 结论
样本2与样本1相比,有多达数十处碱基不同,低于本实验阈值的更可能是自然变异,高于阈值的可能是重组变异也可能是在病毒GOF研究时依靠引物进行的人工插入,在此列出可能性,没有足够证据做定性。
阈值以上,共有5段完整的基因序列,与其序列对应的蛋白质有9种,其中包括2种对人体较危险的蛋白质,编号为cl00473、cl22855,此两种蛋白已被证明会导致广泛的病理状况,包括自身免疫性疾病、炎症、癌症和病毒感染。
因此的,5段完整的插入基因表明,本次在世界范围内流行的猴痘病毒与早期猴痘病毒相比,有更强的致癌风险,即便患者没有在发病期间死亡,依然有可能在随后患癌死亡。
附件1 样本1完整基因
完整版参见DOI:https://doi.org/10.6084/m9.figshare.19835908
附件2 样本2完整基因
完整版参见DOI:https://doi.org/10.6084/m9.figshare.19835908
附件3 样本1与样本2对比差异
完整版参见DOI:https://doi.org/10.6084/m9.figshare.19835908
附件4 阈值以上基因序列
新增基因:
TAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACT
AATTTCAGTATATTCTTCGCCGTTATAAAAGTAATGTTGTTTAATTGTAGGACGGTTGTTAGTATAATCACATGAATAATAATATTCTAATTCCTCGTATTGACTACTTACAGATACTCGAAATAGTCTGAAAAATTCTTCAAAGATATTTTTATAAAGATCTAGGAAAAGTTTATTACCGACCATGAACGAGATAGATGGATAAATATCCTTTCCATCAAAGGTCATAATTGGATAATTGTCCAGCAATATATCTGCTGTATTAGTTATATCACTTCCATTTATTTTCAGATTGAAGTAATGTACTAGTTTGTGACAATTAACAAGATACAAAAGAGATGCCGATACTAATACGTAAATAGCTATACGCGAATCCATTGTTACCTTTTTTTATTTCATAGGTCTATTAATAAATATATGTATTACTTAAGACTAGAAAAATCAAAAGTGAGTTTTTGATATTTGATTCTTACTTATTGTGGGATTGTAGTTTACTTAGTAATTCATCTCTGAATCCTGATAAATCATGCATATCAATGATGCAACTACGCAGCAAACTAGTAGGAATATAGATATCTGGATATGTACGTAAATAGTCGATTATATCTTTTACAATACTATTAGTCCCTATTGCGTTATCTATATATCCATTAATAATATTACACAGTGGATACTTATGAGAAATATACCTCTTACAGATTTTTAACGATATATAATCTAGAAAGATATGTGTGTAGTACTGTATTACCTAAATTATCAGTCTCATTCAAATATTGCATGACTATTATCGAGAATTGCTATATCCCTCTATACTCGATGCATTTATTACAGTAATTCAATCCAGCTAACATAAGAGCCAATCTCAATGTTGGTTTAATTATATCATCTTCATGTAATAATAACGATGGAAACTTTCCAGTAGCGTAACACTTATCTAAGAAGGATATAATAACTATGTCTACATTATGTCTCTTATCGAGAATATTCTTAACGAGATATCCATAGCTATTCTGGTGCTAATTATTCCTATATTATATTCCACGAAAAATGATGAAGGCAATCATTCATCATAAGATGATAAAAAGTGTAGTGAGTAAGAGTATTAGTGAGAGAGCATGAAGGAGATTTAGTATTTAGCAGTGAGGATATGATCCAAGAGGGTGAGATAGTCGTTCTCGTTCAGAATCTTTCGCAGCATAAGTAGTATGTCGATATACTTATCATTGAAGACTCTTCCAGTGACAATAGCTGATTGAGTACAAAGTCCAATTATTGCACAAAGTTCTTTGGCGGTTTTCATGGAGTCATTTCTGATGAAACATTTAATGATCTCCACGCAATTGTCGATATTGTCCCACGGAAGTGAATCCGAGAACTCCTTCAACTCGCTACCAAATAGCTCCATTGCATCAATTCTGAAAGAGATGAGAAGCCTGTAGAGAGGCCCTGCGCTTTCTCTATGGGTCCATCTATGAGAAACCCACAGGATGTATTCAGTCAGACAATGTCTGACATCAGTCACGGTATTCAGGGAGTCCTTAGTAGCGTGGCAATGACAGGGACTGAACTGGGCACAAGGAGAGGCCATTGTGAAGGTAGACGAAGGTAACCTGATGGTAGACCTGTAGCCGTCTGTGCTTAATAGAGGGCTTTAATTTCCATTTTTAATGGTGTCGTGAATGAGGAATGAGAGTGTCTCTCGTCCTTGGTTTACATGGATCAGAGTGAGAAAAAATATCTTGTATATTATTAACTAACAACCTTGGTTTCTATCCATGTTTAAAAAATGACCTATATGTTCTTTATTAATTCTATTTTAAACTTTATCCTCAAGACTCCTGACAAAATTAAAATCCAGAAAGCAGCAAACAATCCTGTTACAAGTTTACTGAAATCTCTCTTTGATTGTAGAGTATATGTAGTCAGAGCAAGAAACACTGCAGTAGTCAACATGAAAGCTTGCATAACGATACGTGCATCATAGAAAGTAACAACAGAGGCCAGCGTTAGAGATTCTAACAGTGTAAATCCACAAAGTATGTACAGATTCAGGGGATGTTCATGTCTGTGTAAAGTCAATGCGAAAATCAAGCCTATAGATCCGAACATTGATGCCAATATTAGAACAGGACTCCCTTGTATAAATGTCCGATGCATTCAAAGTATAAAAATACTGCAGCTGTTGCCGTTGTTAAAGGAAATTGTAGAAAGGATACCGTAGACTTTTCTTAGAAATGCCATTCGTATGTACACGCTGGCAGACGCCACCGAGCTGTCATAGTTGAAGTCGTCCTCGATA
CATCAATATAAATAAAATAATTATTCCTTACATCGTACCCATCAATATAAATAAAATAATTATTCCTTACATCGTACCCATCAATATAAATAAAATAATTATTCCTTACATCGTACCC
TCGGTCCATGTCTCCATTGCTACACCACATTAGATTTACAGGCTGTTAGTTGTCGTTCGAGATCAGAAATACGTGTTTTCTTGGAATGGATTTCGTCGATGTACTTGTCATGATTGGCATCGAAACACTTATTAAGTTCTTTTTTTCAATTCTACGATTTTATTTCTTTCGCGAGTCAATTCCCTCCTATAGTAACTATCAGTTTTGTCAGATTCACGCTCTCTACGTAGACTTTCTTGCAAGTTACTAATTTGTTCCCTGGCATTACCGAGTTCAGTTTTATATGCCGAATAGAGTTCTGATTCATCCTTTGAGAAGATCTCTAGCGATCGTTCAAGATCCCTGATTCTAGTCTTTAGCCTATTTACCTCCTCAGAAGATGCTCCGTTACCGTTTTTACAATCGTTAAGATGTCTATCAAGATCCATGATTCTATCTCTTTTCCATATCAG
TACTGACTACATGTACTATTTTACATTACTACATTGGCTACGGTATATACCTACTTCGTCACTTCCACACGCTCCAGTAAACGGGTGTCATGTGACGAGGGAGAATCTTGATAAGAGGCATAATCAATGTTGTAATCCGGTGTCCACCTGGAGAATTTGCCAAGGTCAGATGTAGTTGGTAGTGATAACACAAAATGTGAACACTGCCCACCTCATACATATACCGCAATCCCCAATTATTCTAATAGATGTCATNNNNNNNNNAAATGCCCAACAGGATCATTTGATAAGGTAAAGTGTACCGGAACACAGAACAAATGTTCGTGTCATCCTGGTTGGTATACGCTACTGATTCTTCACAGACTGAAGATTGTCGAGATTTGTGTACCAAAAAAGGAGATGTCCATGCGGATACTTTGGTGGAATAGATGAAGGAAATCCTATTTGTAAATCGTGTTGTGTTGGTGAATATTGCGACTACCTACGTAATTATAGACTTGATCCATTTCCTCCATGCAACCTATCTATCTAAATGTAATTAATTATGATTTTGATGATAATGTTACCATACATTATATCGCTACTTGGTTAGTGTGTATTATTCAGTATGGAAGACCTATTAATAATTACTTATCTTTTGACGATCTTGTTATAATTATAATATAAAAATACTTATGACATAGTAACAGTAACTCATAATTGCTGACGCGATAAATTCGTAATAATCTGTTTTGTTCAAATTTTTATAAGGAATCTACAGGCATAAAAATAAAAATATAATCTATAATATACTCTTACAACGCCATCATGAATAGCAGTGAATTAATTGCTGTTATTATGGATTTAGAAATAGTGGACGATTTTGTGATATTAATATAGTTATTAATGATGAAAGGATAAACGCTCATAGATTCATCCTATCTGGAGCCTCCGAATATTTTTTCCATTCTGTTTTCCAATAATTTTATCGATTCTAATGAATACGAAGTTAATCTAAGTCATTTAGATTATCAAAGTGTTAACTATTTGATCGATTACATTTATGGGATACCTTTGAGCCTAACTAACGATAACGTGAAATATATTCTTTCAACCGCTGATTTTTTTACAAATTGGATCTGCCATTACTGAGTGCGAAAAATACATACTTAAAAATCTTTGTTTTAGAAACTGTATCGATTTCTACATATACGCTGATAAATATAATAACAAGAAAATAGAATTAGCATCGTTTAACACAATATTACGAAATATTTTGAGACTCATCAACAATGAAAACTTTAAATACTTAACAGAGGAATCAATGATATGTTATATATAAAAAATGAGGATTTCACCCCACTGATTCTCATTAAATGGTTAGAGAGTACACCAACCATGTACCGTCGAGTTACTTAGATGCCTCAGAATATCATTTCTTTCCCCACAAGTTATAAAATCACTTTATAGTCATCGACTGGTTAGTTCAATCTACGAATGTATAACATTCTTAAACAATATAGCATTCTTGGATAAATCATTTCCTAGATACCATATCATCGAGTTGATATCTATCGGTATAAGTAATTCACATGATAAGATTTCCATAAACTGCTACAATCATAAAAAAATTCATGGGAAATGATATCTTCACGTAGATGGTGTAGTTTCGCAGTGACCGTCCTGGATAATATTATCTATATGATGGGTGGATATGATCAGTCCCTGTATAGAAGTTCAAAGGTTATAGCGTACAATACATGTACTAATTCTTGGATATATGATATACCAGAGCTAAAATATCCTCGTTCTAATTGCGGAGGAGTTGCCAATGACGAATACATTTATTGTATAGGCGGTATACGCGATCAGGAGTCATCGTTGATATCTAGTATCGATAGATGGAAGCCATCAAAACCATATTGGCAGAAGTATGCTAAAATGTGCGAACCAAAATGTGATATGGGGTTGCGATTTTAAACGGATTAATATATGTCATAGGTGGAGTCGTTAAAGGTGACACACATGTACCGACGCACTAGAGAGTTTATCAGAAGATGGATGGATGAATCATCAACGTCTTCCAATAAAAATGTCCAATATGTCGACGATTGTTCATGCTGGAAAGATTTATATATCTGGAGGTTACAACAATAGTAGTGTAGTTAATGTAATATCGAATCTAGAGTCCTTAGCTATAATCCGATATATGATGAATGGACCAAATTATCATCATTAAATATTCCTAGAATTAATCCTGCTCTAT
附件5 两种致癌蛋白质
蛋白1:
https://www.ncbi.nlm.nih.gov/Structure/cdd/cddsrv.cgi?ascbin=8&maxaln=10&seltype=2&uid=cl22855
蛋白2:
https://www.ncbi.nlm.nih.gov/Structure/cdd/cddsrv.cgi?ascbin=8&maxaln=10&seltype=2&uid=cl00473
页面更新:2024-05-07
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号