猴痘病毒基因2001至2022变异研究报告

猴痘病毒基因变异研究报告

赵盛烨,DOI:10.6084/m9.figshare.19835908

1 数据样本

研究选取两个数据样本,均来自NCBI数据库的猴痘病毒分组,样本1为2001年采样,2020年得出的测序结果,样本2为2022年5月20日采样并测序的结果,对应的基因编号分别是GenBank: MN702453.1、GenBank: ON563414.1,DNA长度分别是189632 bp、197128 bp。

样本1链接:

https://www.ncbi.nlm.nih.gov/nuccore/MN702453

样本2链接:

https://www.ncbi.nlm.nih.gov/nuccore/ON563414

样本1截图: 样本2截图:

猴痘病毒基因2001至2022变异研究报告

猴痘病毒基因2001至2022变异研究报告

2 方法过程

第1步,提取两个样本的完整DNA测序结果;

第2步,使用BLAST工具对两个基因序列进行对比,工具地址:

https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastSearch&PROG_DEF=blastn&BLAST_PROG_DEF=blastn&BLAST_SPEC=GlobalAln&LINK_LOC=BlastHomeLink

第3步,寻找对比结果中样本2比样本1多出的基因序列,阈值为20个碱基以上连续不同,并保存;

第4步,对多出的几部分基因序列进行研究,通过核苷酸序列查询对应的蛋白质构成,工具地址:

https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi

第5步,分析蛋白质性质和功能,得出结论。截图:

猴痘病毒基因2001至2022变异研究报告

3 结论

样本2与样本1相比,有多达数十处碱基不同,低于本实验阈值的更可能是自然变异,高于阈值的可能是重组变异也可能是在病毒GOF研究时依靠引物进行的人工插入,在此列出可能性,没有足够证据做定性。

阈值以上,共有5段完整的基因序列,与其序列对应的蛋白质有9种,其中包括2种对人体较危险的蛋白质,编号为cl00473、cl22855,此两种蛋白已被证明会导致广泛的病理状况,包括自身免疫性疾病、炎症、癌症和病毒感染。

因此的,5段完整的插入基因表明,本次在世界范围内流行的猴痘病毒与早期猴痘病毒相比,有更强的致癌风险,即便患者没有在发病期间死亡,依然有可能在随后患癌死亡。

附件1 样本1完整基因

完整版参见DOI:https://doi.org/10.6084/m9.figshare.19835908

附件2 样本2完整基因

完整版参见DOI:https://doi.org/10.6084/m9.figshare.19835908

附件3 样本1与样本2对比差异

完整版参见DOI:https://doi.org/10.6084/m9.figshare.19835908

附件4 阈值以上基因序列

新增基因:

TAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACTTAACTAACTTATGACT

AATTTCAGTATATTCTTCGCCGTTATAAAAGTAATGTTGTTTAATTGTAGGACGGTTGTTAGTATAATCACATGAATAATAATATTCTAATTCCTCGTATTGACTACTTACAGATACTCGAAATAGTCTGAAAAATTCTTCAAAGATATTTTTATAAAGATCTAGGAAAAGTTTATTACCGACCATGAACGAGATAGATGGATAAATATCCTTTCCATCAAAGGTCATAATTGGATAATTGTCCAGCAATATATCTGCTGTATTAGTTATATCACTTCCATTTATTTTCAGATTGAAGTAATGTACTAGTTTGTGACAATTAACAAGATACAAAAGAGATGCCGATACTAATACGTAAATAGCTATACGCGAATCCATTGTTACCTTTTTTTATTTCATAGGTCTATTAATAAATATATGTATTACTTAAGACTAGAAAAATCAAAAGTGAGTTTTTGATATTTGATTCTTACTTATTGTGGGATTGTAGTTTACTTAGTAATTCATCTCTGAATCCTGATAAATCATGCATATCAATGATGCAACTACGCAGCAAACTAGTAGGAATATAGATATCTGGATATGTACGTAAATAGTCGATTATATCTTTTACAATACTATTAGTCCCTATTGCGTTATCTATATATCCATTAATAATATTACACAGTGGATACTTATGAGAAATATACCTCTTACAGATTTTTAACGATATATAATCTAGAAAGATATGTGTGTAGTACTGTATTACCTAAATTATCAGTCTCATTCAAATATTGCATGACTATTATCGAGAATTGCTATATCCCTCTATACTCGATGCATTTATTACAGTAATTCAATCCAGCTAACATAAGAGCCAATCTCAATGTTGGTTTAATTATATCATCTTCATGTAATAATAACGATGGAAACTTTCCAGTAGCGTAACACTTATCTAAGAAGGATATAATAACTATGTCTACATTATGTCTCTTATCGAGAATATTCTTAACGAGATATCCATAGCTATTCTGGTGCTAATTATTCCTATATTATATTCCACGAAAAATGATGAAGGCAATCATTCATCATAAGATGATAAAAAGTGTAGTGAGTAAGAGTATTAGTGAGAGAGCATGAAGGAGATTTAGTATTTAGCAGTGAGGATATGATCCAAGAGGGTGAGATAGTCGTTCTCGTTCAGAATCTTTCGCAGCATAAGTAGTATGTCGATATACTTATCATTGAAGACTCTTCCAGTGACAATAGCTGATTGAGTACAAAGTCCAATTATTGCACAAAGTTCTTTGGCGGTTTTCATGGAGTCATTTCTGATGAAACATTTAATGATCTCCACGCAATTGTCGATATTGTCCCACGGAAGTGAATCCGAGAACTCCTTCAACTCGCTACCAAATAGCTCCATTGCATCAATTCTGAAAGAGATGAGAAGCCTGTAGAGAGGCCCTGCGCTTTCTCTATGGGTCCATCTATGAGAAACCCACAGGATGTATTCAGTCAGACAATGTCTGACATCAGTCACGGTATTCAGGGAGTCCTTAGTAGCGTGGCAATGACAGGGACTGAACTGGGCACAAGGAGAGGCCATTGTGAAGGTAGACGAAGGTAACCTGATGGTAGACCTGTAGCCGTCTGTGCTTAATAGAGGGCTTTAATTTCCATTTTTAATGGTGTCGTGAATGAGGAATGAGAGTGTCTCTCGTCCTTGGTTTACATGGATCAGAGTGAGAAAAAATATCTTGTATATTATTAACTAACAACCTTGGTTTCTATCCATGTTTAAAAAATGACCTATATGTTCTTTATTAATTCTATTTTAAACTTTATCCTCAAGACTCCTGACAAAATTAAAATCCAGAAAGCAGCAAACAATCCTGTTACAAGTTTACTGAAATCTCTCTTTGATTGTAGAGTATATGTAGTCAGAGCAAGAAACACTGCAGTAGTCAACATGAAAGCTTGCATAACGATACGTGCATCATAGAAAGTAACAACAGAGGCCAGCGTTAGAGATTCTAACAGTGTAAATCCACAAAGTATGTACAGATTCAGGGGATGTTCATGTCTGTGTAAAGTCAATGCGAAAATCAAGCCTATAGATCCGAACATTGATGCCAATATTAGAACAGGACTCCCTTGTATAAATGTCCGATGCATTCAAAGTATAAAAATACTGCAGCTGTTGCCGTTGTTAAAGGAAATTGTAGAAAGGATACCGTAGACTTTTCTTAGAAATGCCATTCGTATGTACACGCTGGCAGACGCCACCGAGCTGTCATAGTTGAAGTCGTCCTCGATA

CATCAATATAAATAAAATAATTATTCCTTACATCGTACCCATCAATATAAATAAAATAATTATTCCTTACATCGTACCCATCAATATAAATAAAATAATTATTCCTTACATCGTACCC

TCGGTCCATGTCTCCATTGCTACACCACATTAGATTTACAGGCTGTTAGTTGTCGTTCGAGATCAGAAATACGTGTTTTCTTGGAATGGATTTCGTCGATGTACTTGTCATGATTGGCATCGAAACACTTATTAAGTTCTTTTTTTCAATTCTACGATTTTATTTCTTTCGCGAGTCAATTCCCTCCTATAGTAACTATCAGTTTTGTCAGATTCACGCTCTCTACGTAGACTTTCTTGCAAGTTACTAATTTGTTCCCTGGCATTACCGAGTTCAGTTTTATATGCCGAATAGAGTTCTGATTCATCCTTTGAGAAGATCTCTAGCGATCGTTCAAGATCCCTGATTCTAGTCTTTAGCCTATTTACCTCCTCAGAAGATGCTCCGTTACCGTTTTTACAATCGTTAAGATGTCTATCAAGATCCATGATTCTATCTCTTTTCCATATCAG

TACTGACTACATGTACTATTTTACATTACTACATTGGCTACGGTATATACCTACTTCGTCACTTCCACACGCTCCAGTAAACGGGTGTCATGTGACGAGGGAGAATCTTGATAAGAGGCATAATCAATGTTGTAATCCGGTGTCCACCTGGAGAATTTGCCAAGGTCAGATGTAGTTGGTAGTGATAACACAAAATGTGAACACTGCCCACCTCATACATATACCGCAATCCCCAATTATTCTAATAGATGTCATNNNNNNNNNAAATGCCCAACAGGATCATTTGATAAGGTAAAGTGTACCGGAACACAGAACAAATGTTCGTGTCATCCTGGTTGGTATACGCTACTGATTCTTCACAGACTGAAGATTGTCGAGATTTGTGTACCAAAAAAGGAGATGTCCATGCGGATACTTTGGTGGAATAGATGAAGGAAATCCTATTTGTAAATCGTGTTGTGTTGGTGAATATTGCGACTACCTACGTAATTATAGACTTGATCCATTTCCTCCATGCAACCTATCTATCTAAATGTAATTAATTATGATTTTGATGATAATGTTACCATACATTATATCGCTACTTGGTTAGTGTGTATTATTCAGTATGGAAGACCTATTAATAATTACTTATCTTTTGACGATCTTGTTATAATTATAATATAAAAATACTTATGACATAGTAACAGTAACTCATAATTGCTGACGCGATAAATTCGTAATAATCTGTTTTGTTCAAATTTTTATAAGGAATCTACAGGCATAAAAATAAAAATATAATCTATAATATACTCTTACAACGCCATCATGAATAGCAGTGAATTAATTGCTGTTATTATGGATTTAGAAATAGTGGACGATTTTGTGATATTAATATAGTTATTAATGATGAAAGGATAAACGCTCATAGATTCATCCTATCTGGAGCCTCCGAATATTTTTTCCATTCTGTTTTCCAATAATTTTATCGATTCTAATGAATACGAAGTTAATCTAAGTCATTTAGATTATCAAAGTGTTAACTATTTGATCGATTACATTTATGGGATACCTTTGAGCCTAACTAACGATAACGTGAAATATATTCTTTCAACCGCTGATTTTTTTACAAATTGGATCTGCCATTACTGAGTGCGAAAAATACATACTTAAAAATCTTTGTTTTAGAAACTGTATCGATTTCTACATATACGCTGATAAATATAATAACAAGAAAATAGAATTAGCATCGTTTAACACAATATTACGAAATATTTTGAGACTCATCAACAATGAAAACTTTAAATACTTAACAGAGGAATCAATGATATGTTATATATAAAAAATGAGGATTTCACCCCACTGATTCTCATTAAATGGTTAGAGAGTACACCAACCATGTACCGTCGAGTTACTTAGATGCCTCAGAATATCATTTCTTTCCCCACAAGTTATAAAATCACTTTATAGTCATCGACTGGTTAGTTCAATCTACGAATGTATAACATTCTTAAACAATATAGCATTCTTGGATAAATCATTTCCTAGATACCATATCATCGAGTTGATATCTATCGGTATAAGTAATTCACATGATAAGATTTCCATAAACTGCTACAATCATAAAAAAATTCATGGGAAATGATATCTTCACGTAGATGGTGTAGTTTCGCAGTGACCGTCCTGGATAATATTATCTATATGATGGGTGGATATGATCAGTCCCTGTATAGAAGTTCAAAGGTTATAGCGTACAATACATGTACTAATTCTTGGATATATGATATACCAGAGCTAAAATATCCTCGTTCTAATTGCGGAGGAGTTGCCAATGACGAATACATTTATTGTATAGGCGGTATACGCGATCAGGAGTCATCGTTGATATCTAGTATCGATAGATGGAAGCCATCAAAACCATATTGGCAGAAGTATGCTAAAATGTGCGAACCAAAATGTGATATGGGGTTGCGATTTTAAACGGATTAATATATGTCATAGGTGGAGTCGTTAAAGGTGACACACATGTACCGACGCACTAGAGAGTTTATCAGAAGATGGATGGATGAATCATCAACGTCTTCCAATAAAAATGTCCAATATGTCGACGATTGTTCATGCTGGAAAGATTTATATATCTGGAGGTTACAACAATAGTAGTGTAGTTAATGTAATATCGAATCTAGAGTCCTTAGCTATAATCCGATATATGATGAATGGACCAAATTATCATCATTAAATATTCCTAGAATTAATCCTGCTCTAT

附件5 两种致癌蛋白质

猴痘病毒基因2001至2022变异研究报告

蛋白1:

https://www.ncbi.nlm.nih.gov/Structure/cdd/cddsrv.cgi?ascbin=8&maxaln=10&seltype=2&uid=cl22855

猴痘病毒基因2001至2022变异研究报告

蛋白2:

https://www.ncbi.nlm.nih.gov/Structure/cdd/cddsrv.cgi?ascbin=8&maxaln=10&seltype=2&uid=cl00473

猴痘病毒基因2001至2022变异研究报告

展开阅读全文

页面更新:2024-05-07

标签:基因   引物   碱基   病毒   阈值   完整版   序列   样本   蛋白质   截图   蛋白   附件   完整   两个   工具

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top