R语言GSEA函数which(ex$SYMB=="IGL")

数据库版本:MSigDB database v7.2 updated September 2020.


R语言GSEA函数which(ex$SYMB==


GSEA分析,数据很泛滥。需要更加细化的评价和研究标准。

很显然,GSEA分析已经将近有20年的历史,但是其核心计算方案却未见进一步细化;gene set远比之前多了很多。

理论上用一部分的gene表达谱数据、用差异分析的结果数据,也可以和GSEA的gene set 或者是自己定义的gene set进行比对得到合适的GSEA 结果。

最近随便找了一个数据,单纯的用KEGG并且卡号qvalue值的话,数据量有限。但是用GSEA,能够enrichment出很多的基因集。无疑让这个所谓的GSEA研究显得华而不实。因各种gene set 显得非常随意。一个芯片数据,分开两组(随便分,即便不按照原来的分组进行分)也可以聚集到一万多条GSEA数据。(这些数据都是P<.05并且同时q.value pvalue p.adjust qvalues 均小于0.05的。如此多的GSEA数据,可能是生物本来就是万千复杂的。但是对于从这么多的数据中找到符合你研究目的的,或者说是与你的表型相关的数据,还需要更多的研判标准。

当然,如果已经知道了某些通路,另外如果只是为了发现差异表达基因的上调或者下调通路的,那也未尝不可。


R语言GSEA函数which(ex$SYMB==


用了全部的芯片数据,正好是1.3.5,而且明显5应该有的;但是没有enriched。说明enriching的过程是有问题的。用的是下载好entrezid,NCBI (Entrez) Gene IDs。

坐久脖子酸;大部分中国人都在按照目前的规定、条件活着。但是很显然,有时努力没有意义。就如用另外的方法直接可以GO到非常多的结果,400多条;但是用这个C5,结果却是no term,努力用错了地方,也是白搭。

不管你能力多大,一旦方向错了,毫无意义

最可怕的是,力用错了方向


GSE.SET.C1,C3,C5no term enriched under specific pvalueCutoff 没有none gene

C1是染色体和gene location;C3是小RNA基因集;Gene sets representing potential targets of regulation by transcription factors or microRNAs. The sets consist of genes grouped by elements they share in their non-protein coding regions. The elements represent known or likely cis-regulatory elements in promoters and 3'-UTRs. The C3 collection is pided into two sub-collections: microRNA targets (MIR) and transcription factor targets (TFT). details

C5

R语言GSEA函数which(ex$SYMB==

C2是KEGG通路等;

其余hall,C^^^^^8都gsea 成功set。enticing

http://www.gsea-msigdb.org/gsea/msigdb/cards/GSE18791_UNSTIM_VS_NEWCATSLE_VIRUS_DC_2H_UP.html

The dendritic cell (DC) is a master regulator of immune responses. Pathogenic viruses subvert normal immune function in DCs through the expression of immune antagonists. Understanding how these antagonists interact with the host immune system requires knowledge of the underlying genetic regulatory network that operates during an uninhibited antiviral response. In order to isolate and identify this network, we studied DCs infected with Newcastle Disease Virus (NDV), which is able to stimulate innate immunity and DC maturation through activation of RIG-I signaling, but lacks the ability to evade the human interferon response. To analyze this experimental model, we developed a new approach integrating genome-wide expression kinetics and time-dependent promoter analysis. We found that the genetic program underlying the antiviral cell state transition during the first 18-hours post-infection could be explained by a single regulatory network. Gene expression changes were driven by a step-wise multi-factor cascading control mechanism, where the specific transcription factors controlling expression changed over time. Within this network, most inpidual genes are regulated by multiple factors, indicating robustness against virus-encoded immune evasion genes. In addition to effectively recapitulating current biological knowledge, we predicted, and validated experimentally, antiviral roles for several novel transcription factors. More generally, our results show how a genetic program can be temporally controlled through a single regulatory network to achieve the large-scale genetic reprogramming characteristic of cell state transitions.

C3有3556条小MRA

R语言GSEA函数which(ex$SYMB==

C4 基因集比较小点

R语言GSEA函数which(ex$SYMB==

C5 则有1.5万条GSEA(如果真有基因表达谱无法在C5这里富集到,那简直就是不可思议,1.5万条的富集集合,可能比很多研究的去重后的基因数量还多。这种基因集中的研究里,不可以预料的是,水分很多,但是这也是研究到现在这个时代的不可避免的客观情况。)


R语言GSEA函数which(ex$SYMB==

鱼龙混杂,一叶障目不见泰山。

生物研究的复杂性,已经超越了以往。每年的数据量都在翻倍。如果一个人三年不接触最新的生物研究动态,就会与时代脱钩。

而GSEA这种研究方法,已经崩腾了近20年,是需要一个革命了。

期望国内的一些科学家能够脱颖而出,找到一个新的更加客观真实的研究方法。

毕竟这个GSEA的基因集也太多了。根本不是人力能够弄明白的。富集后的通路上万条,那根本不可能高明白,表型到底哪些GSEA才是最重要的。单纯的看统计学的值,已经缺乏了意义。

GSEA研究,是个坑,也是一个装水的好东西。

展开阅读全文

页面更新:2024-04-19

标签:表型   目的   华而不实   基因   函数   芯片   客观   差异   随便   意义   方向   努力   语言   生物   标准   方法   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top