R语言因子实验设计和解释案例分析报告 附代码数据

更新时间:2024-01-18 19:10:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

【原创】R语言报告论文(附代码数据) 有问题到淘宝找“大数据部落”就可以了

R语言因子实验设计和解释案例分析报告

?示例1:两组比较 ?示例2:多个组

实例3:两个条件,两个基因型,一个交互项 o野生型治疗效果(主效应)。 o突变体治疗的效果

o没有治疗的突变型和野生型之间有什么区别? o通过治疗,突变型和野生型有什么区别? o基因型的不同反应(相互作用项) 实例4:两个条件,三个基因型 o基因型I的条件效应(主效应) o基因型III的条件效应。 o基因型II的条件效应。 o在条件A下III与II的影响

o基因型III与基因型I的条件效应的相互作用项 ○基因型III与基因型II的条件效应的相互作用项。

为了允许iDEP中的复杂模型(http://ge-lab.org/idep/),我尝试了解如何构建事实模型,并从DESeq2中提取期望的结果。以下是基于DESeq2中resutls()函数的帮助文档,以及Mike Love对用户提问的回答。

我想要做的一个重点是,当研究设计涉及多个因素时(参见上面关于基因型+治疗实例的图),结果的解释是棘手的。与R中的回归分析类似,分类因素的参考水平构成了我们的分歧的基础。然而,默认情况下,它们是按字母顺序确定的。选择每个因素的参考水平是至关重要的。否则你的系数可能会有所不同,这取决于你如何进入DESeq2的实验设计。这可以通过R中的relevel()函数完成。参考级别是构成有意义比较基础的因素的基线级别。在野生型与突变型实验中,“野生型”是参考水平。在治疗与未治疗,参考水平显然是未经处理的。例3中的更多细节。

【原创】R语言报告论文(附代码数据) 有问题到淘宝找“大数据部落”就可以了

例1:两组比较

首先制作一些示例数据。

library(DESeq2) dds<-makeExampleDESeqDataSet(n=10000,m=6) assay(dds)[1:10,] ## sample1 sample2 sample3 sample4 sample5 sample6 ## gene1 6 4 11 1 2 13 ## gene2 9 12 23 13 14 28 ## gene3 58 121 173 178 118 97 ## gene4 0 4 0 3 8 3 ## gene5 27 3 6 9 8 12 ## gene6 48 8 35 38 21 13 ## gene7 36 50 61 52 44 22 ## gene8 6 8 16 14 18 19 ## gene9 214 266 419 198 157 166 ## gene10 20 12 16 12 16 2 这是一个非常简单的实验设计,有两个条件。

colData(dds) ## DataFrame with 6 rows and 1 column ## condition ## ## sample1 A ## sample2 A ## sample3 A ## sample4 B ## sample5 B ## sample6 B dds<-DESeq(dds) resultsNames(dds) ## [1] \ 这显示了可用的结果。 请注意,默认情况下,R会根据字母顺序为因素选择一个参考级别。 这里A是参考水平。 折叠变化定义为B与A比较。要更改参考级别,请尝试使用“同一个”()函数。

【原创】R语言报告论文(附代码数据) 有问题到淘宝找“大数据部落”就可以了

res<-results(dds, contrast=c(\,\,\)) res<-res[order(res$padj),] library(knitr) kable(res[1:5,-(3:4)]) gene9056 gene3087 gene3763 gene2054 gene4617

baseMean 360.168909 43.897516 72.409877 322.494963 6.227415

log2FoldChange

-2.045379 -2.203303 -1.834787 1.537408 6.125238

pvalue 0.0000000 0.0000173 0.0000434 0.0000681 0.0002019

padj 0.0001366 0.0858143 0.1434712 0.1689463 0.4008408

如果我们想用B作为控制,并用B作为基线定义倍数变化。 那我们可以这样做:

res<-results(dds, contrast=c(\,\,\)) ix=which.min(res$padj) res<-res[order(res$padj),] kable(res[1:5,-(3:4)]) gene9056 gene3087 gene3763 gene2054 gene4617

baseMean 360.168909 43.897516 72.409877 322.494963 6.227415

log2FoldChange

2.045379 2.203303 1.834787 -1.537408 -6.125238

pvalue 0.0000000 0.0000173 0.0000434 0.0000681 0.0002019

padj 0.0001366 0.0858143 0.1434712 0.1689463 0.4008408

正如你所看到的,折叠的方向是完全相反的。 这里我们展示最重要的基因。

barplot(assay(dds)[ix,],las=2, main=rownames(dds)[ix])

【原创】R语言报告论文(附代码数据) 有问题到淘宝找“大数据部落”就可以了

示例2:多个组

假设我们有三个组A,B和C.

dds<-makeExampleDESeqDataSet(n=100,m=6) dds$condition<-factor(c(\,\,\,\,\,\)) dds<-DESeq(dds) res=results(dds, contrast=c(\,\,\)) res<-res[order(res$padj),] kable(res[1:5,-(3:4)])

gene2 gene20 gene34 gene35 gene41

baseMean 3.634986 4.678176 56.068672 537.847175 93.967810

log2FoldChange

-5.101773 -4.490982 -1.462155 -1.177240 1.064734

pvalue 0.0348679 0.0445664 0.0167820 0.0087913 0.0412034

padj 0.5515088 0.5515088 0.5515088 0.5515088 0.5515088

本文来源:https://www.bwwdw.com/article/cp5o.html

Top