【生信】基因表达差异分析

发布人

代码：

# 设置输入和输出文件路径
input_file1 &lt;- &quot;C:/Users/SH/Desktop/R/GPL570-55999.txt&quot;
input_file2 &lt;- &quot;C:/Users/SH/Desktop/R/GSE43346-GPL570_series_matrix.txt&quot;
output_file &lt;- &quot;C:/Users/SH/Desktop/R/GSE43346-GPL570_series_matrix_with_symbol.txt&quot;

# 读取GPL570-55999文件
data1 &lt;- read.delim(input_file1, sep=&quot;\t&quot;, header=TRUE)

# 提取ID和Gene Symbol的对应关系
id_gene_map &lt;- data.frame(ID_REF = data1$ID, Gene_Symbol = data1$`Gene.Symbol`)

# 读取GSE43346-GPL570_series_matrix文件
data2 &lt;- read.delim(input_file2, sep=&quot;\t&quot;, header=TRUE)

# 将Gene Symbol添加到GSE43346-GPL570_series_matrix数据框中
data2_with_symbol &lt;- merge(data2, id_gene_map, by.x=&quot;ID_REF&quot;, by.y=&quot;ID_REF&quot;, all.x=TRUE)

# 写入包含Gene Symbol的新文件
write.table(data2_with_symbol, file=output_file, sep=&quot;\t&quot;, quote=FALSE, row.names=FALSE)


# 设置工作目录
setwd(&quot;C:/Users/SH/Desktop/R&quot;)

# 读取数据
data &lt;- read.table(&quot;GSE43346-GPL570_series_matrix_with_symbol.txt&quot;, header = TRUE, sep = &quot;\t&quot;, stringsAsFactors = FALSE)

# 将第一行的样本分为两组：正常组织样本和肿瘤组织样本
normal_samples &lt;- c(&quot;GSM1060726&quot;, &quot;GSM1060727&quot;, &quot;GSM1060728&quot;, &quot;GSM1060729&quot;, &quot;GSM1060730&quot;, &quot;GSM1060731&quot;, &quot;GSM1060732&quot;, )
cancer_samples &lt;- c(&quot;GSM1060768&quot;, &quot;GSM1060769&quot;, &quot;GSM1060770&quot;, &quot;GSM1060772&quot;, &quot;GSM1060773&quot;, )

# 提取ID_REF和Gene_Symbol列以及两组样本的表达数据
gene_expr &lt;- data[, c(&quot;ID_REF&quot;, &quot;Gene_Symbol&quot;, normal_samples, cancer_samples)]

# 创建设计矩阵
design &lt;- model.matrix(~0 + factor(c(rep(&quot;Normal&quot;, length(normal_samples)), rep(&quot;Cancer&quot;, length(cancer_samples)))))

# 为设计矩阵添加合适的列名
colnames(design) &lt;- c(&quot;Normal&quot;, &quot;Cancer&quot;)

# 进行线性模型拟合
library(&quot;limma&quot;)
fit &lt;- lmFit(gene_expr[, -c(1, 2)], design)

# 进行差异分析并计算FDR值
fit &lt;- eBayes(fit)
results &lt;- topTable(fit, coef = &quot;Cancer&quot;, number = nrow(gene_expr), sort.by = &quot;t&quot;, adjust.method = &quot;fdr&quot;)

# 将基因名称添加到结果中
gene_data &lt;- data.frame(ID_REF = rownames(results), Gene_Symbol = data$Gene_Symbol)
sorted_results &lt;- cbind(gene_data, results)

# 输出结果到新文件
output_file &lt;- &quot;C:/Users/SH/Desktop/R/sorted_results.txt&quot;
write.table(sorted_results, file = output_file, sep = &quot;\t&quot;, quote = FALSE, row.names = FALSE)

打开封面下载高清视频观看高清视频视频下载器

【生信】基因表达差异分析

【数据处理】GO、KEGG富集分析（DAVID）

【生信分析复现04】差异分析及分子蛋白互作网络图实现

【数据处理】GO、KEGG富集分析（R)

【AlphaFold 3】预测蛋白质、DNA、RNA、配体的结构和相互作用

【数据库】相关性分析-找出与目的基因A表达呈正/负相关的基因BCD

集思大讲堂丨植物基因功能研究的整体实验思路及常见的技术方法

华哥 2024空间转录组CNS文章数据分析方法（生信基础）

【数据处理】用Graphpad计算IC10、IC90

15(附代码)GSEA功能富集分析精讲，带你零基础一键完成GSEA功能富集分析

胰腺癌3-数据可视化及美化

autodock分子对接教程-软件的安装

BulkRNA差异分析-火山图-热图绘制

R语言入门02R和Rstudio介绍

胰腺癌4-基因集打分与临床信息的热图展现

R语言入门07文件读取和保存

胰腺癌5-上皮细胞细分详解

R语言入门12类型判断和转换

R语言入门10数据框

【数据处理】药物相互作用（SynergyFinder）

不会写生信的都后悔没早点用它

（地区字形差异）盘点不同地区的地区字形差异！#2

R语言入门03R和Rstudio安装

区分双胞胎差异及取象

【数据处理】细胞周期实验（flowjo）

72肿瘤中单基因差异分析的箱线图

【数据处理】GSEA分析（Preranked）

单细胞结合转录组文献复现

肿瘤药敏分析（计算出来的是IC50）

胰腺癌6-T细胞细分

生信分析文献带读，手把手演示如何复现一篇5分SCI😁

生信的分析方法可以照搬去做孟德尔随机化吗？

R语言入门01课程介绍

男女的表达差异有多大？一个现在时 一个将来时。

【统计分析】重复测量资料的方差分析 组间多重比较 多个时间点不同药物的疗效（SPSS）

R语言入门16实用技巧

中医药方向怎么发SCI？分子对接OUT了，快来学分子动力学模拟！

吴恩达同步更新AI专业课，第53讲：Data Engineering 数据工程。吴恩达AI最新specialization 课程

不要再去报GPT培训班了！跟着Nature一次学会GPT怎么用！（本文含提示词框架（prompt)）#医学生 #医生 #临床医学 #医学SCI #AI

【爬虫实战—小红书】Python爬取小红书搜索关键词下面的所有笔记的内容、点赞数量、评论数量等数据，保姆级教程，零基础也能学会！！（附源码）

单细胞结合转录组文章复现—细胞注释

男女的表达差异有多大？一个现在时一个将来时。

【统计分析】重复测量资料的方差分析组间多重比较多个时间点不同药物的疗效（SPSS）