V
主页
【生信】基因表达差异分析
发布人
代码: # 设置输入和输出文件路径 input_file1 <- "C:/Users/SH/Desktop/R/GPL570-55999.txt" input_file2 <- "C:/Users/SH/Desktop/R/GSE43346-GPL570_series_matrix.txt" output_file <- "C:/Users/SH/Desktop/R/GSE43346-GPL570_series_matrix_with_symbol.txt" # 读取GPL570-55999文件 data1 <- read.delim(input_file1, sep="\t", header=TRUE) # 提取ID和Gene Symbol的对应关系 id_gene_map <- data.frame(ID_REF = data1$ID, Gene_Symbol = data1$`Gene.Symbol`) # 读取GSE43346-GPL570_series_matrix文件 data2 <- read.delim(input_file2, sep="\t", header=TRUE) # 将Gene Symbol添加到GSE43346-GPL570_series_matrix数据框中 data2_with_symbol <- merge(data2, id_gene_map, by.x="ID_REF", by.y="ID_REF", all.x=TRUE) # 写入包含Gene Symbol的新文件 write.table(data2_with_symbol, file=output_file, sep="\t", quote=FALSE, row.names=FALSE) # 设置工作目录 setwd("C:/Users/SH/Desktop/R") # 读取数据 data <- read.table("GSE43346-GPL570_series_matrix_with_symbol.txt", header = TRUE, sep = "\t", stringsAsFactors = FALSE) # 将第一行的样本分为两组:正常组织样本和肿瘤组织样本 normal_samples <- c("GSM1060726", "GSM1060727", "GSM1060728", "GSM1060729", "GSM1060730", "GSM1060731", "GSM1060732", ) cancer_samples <- c("GSM1060768", "GSM1060769", "GSM1060770", "GSM1060772", "GSM1060773", ) # 提取ID_REF和Gene_Symbol列以及两组样本的表达数据 gene_expr <- data[, c("ID_REF", "Gene_Symbol", normal_samples, cancer_samples)] # 创建设计矩阵 design <- model.matrix(~0 + factor(c(rep("Normal", length(normal_samples)), rep("Cancer", length(cancer_samples))))) # 为设计矩阵添加合适的列名 colnames(design) <- c("Normal", "Cancer") # 进行线性模型拟合 library("limma") fit <- lmFit(gene_expr[, -c(1, 2)], design) # 进行差异分析并计算FDR值 fit <- eBayes(fit) results <- topTable(fit, coef = "Cancer", number = nrow(gene_expr), sort.by = "t", adjust.method = "fdr") # 将基因名称添加到结果中 gene_data <- data.frame(ID_REF = rownames(results), Gene_Symbol = data$Gene_Symbol) sorted_results <- cbind(gene_data, results) # 输出结果到新文件 output_file <- "C:/Users/SH/Desktop/R/sorted_results.txt" write.table(sorted_results, file = output_file, sep = "\t", quote = FALSE, row.names = FALSE)
打开封面
下载高清视频
观看高清视频
视频下载器
【数据处理】GO、KEGG富集分析(DAVID)
【生信分析复现04】差异分析及分子蛋白互作网络图实现
【数据处理】GO、KEGG富集分析(R)
【AlphaFold 3】预测蛋白质、DNA、RNA、配体的结构和相互作用
【数据库】相关性分析-找出与目的基因A表达呈正/负相关的基因BCD
集思大讲堂丨植物基因功能研究的整体实验思路及常见的技术方法
华哥 2024空间转录组CNS文章数据分析方法(生信基础)
【数据处理】用Graphpad计算IC10、IC90
15(附代码)GSEA功能富集分析精讲,带你零基础一键完成GSEA功能富集分析
胰腺癌3-数据可视化及美化
autodock分子对接教程-软件的安装
BulkRNA差异分析-火山图-热图绘制
R语言入门02R和Rstudio介绍
胰腺癌4-基因集打分与临床信息的热图展现
R语言入门07文件读取和保存
胰腺癌5-上皮细胞细分详解
R语言入门12类型判断和转换
R语言入门10数据框
【数据处理】药物相互作用(SynergyFinder)
不会写生信的都后悔没早点用它
(地区字形差异)盘点不同地区的地区字形差异!#2
R语言入门03R和Rstudio安装
区分双胞胎差异及取象
【数据处理】细胞周期实验(flowjo)
72肿瘤中单基因差异分析的箱线图
【数据处理】GSEA分析(Preranked)
单细胞结合转录组文献复现
肿瘤药敏分析(计算出来的是IC50)
胰腺癌6-T细胞细分
生信分析文献带读,手把手演示如何复现一篇5分SCI😁
生信的分析方法可以照搬去做孟德尔随机化吗?
R语言入门01课程介绍
男女的表达差异有多大?一个现在时 一个将来时。
【统计分析】重复测量资料的方差分析 组间多重比较 多个时间点不同药物的疗效(SPSS)
R语言入门16实用技巧
中医药方向怎么发SCI?分子对接OUT了,快来学分子动力学模拟!
吴恩达同步更新AI专业课,第53讲:Data Engineering 数据工程。吴恩达AI最新specialization 课程
不要再去报GPT培训班了!跟着Nature一次学会GPT怎么用!(本文含提示词框架(prompt))#医学生 #医生 #临床医学 #医学SCI #AI
【爬虫实战—小红书】Python爬取小红书搜索关键词下面的所有笔记的内容、点赞数量、评论数量等数据,保姆级教程,零基础也能学会!!(附源码)
单细胞结合转录组文章复现—细胞注释