分享
整合多维组学数据鉴定登革热...生物分子标记及潜在治疗药物_徐琪.pdf
下载文档

ID:2724195

大小:2.30MB

页数:9页

格式:PDF

时间:2023-10-12

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
整合 多维 数据 鉴定 登革热 生物 分子 标记 潜在 治疗 药物 徐琪
Hainan Med J,Feb.2023.Vol.34,No.4海南医学2023年2月第34卷第4期整合多维组学数据鉴定登革热感染关键生物分子标记及潜在治疗药物徐琪,谢树仁,王嘉琪,才让杰,黄佳雨,陈强,张娅,李永生海南医学院生物医学信息与工程学院,海南海口571199【摘要】目的基于多维组学大数据识别登革热感染相关的生物分子标记,探究登革热感染与人类其他复杂疾病的关系并识别潜在的治疗药物。方法首先从Gene Expression Omnibus(GEO)数据库中搜集登革热感染相关的基因表达谱数据,共涉及170例样本,包括47例正常和123例登革热感染样本。进一步基于Limma包识别登革热感染相关的差异表达基因,再使用RobustRankAggreg整合多个数据集获得稳健的生物分子标记;然后结合人类蛋白质互作网络并基于随机游走模型优选登革热感染相关分子标记。通过功能富集分析预测生物分子标记的功能;最后基于网络拓扑分析识别登革热感染和人类复杂疾病间的关联,并优选潜在的登革热感染治疗药物。结果基于多维数据整合分析,共鉴定出2 977个稳健的登革热感染相关基因,包括1 318个上调基因和1 659个下调基因(FDR0.01)。以共同差异表达的1 762个基因作为种子,基于随机游走模型优选登革热感染相关的分子标记,识别了包括TP53等在内的关键生物分子标记。通过功能分析发现优选的生物分子标记主要参与了细胞周期、DNA复制等分子通路。网络分析发现登革热感染相关基因在蛋白质互作网络中起着关键作用,病毒倾向于靶向互作网络的核心区域。基于网络邻近度分析,发现登革热感染与免疫疾病、消化系统肿瘤等密切相关。最后,基于网络分析优选了潜在的登革热感染治疗药物,包括胆茶碱、替诺西康和阿西美辛等。结论整合多维大数据可以识别登革热感染相关生物分子标记,并揭示病毒感染与其他复杂疾病的关联及潜在的治疗药物。【关键词】登革热感染;生物大数据;整合分析;网络分析;疾病关联;潜在药物【中图分类号】R512.8【文献标识码】A【文章编号】10036350(2023)04047509Identification of key biomarkers and potential therapeutic agents for dengue by integrating multi-omics data.XUQi,XIE Shu-ren,WANG Jia-qi,CHAI Rang-jie,HUANG Jia-yu,CHEN Qiang,ZHANG Ya,LI Yong-sheng.College ofBiomedical Information and Engineering,Hainan Medical University,Haikou 571199,Hainan,CHINA【Abstract】ObjectiveTo identify the biomarkers associated with dengue infection,explore the relationshipsbetween dengue infection and other complex diseases,and identify potential therapeutic drugs based on the multi-omicsbig data.MethodsFirstly,dengue infection-related gene expression profile data were collected from Gene ExpressionOmnibus(GEO)database,involving a total of 170 samples,including 47 normal samples and 123 dengue infection sam-ples.Differentially expressed genes associated with dengue infection were identified based on Limma packages and ro-bust biomolecular markers were obtained based on RobustRankAggreg methods.Combining with human protein interac-tion network,dengue infection-related molecular markers were prioritized based on random walk model.The function ofbiomolecular markers was predicted by functional enrichment analysis,and the association between dengue infectionand human complex diseases was identified based on network topology analysis,and potential therapeutic drugs for den-gue infection were selected.ResultsBased on multidimensional data integration analysis,2 977 robust dengue infec-tion-related genes were identified,including 1 318 up-regulated genes and 1 659 down-regulated genes(FDR0.01).Based on the 1 762 genes commonly deferentially expressed as seeds,we prioritized molecular markers related to den-gue infection based on random walk model,and identified key biomolecular markers including TP53.Functional enrich-ment analysis revealed that the biomarkers were mainly involved in molecular pathways such as cell cycle and DNA rep-lication.Network analysis revealed that dengue infection-related genes play a key role in the protein interaction network,and the virus tends to target the core region of the interaction network.Based on network analysis,dengue infection wasidentified to be closely related to immune diseases and digestive system tumors.Finally,potential drugs related to thetreatment of dengue infection were prioritized based on network analysis,including choltheline,tenoxicam,and acime-cine.ConclusionIntegrating multi-omics big data can identify dengue infection-related biomarkers and reveal the as-sociation between infections and other complex diseases as well as potential therapeutic drugs.【Key words】Dengue infection;Biological big data;Integrated analysis;Network analysis;Disease association;Potential drug 论著 doi:10.3969/j.issn.1003-6350.2023.04.004基金项目:海南省重点研发计划(编号:ZDYF2021SHFZ051);大学生创新创业训练计划项目(编号:202111810007)。第一作者:徐琪(1996),女,硕士,研究方向:生物标记物识别。通讯作者:李永生(1985),男,博士,三级教授,研究方向:复杂疾病生物信息学,E-mail:。475海南医学2023年2月第34卷第4期Hainan Med J,Feb.2023.Vol.34,No.4绝大部分传染性疾病源于热带地区,近年来SARS、禽流感、埃博拉、寨卡热的流行和新型冠状病毒感染对人类健康都造成了重大影响1。登革热(den-gue fever)是由登革热病毒感染、伊蚊传播的一种急性传染病,无法直接经过呼吸道、消化道或接触在宿主之间传播。理解宿主-病原体间复杂的关系是开发新的诊断、预防和治疗模型及建立动态防控体系的关键前提。随着高通量测序技术的发展,基于多组学生物大数据已经发现了一些与传染病相关的关键基因及药物靶点。例如,基于外周血的转录组测序,Niko-layeva等2识别了18个基因生物标记能够用于识别严重的登革热患者。Robinson等3通过整合多套基因表达数据识别了20个基因标记物用于预测登革热患者的疾病进展。然而对于登革热感染关键分子标记的识别仍然具有挑战。此外,登革热感染经常会伴随着人类其他复杂疾病的产生,患者治愈后期会有多种并发症。解析登革热感染与人类其他复杂疾病的关系对于登革热感染后期并发症的早期预测具有十分重要的意义。同时,目前已经开发了一些登革热治疗的方法,但是仍然需要新的治疗方案的提出。如何基于多维组学数据整合分析识别新的候选药物也是亟待解决的关键问题之一。本研究通过整合登革热感染相关的多层次信息、挖掘潜在的分子标记,并基于网络分析技术识别登革热感染与其他疾病间的关联,优选潜在的治疗药物,对于登革热感染等疾病的预防和治疗具有重要的理论意义。1资料与方法1.1微阵列芯片数据的获取与预处理首先从GEO和ArrayExpress数据库中共获得了4套登革热感染相关基因表达数据集,如表1所示。通过对芯片数据进行对数化、探针过滤、补缺失值、标准化、探针注释等预处理获得基因表达矩阵。1.2差异表达基因的筛选与整合根据样本分组信息,基于Limma包对数据集进行差异表达分析。首先,输入基因表达矩阵,分组矩阵并构建差异比较矩阵;然后将数据拟合到具有lmFit函数的线性模型;使用contrasts.fit函数根据对比度模型计算差异;进一步使用eBayes函数进行贝叶斯测试;最后针对具有topTable 功 能 的 所 有 基 因 生 成 测 试 结 果,使 用Benjamini和Hochberg矫正方法校正P值。基于阈值FDR0.05,得到各个登革热感染相关数据集的差异表达基因,并绘制对应的火山图与热图。由于实验样本的异质性,使用不同的检测平台和数据处理方法均会导致结果不一致。因此,进一步利用“RobustRankAggreg”4方法将来自不同数据集的分析结果整合,设阈值FDR0.05,fold change1.2,得到整合的差异表达基因。1.3基于随机游走模型优选生物分子标记物随机游走是给定源节点开始从当前节点到随机选择的邻居迭代walker转换5。以RRA整合得到的生物分子标记物中 FDR0.01 的

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开