基于医学语义分析、生物医学知识库、医学文本挖掘和本体推理,研究开发针对寻找特异性疾病和药物的队列人群及其对照队列人群的快速搜索、匹配引擎;基于分布式计算框架,研究开发针对医疗大数据的个人健康档案疾病/药物结构注释引擎。
系统说明:PCAN为核心的分析工具,通过结合clinVar, OMIM, MedGen, Human Phenotype Ontology (HPO)和 Orphanet数据库,利用表型语义相似一致性来评估基因和罕见疾病表型特征之间的关系,与HPO语义分析不同的是,此工具由预测蛋白质相互作用(STRING 8)模块, 信号通路和HPO三个重要元素建立的网络模型,解释基因是否与特定罕见疾病特征相关以及基因与疾病特征中的优先级关系。GPR系统通过对PCAN算法做进一步提升和展示。首先,由于PCAN需要使用者安装并熟练使用R,友好的操作界面是必不可少的。其次,从原来只能由单个基因与多个表型进行分析上升到由多个基因与多个表型进行分析从而满足当前实际操作中用户的需求,并建立便捷的结果提取和展示界面,为基于语义的基因-表型分析提供便利的平台。
针对哪些问题
1.基于父母的遗传信息筛选出大量隐性遗传突变,需要通过基因和表型的关联做进一步的分析诊断。
2.通过诊断指标筛选后对某罕见疾病得出基因突变优先级关系后,仍无法判断对于同一个基因内的其他突变哪一个会导致类似的表型。
3.已经运用HPO语义相似性分析,发现实际罕见病与基因的关系与数据库中的不符。
分析说明:
1、通过输入表型,对数据库中的基因进行关联分析
2、分析结果
Plot中展示不同相似度下的基因数目分布情况
Table 1显示所有基因对应的表型相似度值(如果没有提供CSV文件)。
Table 2仅显示CSV文件中基因信息,如果发现某些缺失,代表该基因与对应表型没有关联。
技术开发
生物医学大数据平台
生物医学数据挖掘
临床精准医疗技术
联系我们
地址:上海市静安区北京西路1400弄24号
邮编:200020
电话:021-62797512