2024/03/11
TOM(拓扑重叠矩阵)
一、定义
Topological overlap(TO,拓扑重叠):拓扑重叠是通过比较两个节点和网络中其他节点的加权相关性来定量描述节点之间相似性的方法。
Topological overlap matrix(TOM,拓扑重叠矩阵):把邻接矩阵转换为拓扑重叠矩阵,以降低噪音和假相关,获得的新距离矩阵,这个信息可拿来构建网络或绘制TOM图。具体公式为:
Adjacency matrix(邻接矩阵):基因和基因之间的加权相关值构成的矩阵。邻接矩阵由分布在0到1之间的数值组成,用来描述节点间相关性强度,由相关性矩阵根据power值进行次方转化而来。
二、邻接矩阵计算及基本形式
1.邻接矩阵的计算:
利用(共表达值)加权形成的软阈值形成:
2.邻接矩阵的形式:
3.邻接矩阵本身已经可以通过聚类来找出模块。
三、拓扑重叠矩阵
1.为什么还要使用拓扑重叠矩阵?
仅仅通过表达的相关性矩阵,不足于反应体内真实的情况。假如基因1和基因2的表达相关性是0.8,基因2和基因3的表达相关性也是0.8,不能说这两个关系是相等的,因为基因1和基因2之间还有很多共同的基因跟着两个基因建立联系。也就是说,评价两个基因相关性的时候,不能仅仅看这个两个基因的表达相关性,还要考虑跟其他基因之间的相互作用。
2.如何表示相互作用(拓扑重叠)?
考虑以下这个简单的矩阵:
选取A21,也就是第二行第一列的数是2,经过转换成为100:
3.TOM的形式
按此算法对之前的邻接矩阵进行处理,则有以下矩阵:
现在邻接/相关性矩阵(Adjacency Matrix)变成拓扑重叠矩阵(Topology Overlap Matrix)。
通过聚类可以发现有很多branch(分支),即module(模块)。