[图神经网络]图卷积神经网络--GCN
创始人
2025-06-01 03:43:32
0

一、消息传递

        由于图具有“变换不变性”(即图的空间结构改变不会影响图的性状),故不能直接将其输入卷积神经网络。一般采用消息传递(Message pass)的方式来处理。

        消息传递机制通过局部邻域构建计算图实现,即某个节点的属性由其邻居节点来决定。汇聚这些邻居节点信息的工作由神经网络完成,不用人为干预。其形式如下例:

        每个节点都可构建属于自己的计算图,计算图可以表征一个其结构功能角色。 在计算过程中,每个计算图即为一个单独样本。

        需要注意的是,图神经网络的层数并不是神经网络的层数,而是计算图的层数。图神经网络的层数=计算图的层数=图中目标节点的邻居阶数。每一层的节点共享一套计算权重。

                        

         图神经网络的层数 k 可以视为卷积神经网络中的感受野。若 k 过大可能导致过平滑(所有节点输出同一张图)

二、图卷积神经网络

        1.计算单元

                图卷积神经网络基于消息传递方式,一般的计算方法是将邻居节点的属性特征逐元素求平均(与顺序无关,也可以是求最大值/求和),再将这个向量输入到神经元中

        2.数学表示

                k+1层 v 的嵌入是第k层v节点的邻域u计算(邻域u中的节点求和除以节点v连接数),其公式可以写作:

                        h^{(k+1)}_v=\sigma(\omega _k\sum \frac{h^k _u}{N(v)})       式中 \sigma为激活函数,\omega_k为权重

                其中,节点v的第0阶属性特征就是其本身:h_v^{(0)}=x_v

                神经网络输出的嵌入向量为z_v = h_v^K,K为网络的层数

        3.矩阵表示

                ①将k层所有节点的嵌入都记为H^{(k)}H^{(k)}=[h_1^{(k)}...h_{|v|}^{(k)}]^T,即下图中矩阵中的一行

                ②将此矩阵左乘一个邻接矩阵A_v : \sum_{u \in N_v}h_u^{(k)}=A_vH^{(k)} 可挑选出节点v的邻域节点(对应上式中的求和过程)

                ③找到一个矩阵D_v=Deg(v)=|N(v)|,该矩阵为一个由节点连接数构成的对角矩阵,表现为:

                         其逆矩阵即为连接数的倒数:D_v^{-1}=\frac{1}{|N(v)|}

                经过上述步骤,式\sum \frac{h^k _u}{N(v)}即可表示为D^{-1}AH^{(k)}

                但是这样计算的话,由于D^{-1}造成节点v仅会考虑自己的连接数而忽视对方的连接数(不考虑连接的质量,对全部渠道来得信息强行求平均), 可以将式子改进D^{-1}A --> D^{-1}AD^{-1},这样得到的结果是一个对称矩阵,既考虑了自身的连接数也考虑了对方的连接数。

                可改进后的向量幅值会减小,其特征值值域为(-1,1)。对于这种现象,可以继续对式子进行改进D^{-1}AD^{-1} --> D^{-\frac{1}{2}}AD^{-\frac{1}{2}},这样处理后最大特征值等于1。

                最后将此矩阵记为:\tilde{A}=D^{-\frac{1}{2}}AD^{-\frac{1}{2}},在此矩阵中,若两个节点i,j存在连接,则其在矩阵中为\tilde{A}=\frac{1}{\sqrt{d_i}\sqrt{d_j}},可以表示其连接权重(其中d_id_j是节点i和节点j的连接数)

                         矩阵\tilde{A}还可以用来计算拉普拉斯矩阵\xi = 1 - \tilde{A}

                则式子可以列为:h^{(k+1)}_v=\sigma(\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)}),该式即可表示一层GCN;其中可学习参数为权重w^{(l)}

        4.计算图的改进

                上述方式(通过相邻节点描述本节点无法反映节点自身的情况),改进方法为:为每个节点加上指向自己的连接

                 这样改进后,邻接矩阵\tilde{A}即变为\tilde{A}=A+I(原矩阵加上单位阵,对角线全部为1)

                最终神经网络表达式H^{(k+1)}_v=\sigma(\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)})可以写作:

                        H^K_i=\sigma(\sum \frac{\tilde{A_{ij}}}{\sqrt{\tilde{D_{ii}}}\tilde{D_{jj}} }H_j^{k-1}W^k)(一个式子包含了原权重矩阵和单位阵)

                也可拆分写作:

                        H^k_i=\sigma(\sum\frac{A_{ij}}{\sqrt{\tilde{D_{ii}}}\tilde{D_{jj}} }H^{k-1}_jW^k+\frac{1}{\tilde{D_i}}H^{k-1}_iW^k)(前面是对原权重矩阵的变换,后面是对单位矩阵的变换)

                进一步改进则可使用两套权重(汇聚节点信息一套,自循环节点信息一套),写作:

                        H^{(k+1)}_v=\sigma(W_k\sum\frac{h_u^{(k)}}{|N(v)|}+B_kh_v^{(k)})

                        且当B_k=1时,后式变为恒等映射,即为残差连接。

        !!!最终的矩阵简化形式为:H^{(k+1)}=\sigma(\tilde{A}H^{(k)}W_k^T+H^{(k)}B_k^T);其中\tilde{A}=D^{-\frac{1}{2}}AD^{-\frac{1}{2}}

三、GCN的训练

        1.监督学习

                损失函数:min\, l(y,f(z_v)),其中f为分类/回归预测头,y为节点标注信息

                交叉熵损失函数:l=\sum y_vlog(\sigma(z_v^T\theta ))+(1-y_v))log(1-\sigma(z_v^T\theta))

                GCN的输入是图结构,输出也是图结构,但输出的图中的节点嵌入了语义信息;输出结构具备:低维、连续、稠密的特点。

                 嵌入向量可以输入分类头进行分类,将其映射在二维空间上即可发现不同类别的节点在迭代中被分得越来越开

---->​​​​​​​

        2.无监督/自检断学习

                类似于Deepwalk/Node2vec,利用图自身的连接结构,迭代目的是让图中相连的两个结点嵌入的向量尽可能接近

                损失函数:l=\sum CE(y_{u,v},DEC(z_u,z_v)),当y_{u,v}=1时表示两个结点uv相似。

                一般采用“编码器--解码器”架构,由编码器将图嵌入到向量,再由解码器计算两个向量的相似度。

四、GCN的优势

        相较于传统的基于随机游走的机器学习而言

                ①GCN所有计算图共享权重参数量更小

                ②GCN为归纳式学习,拥有较强的泛化能力(可以泛化到新节点乃至新图--迁移学习)

                ③利用了节点的属性特征、结构功能角色和标注信息

                ④拟合学习能力强,得到的嵌入向量质量较高

五、对比CNN、Transformer

        1.与CNN对比

                CNN可以视为一个2层的GCN,卷积汇总了9个邻居节点和目标节点的信息,其数学式亦可被写成:h^{(l+1)}=\sigma(\sum W_l^uh_u^P(l)+B_lh_v^{(l)}),CNN可以被视为一个固定邻域、固定顺序的GCN。

                 但两者之间有以下不同

                        ①CNN不具备变换不变性,打乱像素点的顺序会影响网络的输出。

                        ②GCN的卷积核权重由\tilde{A}预定义,不需要学习。而CNN的权重需要学习得来

        2.与Transformer对比

                Transformer本身是自注意力机制,其训练的目的是让一个序列中的元素之间互相影响。

                 Transformer可以被视为一个全连接词图上的GCN。

相关内容

热门资讯

2025,机器人“铁军”元年:... 文|财华社 2025年末,机器人行业在资本市场的关键一子落定。近日,“人形机器人第一股”优必选(0...
13万亿!巨无霸IPO扎堆今年... 智东西 编译 程茜 编辑 心缘 智东西1月2日报道,昨日,英国《金融时报》援引多位直接知情人士报道,...
开盘涨超82%,港股“国产GP... 智东西 作者 ZeR0 编辑 漠影 智东西1月2日报道,刚刚,上海GPU龙头企业壁仞科技正式在港交所...
视频丨连续两年超1.4万亿斤!... 本文转自【央视新闻客户端】; 今年,全国粮食产量14297.5亿斤,比上年增加167.5亿斤,增长1...
刚刚,中国资产爆发!白银大涨! 12月30日晚间,美股三大指数开盘微幅震荡。贵金属大幅反弹。 美股黄金股、矿业股普涨。截至发稿,金...
人民币,持续走强 2026年伊始,人民币继续走强。1月2日,离岸人民币对美元一度升破6.97,最高升至6.9687,创...
马斯克称脑机设备今年启动“大规... 来源:财联社 世界首富马斯克披露,他的脑机接口公司Neuralink计划在2026年大幅提高脑机设备...
银行没有申请强制执行,保证人的... 为他人的银行贷款提供连带责任保证,在人民法院生效判决确认保证人需要承担连带责任后,银行未在法定期限内...
拿下建材上市公司综合实力百强,... 慧正资讯,近日,《2025全球建筑材料百家上市公司综合实力》榜单在2025年建筑材料行业峰会上重磅揭...
元旦慰问暖人心·倾听共筑优质服... 2026年新年伊始,爱尔眼科·朝阳眼科医院患者服务部(以下简称“患服部”)以一场温馨的慰问活动开启新...
高凯技术IPO:董事长刘建芳控... 瑞财经王敏12月29日,据上交所,江苏高凯精密流体技术股份有限公司(以下简称“高凯技术”)科创板IP...
豪掷14.83亿元!天原股份拟... 来源:中国经营报 中经记者 陈家运 北京报道 2025年12月30日,天原股份(002386.SZ)...
北京ChatGPTGEO优化领... 在数字经济高速发展的背景下,企业营销推广的精准度与效率成为竞争关键。作为国内较早涉足GEO优化领域的...
组图|脚步丈量三湘 结核入户随... 大众卫生报·新湖南客户端12月29日讯(通讯员 林升元)在人类与疾病博弈的漫长岁月里,结核病始终如一...
我国对进口牛肉实施保障措施,释... 商务部2025年12月31日发布公告,裁定进口牛肉数量增加,中国国内产业受到严重损害,且二者存在因果...
原创 少... “场外买基金,转到场内卖就能赚差价”——这是很多投资者听过的套利思路。但并非所有场外基金都能转场内,...
绿色疗法“氧”护健康 在整洁温馨的小院内,几棵古树耸立着。记者踩着斑驳的树影,推开大门,一个蓝白相间的“潜水艇”映入眼帘。...
构建科学管理模式全面提升行政事... 2025年,经开区财政金融局围绕行政事业性国有资产管理持续深化制度创新,系统出台《行政事业单位国有资...
每周股票复盘:文投控股(600... 截至2025年12月26日收盘,文投控股(600715)报收于2.2元,较上周的2.28元下跌3.5...
生死时速!衡阳市第一人民医院多... 大众卫生报·新湖南客户端12月31日讯(通讯员 许文逸 邹勇)近日,衡阳市第一人民医院普通外科联合多...