2026年3月20日晚19时,开云kaiyun体育官方网站第七十期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2023级研究生李荣威、胡振豪、肖义凡、余志燃、李珠婷、黄展翌以及范坤主讲,开云kaiyun体育官方网站研究生会学术部主办,学院叶璐瑶老师出席了该论坛。
李荣威同学分享的主题为“Enhancing multi-illuminant color constancy through multi-scale estimation and high-frequency preservation”。通过频率分析,本文发现光照图可能包含高频分量,违反了平滑性假设;并且随着图像尺度的减小,其频率分布会向低频区域偏移。受此启发,本文提出了一种包含低频分支和高频分支的网络。为了在高频分支中保留高频特征,本文在跳跃连接中嵌入了一个高频特征保留门控模块(HFPGM),用于过滤和保留高频特征。此外,还在两个分支之间嵌入了一个跨尺度高频特征保留门控模块(CSHFPGM)。该模块利用两个分支解码路径之间的特征差异作为约束,对高频分支解码器输出的特征进行过滤。实验结果表明,本方法在LSMI和Cube++数据集上得到了更佳的结果。

胡振豪同学分享的主题为“Every Lie Has a Grain of Truth: Disentangling Deception from Authentic Content for Fake News Detection”。虚假新闻检测因数字内容的指数级增长仍是一项紧迫挑战,本文提出语义分歧与对齐学习(SDAL)方法,将新闻显式拆解为三个互补组件:捕捉同一新闻主题内通用表征的主题泛化特征、分离具有操纵性内容的内容专属特征,以及整合外部知识的辅助特征。该方法通过检测、分离、一致性与重构四项目标函数,在保留主题语义(现有方法常忽视的关键要素)的同时,最大化误导性内容与真实内容的可分离性,在多个基准数据集上的实证评估表明,SDAL在检测准确率与可解释性方面均持续优于现有最优方法。

肖义凡同学分享的主题为“Research on Joint Entity Relationship Extraction Method Based on Multi-scale Feature Fusion and Parameter-free Attention Mechanism”。实体关系抽取是构建知识图谱的关键步骤,旨在从文本中提取三元组,但其面临重叠三元组与错误累积两大难题。为提升抽取性能,本文提出一种基于多尺度特征融合与无参注意力机制的实体关系联合抽取方法。该方法将任务拆分为多尺度特征融合、异构图、头实体标记与尾实体标记四个子模块。通过多尺度特征融合增强特征表达,缓解实体重叠问题;借助无参注意力机制聚焦关键特征、抑制冗余信息,减轻错误累积。在中英文数据集上的大量实验表明,该方法较现有SOTA模型取得了更优的F1值。

余志燃同学分享的主题为“Multi-Grained Interactive Transformer Hashing for Cross-Modal Retrieval”。本文提出多粒度交互式Transformer哈希网络(MITH),以解决现有跨模态方法未能充分挖掘模态内与模态间多粒度语义关联的问题。该网络在统一Transformer框架下,分层次建模粗粒度与细粒度相似性。具体地,通过蒸馏模态内交互模块,利用全局-局部知识蒸馏在概念类别引导下挖掘模态特有语义;同时,构建对比模态间对齐模块,分别从实例和token级别进行对比学习,以捕捉模态间的语义对应关系。该协同学习范式从多粒度视角有效缓解了模态间的异质性与语义差距,生成更具判别力的模态不变哈希码。在多个代表性跨模态数据集上的实验结果表明,MITH的性能均优于现有最先进方法。

李珠婷同学分享的主题为“MI-DETR: An Object Detection Model with Multi-time Inquirie-Mechanism”。基于对现有DETR类模型中常用的级联解码器架构的分析,本文提出了一种新的解码器架构。级联解码器架构限制了目标查询沿级联方向更新,只能使目标查询从图像特征中学习相对有限的信息。然而,自然场景中的目标检测挑战(例如极小、严重遮挡、与背景混杂且难以区分)要求目标检测模型充分利用图像特征,这促使我们提出一种带有并行多次查询(MI)机制的新解码器架构。MI使目标查询能够学习更全面的信息,MI-DETR在不同的主干网络和训练轮数下,在COCO基准上性能优于所有现有的DETR类模型。

黄展翌同学分享的主题为“DLGGSN: Dynamic Long-range Attention Graph Garment Simulation Network”。在计算机图形学中,为运动中的身体创建高保真度的3D服装褶皱效果是一项关键挑战。所提方法提出了一种新颖的分层图神经网络,网络结合了消息传递注意力机制和分层潜在空间,以融合长距离节点之间的局部和全局变形关系,这会影响节点顶点的变形结果,并进一步决定服装的褶皱或折叠变形。算法法包括三个关键组件:节点注意力模块计算整个服装网格中每个节点的权重,边注意力模块计算服装周围所有边的权重,有助于在服装上生成逼真的褶皱或折叠。分层潜在空间中的局部细节估计模块用于捕捉局部变形和全局变形与运动身体序列之间的关系。此外,模型中引入了尽可能刚性损失来约束运动序列中的变形。引入STVK模型对弯曲损失和拉伸损失进行了修改。实验结果表明。与现有方法相比,网络能产生更准确且视觉效果更佳的结果。

范坤同学分享的主题为“IViT An Incremental Learning Method for Object Detection of Hidden Hazards in Transmission Line Corridors”。目前,无人机对输电线路的检测主要依赖于目标检测技术。然而,随着新型障碍物的不断涌现,检测模型需要频繁更新,导致重训练成本高昂。为解决这一难题,我们提出了一种名为IViT的创新框架,该框架通过融合增量学习与混合CNN-Transformer架构来提升识别性能。我们创新性地将知识蒸馏与弹性响应选择蒸馏策略相结合,通过星形卷积残差块增强旧类别的检测效果并强化知识保留。特别设计的可分离卷积聚合模块将PConv与注意力机制相结合,有效融合全局与局部信息以提升检测精度。通过实验验证,IViT在检测性能上显著优于主流目标检测模型。

