智院要闻
智院要闻

喜报:张萌萌教授合作项目在国际顶级期刊《IEEE TPAMI》发表研究论文

发布日期:2026-01-09 访问次数: 字号:[ ]

  近日,张萌萌教授合作项目在《IEEE Transactions on Pattern Analysis and Machine Intelligence》上发表题为《Large-scale Logo Detection》的原创性研究论文。IEEE TPAMI是人工智能、模式识别、图像处理和计算机视觉领域公认的顶级国际期刊,投稿接受率仅约10%,在计算机科学与人工智能领域具有权威影响力。最新数据显示,其影响因子高达18.6。

  在商标合规监测与品牌价值评估领域,Logo检测作为关键技术,为企业量化品牌曝光、监测品牌认知、维护品牌资产以及评估营销活动效果提供关键技术支持。然而,传统方法面临数据规模与多样性不足的挑战,导致检测精度与模型泛化能力受限。高质量标注数据对优化视觉检测模型性能、增强推理能力的关键作用,在此背景下愈发凸显。

  为突破这一瓶颈,团队构建了一个大规模的Logo检测数据集Logo4500。该数据集涵盖4500个Logo类别,包含超过29.3万张精细标注图像,其中食品饮料类Logo达1265类。与现有公开数据集相比,Logo4500在类别多样性与不平衡程度方面高度贴近真实商业场景数据分布,为模型训练提供了更贴近实际需求的基准。

Logo4500数据集统计信息

  基于Logo4500数据集,团队进一步提出了一种频率感知可学习双加权网络(FALDR-Net)。该模型通过动态权重分配机制,显著增强了对模糊Logo特征的表示能力,有效缓解了大规模Logo检测中普遍存在的类别不平衡问题。实验表明,在Logo4500及多个公开数据集上,FALDR-Net对主流方法的检测精度提升显著,同时展现出在多类任务中的优异泛化能力。

频率感知可学习双重重加权网络

FALDR-Net 在 Logo4500 上的样例检测结果

  数据集及模型链接:https://github.com/housujuan123/Logo4500。