近日,网络赌博网站-赌博网站大全
徐炜轩(本科三年级学生)完成的研究论文 “Seeing the Whole Through the Parts: Discovering Objects through Semantic Part Mining in Weak Supervision” 被国际信息检索领域重要学术会议 ACM SIGIR 2026(CCF-A类)接收录用。该论文聚焦弱监督目标检测中的实例定位难题,提出了一种基于“由部件推理整体”的新方法 P2WDet。该方法通过挖掘语义部件信息,实现对目标整体的有效建模,为弱标注条件下的目标发现及开放场景目标检测提供了新的解决思路。该研究工作在网络赌博网站
李书城、吕丰老师的指导下完成。

弱监督目标检测是指仅用“图像里有什么”的标签(而不标出具体位置)来完成目标定位,可大幅降低人工标注成本,在开放词汇检测、网络图像学习和医学影像分析等场景中具有应用价值。但由于缺少精确位置标注,现有方法常出现两类问题:要么只识别出最显著的局部(如只检测到人脸),要么把目标与背景混在一起,生成不准确的大框。。
针对这一问题,论文提出P2WDet(Part-to-Whole Detection)框架,将检测过程转化为“先找部件,再还原整体”。方法分三步:首先利用大语言模型生成目标的“部件清单”,并筛选出视觉上可区分的部件;其次在无需人工标注的情况下自动学习这些部件;最后将检测到的部件组合成完整目标,从而得到更准确的定位结果。实验表明,该方法在多个数据集上明显优于传统方法,其中“person”类检测精度由7.8%提升至36.9%。
该研究借鉴“部件-整体”的人类认知机制,为解决弱监督检测中的歧义问题提供了新思路,也表明结合大语言模型与视觉模型有助于提升复杂开放环境下的目标理解能力。
作者:李书城
一审:吕丰
二审:赵赫
三审:王新辉