科学研究

2025
07-03

实验室硕士生丁增茂论文被CCF-A类会议ICCV录用

作者:李邦来源: 编辑:刘晓魁浏览:

近日,第20届ICCV国际计算机视觉大会(The 20th IEEE/CVF International Conference on Computer Vision (ICCV 2025))公布了论文录用结果。实验室2024级硕士生丁增茂论文“OracleFusion: Assisting the Decipherment of Oracle Bone Script with Structurally Constrained Semantic Typography”(作者:李曹硕,丁增茂(共一), 胡晓彬, 李邦, 罗栋豪,吴翩,王朝阳,金泰松,舒展,吴运声,刘永革,纪荣嵘)被International Conference on Computer Vision 会议(ICCV)录用。

甲骨文是最早的古代语言之一,蕴含着古代文明的文化记录。尽管已发现约4500个甲骨文字符,但只有约1,600个被破译,其余未破译的字符结构复杂、意象抽象,对解读构成重大挑战。为了应对这些挑战,本文提出了一种新颖的两阶段语义排版框架OracleFusion。在第一阶段,该方法利用具有增强空间感知推理(SAR)的多模态大型语言模型(MLLM)来分析甲骨文字符的字形结构并对关键部件进行视觉定位。在第二阶段,引入甲骨文结构矢量融合(SOVF),结合字形结构约束和字形维持约束,以确保准确生成语义丰富的矢量字体。这种方法保持了字形结构的客观完整性,提供了视觉增强的表示,以帮助专家破译甲骨文。

大量的定性和定量实验表明,OracleFusion在语义、视觉吸引力和字形维护方面均超越了最先进的基线模型,显著提升了可读性和美观度。此外,OracleFusion还能为未见的甲骨文字符提供专家级的洞察,使其成为推进甲骨文释读的有效工具。

据悉,ICCV作为计算机视觉领域的顶级学术会议,每两年举办一次,与国际计算机视觉与模式识别会议(CVPR)、欧洲计算机视觉国际会议(ECCV)并称为计算机视觉领域的三大顶级会议,具有极高的学术影响力。ICCV 2025将于10月19日至25日在美国夏威夷举行。ICCV 2025大会共收到11239份有效投稿,刷新历史记录,经过严格评审,最终仅接受2698篇论文,录用率为24%。


关闭