团队揽获 推进视频画 两项挑战质晋级赛冠亚军,传音多媒体
2025-07-04 08:05:04庾避

近来,传音在核算机视觉范畴最具影响力的多媒队揽世界比赛 CVPR NTIRE 2025 中 ,传音多媒体团队与上海交通大学图画所 MediaLab 联合团队别离斩获。体团挑战推进高效超分辨率挑战赛(NTIRE 2025 Efficient Super-Resolution Challenge)第一名。获C画质,两项短视频 UGC 图画。赛冠视频超分辨率挑战赛。亚军(。晋级NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第 。传音二。多媒队揽名 。体团挑战推进 ,获C画质展示了传音在视频画质范畴的两项深沉堆集与抢先实力。

CVPR NTIRE(New Trends in Image Restoration and Enhancement)是核算机视觉顶会 CVPR (Conference on Computer Vision and Pattern Recognition) 旗下极具影响力的世界学术比赛,素有“印象算法奥林匹克”之称。该赛事聚集视频恢复、图画增强  、生成技能及质量评价等底层视觉使命 ,旨在推进技能打破并处理实践使用难题。本年的赛事设置了多项挑战赛  ,招引了全球顶尖科研与工业部队参与。

传音深耕非洲、南亚等新式商场多年 ,一直环绕用户需求进行本地化立异。近年来数字媒体飞速发展,传音洞悉到用户对智能手机图画和视频本质提出了更高的要求 。据 Dataspark 的数据显现 ,2024 年非洲用户月均在交际 、视频类 App 上花费约 52 小时,但是非洲用户观看视频在线播映网速均匀不到 10M/S,观看体会较差 。面临非洲等方针商场存在的网速慢 、流量贵等实际问题 ,传音继续投入资源,与上海交通大学图画所 MediaLab 深化协作,研制轻量化 、低功耗 、高功用的画质增强技能 ,让更多用户在有限条件下也能享用高清视觉体会 。

技能成果一:高效图画超分辨率中的蒸馏监督下的卷积低秩习惯。

在高效超分辨率挑战赛中 ,传音多媒体团队和上海交通大学图画所 MediaLab 提交的论文 。“高效图画超分辨率中的蒸馏监督下的卷积低秩习惯。(Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution) 。” 。提出 DSCLoRA 技能,其学习大言语模型中的低秩习惯并结合常识蒸馏战略 ,在不添加核算成本的前提下明显提高了高效超分辨率模型的功用。

多个基准数据集上的试验成果表明 DSCLoRA 在模型复杂度和功用表现之间完成了超卓的均衡 。在不添加模型体积和核算开支的前提下  ,DSCLoRA 可以大幅提高图画超分辨率作用,提高弱网环境下视频通话与流媒体播映清晰度  ,一起具有推理速度快、功耗低一级长处 。经过将该算法集成至手机印象引擎 ,用户在在线视频播映、视频通话、图画扩大 、数码变焦拍照等场景中 ,均可体会更高分辨率 、更锋利天然的画面。

模型架构总览。

技能成果二 :用于  。短视频。UGC 图画超分辨率的增强语义提取与引导 。

在短视频 UGC 图画超分辨率挑战赛中,传音多媒体团队和上海交通大学图画所 MediaLab 提交的论文。“用于 。UGC。图画超分辨率的增强语义提取与引导( 。Enhanced Semantic Extraction and Guidance for UGC Image Super Resolution。)” 。 ,提出一种根据 Diffusion 的新式模型以处理短视频渠道 UGC 场景下低分辨率退化图片,有助于完成更稳健、感知可信和实践适用的图画修正 。

该模型经过制造特定数据集,消除实际 UGC 场景下图片退化类型和组成退化之间存在的差异。其次,经过引进语义提取模块,使用 SAM2 预练习模型提取高层次的上下文信息,帮忙模型进行图画重建使命。最终 ,针对不同的数据集进行参数微调,使模型在不同数据集上表现到达最优 。

该项技能打破 ,将有用处理含糊、紧缩、结构变形等常见失真问题 ,生成更天然 、实在、语义共同的修正图画,极大提高用户在短视频截图、交际图片增强等场景中的视觉体会 。

模型架构总览 。

此次联合高校团队参与世界尖端比赛表现传音对中心技能立异的注重与投入 ,也为后续画质增强功用的产品化奠定坚实基础。未来,传音将加速将画质增强技能布置到旗下手机产品中 ,构建起一套习惯新式商场特征、统筹功用与体会的视频增强处理方案 ,为更多新式商场用户带来更为高清 、流通的视觉体会 。

广告声明 :文内含有的对外跳转链接(包括不限于超链接、二维码、口令等方式),用于传递更多信息,节约甄选时刻 ,成果仅供参考,一切文章均包括本声明。