近来
,传音在。多媒队揽核算机视觉。体团挑战范畴最具影响力的两项世界比赛 CVPR N。TI 。赛冠RE 2025中,亚军传音多媒体团队与上海交通大学图画所MediaLab联合团队别离斩获 。传音高效超分辨率挑战赛(NTIRE 2025 Efficient Super-Resolution Challenge)第一名,多媒队揽短
。体团挑战视频 。两项UGC图画超分辨率挑战赛(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名 。赛冠 ,亚军展示了传音在视频画质范畴的传音深沉堆集与抢先实力 。 

CVPR NTIRE(New Trends in Image Restoration and 多媒队揽Enhancement)是核算机视觉顶会CVPR(Conference on Compu 。te
。体团挑战r Vision and Pattern Recognition)旗下极具影响力的世界学术比赛,素有“印象。算法。奥林匹克”之称。该赛事聚集视频恢复 、图画增强
、生成技能及质量评价等底层视觉使命
,旨在推进技能打破并处理实践使用难题。本年的赛事设置了多项挑战赛
,招引了全球顶尖科研与工业部队参与。 传音深耕非洲、南亚等新式商场多年
,一直环绕用户需求进行本地化立异。近年来数字媒体飞速发展
,传音洞悉到用户对
。智能手机
。图画和视频本质提出了更高的要求
。据Dataspark的数据显现
,2024年非洲用户月均在交际、视频类App上花费约52小时 ,但是非洲用户观看视频在线播映网速均匀不到10M/S
,观看体会较差
。面临非洲等方针商场存在的网速慢、流量贵等实际问题 ,传音继续投入资源,与上海交通大学图画所MediaLab深化协作 ,研制轻量化、低功耗 、高功用的画质增强技能,让更多用户在有限条件下也能享用高清视觉体会。 ▍技能成果一。 高效图画超分辨率中的蒸馏监督下的卷积低秩习惯。 在高效超分辨率挑战赛中,传音多媒体团队和上海交通大学图画所MediaLab提交的论文。“高效图画超分辨率中的蒸馏监督下的卷积低秩习惯(Distillation-Supervised Convolutional Low-Rank
。 Ad。aptation for Efficient Image Super-Resolution)”。提出DSC
。LoRA 。技能,其学习大言语模型中的低秩习惯并结合常识蒸馏战略
,在不添加核算成本的前提下明显提高了高效超分辨率模型的功用。 多个基准数据集上的试验结果表明DSCLoRA在模型复杂度和功用表现之间完成了超卓的均衡 。在不添加模型体积和核算开支的前提下,DSCLoRA可以大幅提高图画超分辨率作用 ,提高弱网环境下视频通话与流媒体播映清晰度,一起具有推理速度快、功耗低一级长处
。经过将该算法集成至
。手机 。印象引擎,用户在在线视频播映 、视频通话
、图画扩大
、。数码。变焦拍照等场景中,均可体会更高分辨率 、更锋利天然的画面。 
模型架构总览 。 ▍技能成果二 |