登录1秒注册

庾避

搜索
站长论坛»主页首页探索>团队揽获C项挑战赛冠2025两亚军传音多媒体
查看:9
回复:1
打印上一主题下一主题

[庾避]团队揽获C项挑战赛冠2025两亚军传音多媒体

[复制链接]
跳转到指定楼层
楼主

近来  ,传音在。多媒队揽核算机视觉。体团挑战范畴最具影响力的两项世界比赛 CVPR N 。TI。赛冠RE 2025中,亚军传音多媒体团队与上海交通大学图画所MediaLab联合团队别离斩获。传音高效超分辨率挑战赛(NTIRE 2025 Efficient Super-Resolution Challenge)第一名 ,多媒队揽短  。体团挑战视频 。两项UGC图画超分辨率挑战赛(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名 。赛冠,亚军展示了传音在视频画质范畴的传音深沉堆集与抢先实力 。

56a65f68-50c1-11f0-b715-92fbcf53809c.jpg

56bafdce-50c1-11f0-b715-92fbcf53809c.jpg

CVPR NTIRE(New Trends in Image Restoration and 多媒队揽Enhancement)是核算机视觉顶会CVPR(Conference on Compu 。te 。体团挑战r Vision and Pattern Recognition)旗下极具影响力的世界学术比赛,素有“印象。算法。奥林匹克”之称。该赛事聚集视频恢复 、图画增强 、生成技能及质量评价等底层视觉使命  ,旨在推进技能打破并处理实践使用难题。本年的赛事设置了多项挑战赛 ,招引了全球顶尖科研与工业部队参与。

传音深耕非洲、南亚等新式商场多年 ,一直环绕用户需求进行本地化立异 。近年来数字媒体飞速发展  ,传音洞悉到用户对 。智能手机 。图画和视频本质提出了更高的要求 。据Dataspark的数据显现 ,2024年非洲用户月均在交际、视频类App上花费约52小时 ,但是非洲用户观看视频在线播映网速均匀不到10M/S ,观看体会较差 。面临非洲等方针商场存在的网速慢、流量贵等实际问题 ,传音继续投入资源,与上海交通大学图画所MediaLab深化协作 ,研制轻量化 、低功耗 、高功用的画质增强技能,让更多用户在有限条件下也能享用高清视觉体会。

▍技能成果一。

高效图画超分辨率中的蒸馏监督下的卷积低秩习惯 。

在高效超分辨率挑战赛中,传音多媒体团队和上海交通大学图画所MediaLab提交的论文。“高效图画超分辨率中的蒸馏监督下的卷积低秩习惯(Distillation-Supervised Convolutional Low-Rank  。 Ad 。aptation for Efficient Image Super-Resolution)”。提出DSC 。LoRA 。技能 ,其学习大言语模型中的低秩习惯并结合常识蒸馏战略 ,在不添加核算成本的前提下明显提高了高效超分辨率模型的功用 。

多个基准数据集上的试验结果表明DSCLoRA在模型复杂度和功用表现之间完成了超卓的均衡 。在不添加模型体积和核算开支的前提下,DSCLoRA可以大幅提高图画超分辨率作用,提高弱网环境下视频通话与流媒体播映清晰度,一起具有推理速度快、功耗低一级长处 。经过将该算法集成至 。手机 。印象引擎 ,用户在在线视频播映 、视频通话 、图画扩大 、。数码。变焦拍照等场景中,均可体会更高分辨率 、更锋利天然的画面。

56ea4318-50c1-11f0-b715-92fbcf53809c.png

模型架构总览 。

▍技能成果二。

用于短视频UGC图画超分辨率的增强语义提取与引导 。

在短视频UGC图画超分辨率挑战赛中 ,传音多媒体团队和上海交通大学图画所MediaLab提交的论文。“用于UGC图画超分辨率的增强语义提取与引导(Enhanced Semantic Extr。ac 。tion and Guidance for UGC Image Super Resolution)”。,提出一种根据 Diffusion 的新式模型以处理短视频渠道 UGC 场景下低分辨率退化图片,有助于完成更稳健、感知可信和实践适用的图画修正。

该模型经过制造特定数据集,消除实际 UGC 场景下图片退化类型和组成退化之间存在的差异。其次,经过引进语义提取模块,使用 SAM2 预练习模型提取高层次的上下文信息,帮忙模型进行图画重建使命。最终 ,针对不同的数据集进行参数微调  ,使模型在不同数据集上表现到达最优。

该项技能打破,将有用处理含糊、紧缩 、结构变形等常见失真问题,生成更天然 、实在 、语义共同的修正图画 ,极大提高用户在短视频截图 、交际图片增强等场景中的视觉体会。

56f95dd0-50c1-11f0-b715-92fbcf53809c.png

模型架构总览。

此次联合高校团队参与世界尖端比赛表现传音对中心技能立异的注重与投入 ,也为后续画质增强功用的产品化奠定坚实基础。未来 ,传音将加速将画质增强技能布置到旗下手机产品中 ,构建起一套习惯新式商场特征 、统筹功用与体会的视频增强处理方案,为更多新式商场用户带来更为高清、流通的视觉体会。


使用道具举报

您需要登录后才可以回帖 登录 | 1秒注册

站长论坛积分规则

辽ICP备17114053号-2|Archiver|手机版|小黑屋|站长论坛

GMT+8, 2025-07-04 , Processed in 0.295106 second(s), 188 queries .

Powered by 庾避

© 本站内容均为会员发表,并不代表本站长论坛立场!

返回顶部