论文笔记27 -- (视频压缩)Learned Video Codec with Enriched Reconstruction for CLIC P-frame Coding

《Learned Video Codec with Enriched Reconstruction for CLIC P-frame Coding 》

20年12月提交在arXiv上的一篇paper,一个新的基于深度学习的端到端视频编解码框架,看到有大佬已经解读,跟着学习一下!!!大佬的解读点这里

论文点这里

David Alexandre, Hsueh-Ming Hang
Dept. of Electronics Engineering, National Chiao Tung University, Taiwan

Abstract

本文提出了一种基于学习的视频编解码框架。具体地说,设计了带有Refine-Net的压缩网络,用于编码残差信号和运动矢量。此外,对于运动估计,引入了基于注意力的分层ME-Net。为了验证设计,对模块和不同的输入格式进行了消融实验。其视频编解码器通过在CLIC P-frame Challenge指定的解码器端使用完美参考帧来证明其性能。实验结果表明,在质量指标方面(MS-SSIM),提出的编解码器与Challenge的前排对比也非常有竞争力。

1. INTRODUCTION

相关推荐
©️2020 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页