-
题名基于申威421的视频解码的向量化并行
- 1
-
-
作者
裴航
王磊
王威
张书钦
-
机构
中原工学院计算机学院
中原工学院前沿信息技术研究院
-
出处
《计算机技术与发展》
2021年第10期81-86,共6页
-
基金
河南省高校重点科研项目(18B520044)
河南省科技攻关项目(182102210526)。
-
文摘
H.264解码器在申威平台移植后遇到解码效率低,视频播放不流畅等问题。为提升视频解码性能,满足国产申威平台用户的多媒体需求,首先对FFmpeg开源编解码库中H.264解码器进行了详细分析,使用性能分析工具找到视频解码的热点函数。然后充分利用申威处理器的向量扩展部件,对解码器运动补偿、DCT反变换等关键模块代码使用手工嵌入式汇编进行向量指令替换来缩短指令周期,实现向量化并行。最后对环路滤波代码中不能直接向量化的循环通过数组重组等方式满足向量化分析,然后进行向量化计算,更深层次挖掘多媒体并行能力,从而提升多媒体程序运行速度。实验结果表明,向量化后的视频解码性能最高提升了35.3%,释放了CPU资源,解决了视频播放不流畅的问题,有效推动了申威处理器市场化发展。
-
关键词
H.264解码器
FFmpeg编解码库
申威处理器
单指令多数据流
并行计算
-
Keywords
H.264 decoder
FFmpeg codec library
shenwei instructions
single instruction multi-data stream
parallel computing
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-