-
题名基于100G以太网的一种并行CRC算法
- 1
-
-
作者
胡坤焌
黄元峰
-
机构
武汉工程大学电气信息学院
-
出处
《电脑知识与技术》
2022年第13期37-39,共3页
-
文摘
为解决大规模数据传输中CRC校验的实时处理问题,文章提出了一种可同时处理256位数据的并行算法。文章首先通过递推法推导出4位数据并行运算CRC(Cyclical RedundancyCheck)关系式,并将表达式系数提出转化为矩阵,在此基础上对矩阵反复迭代,求得256位数据并行计算矩阵。该并行算法推导过程直观易懂,算法实现简单。文章最后采用硬件描述语言对算法进行描述,并搭建了验证环境。仿真验证结果表明了该方案的可行性,达到了设计指标要求,在时钟频率为400MHz的条件下可满足100G以太网中CRC校验需求。
-
关键词
高速以太网
256位并行数据
CRC编码
矩阵并行算法
CRC校验
-
分类号
TP319.56
[自动化与计算机技术—计算机软件与理论]
-
-
题名几种矩阵乘并行算法的对比分析
被引量:2
- 2
-
-
作者
陈鹏
樊小超
-
机构
新疆师范大学计算机科学与技术学院
-
出处
《新疆师范大学学报(自然科学版)》
2012年第3期5-10,共6页
-
文摘
描述了DNS、Cannon、Fox、Systolic矩阵乘并行算法的原理,并对其时间复杂度进行了理论分析。通过对并行算法的各项性能参数的对比分析,得到的结论是DNS算法的时间复杂度最好,但加速比、效率和成本不是最优的。Cannon算法和Fox算法的算法思想类似,但是Cannon算法比Fox算法在数据播送上的花费少,因此整体性能较好。Systolic算法是基于流水线技术的并行矩阵乘算法,有较好的综合性能。
-
关键词
矩阵乘并行算法
时间复杂度
性能分析
-
Keywords
Matrix multiplication parallel algorithm
Time complexity
Performance analysis
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于MPICH的高效矩阵相乘并行算法
被引量:2
- 3
-
-
作者
剡公孝
申卫昌
刘骊
刘伟明
-
机构
西北大学信息科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第26期72-73,117,共3页
-
文摘
根据MPICH并行编程环境中任务间通信的特点,设计了一种基于MPICH的矩阵相乘并行算法。根据运行在COW(工作站机群)上的进程数目将矩阵A按行划分成相应数目的子矩阵,每个进程完成一个子矩阵与矩阵B的相乘运算。实验结果表明,该算法提高了机群并行环境中资源的利用率,提高了程序的运行效率。
-
关键词
一种消息传递接口的实现(MPICH)
矩阵相乘并行算法
工作站机群
-
Keywords
Implementation of the Mssage-Passing Interface(MPICH)
matrix multiplication parallel algorithm
Cluster of Work-stations(COW)
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向语音分离的深层转导式非负矩阵分解并行算法
- 4
-
-
作者
李雨蓉
刘杰
刘亚林
龚春叶
王勇
-
机构
国防科技大学并行与分布处理重点实验室
国防科技大学复杂系统软件工程湖南省重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2020年第8期49-55,共7页
-
基金
重点研发计划(2018YFB0204301)。
-
文摘
非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算问题,文中提出深层转导式非负矩阵分解并行算法,综合考虑迭代更新过程的数据关联性,设计了一种任务间和任务内多级并行算法。该并行算法在任务级将分解训练语音得到对应基矩阵的过程作为两个独立的任务进行并行计算;在任务内部进程级把矩阵按行列划分,主进程把矩阵块分发到从进程,从进程接收当前矩阵块并计算结果矩阵子块,然后将当前进程矩阵块发送到下一进程,实现第二个矩阵中每一个矩阵块在所有进程的遍历,并计算结果矩阵对应子块的乘积,最后由主进程收集从进程数据块;在线程级子矩阵乘法运算的过程中,采取生成多线程,通过共享内存交换数据计算子矩阵块的加速策略。该算法为首个实现深层转导式非负矩阵分解的并行算法。在天河二号平台上的测试结果表明,在分离多说话人混合语音信号时,相比串行程序,所提出的并行算法能在不改变分离效果的前提下,使得预训练过程中使用64个进程的加速比为18,分离过程使用64个进程的对应加速比为24。相较于串行及MPI模型分离,混合模型分离时间大大缩短,从而证明了设计的并行算法可有效提高语音分离的效率。
-
关键词
深层转导式非负矩阵分解并行算法
乘性迭代更新规则加速算法
消息传递接口
共享存储并行编程
语音分离
-
Keywords
Parallel algorithm of deep-transductive non-negative matrix factorization
Acceleration algorithm based on multiplicative update rules
MPI
OpenMP
Speech separation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-