为了提高作物生长模型的计算速度,论文提出了多种分布式并行调度方案。综合分析了田块尺度下作物生长子模型以及子模型内部组分的数据依赖关系和计算流程。以流水线技术和分治策略为基础,分别在模型组分层、子模型层和驱动数据层设计了...为了提高作物生长模型的计算速度,论文提出了多种分布式并行调度方案。综合分析了田块尺度下作物生长子模型以及子模型内部组分的数据依赖关系和计算流程。以流水线技术和分治策略为基础,分别在模型组分层、子模型层和驱动数据层设计了不同的分布式并行调度方案。在WCCS2003(Windows Compute Cluster Server 2003)组成的PC集群环境下,分别采用了OpenMP、MPI_OpenMP混合以及MPI编程模型实现了多种调度方案的并行模拟。并行加速比的实验分析表明,优化后的子模型层并行调度方案,在6个双核CPUs组成的PC集群上的平均加速比可达到8.2,更接近模型并行计算加速比的预测值。在分布式集群环境下,采用基于MPI的子模型层中等粒度的并行调度方案具有更快的计算速度,更适合于作物生长模拟系统。展开更多
马尔科夫链蒙特卡洛MCMC(Markov Chain Monte Carlo)算法广泛应用于地球系统模型中参数不确定性分析和模拟。由于地球环境科学数据的高维度、大容量特性,迫切需求高性能的MCMC算法满足应用需求。采用数据分治法实现该算法的多核并行化...马尔科夫链蒙特卡洛MCMC(Markov Chain Monte Carlo)算法广泛应用于地球系统模型中参数不确定性分析和模拟。由于地球环境科学数据的高维度、大容量特性,迫切需求高性能的MCMC算法满足应用需求。采用数据分治法实现该算法的多核并行化。利用静态和动态分配策略将算法中的多个输入链分配到各CPU;独立计算并通过共享内存实现进程间通信;主进程回收各单元计算结果,合成最终的马尔可夫链输出矩阵。采用控制变量法分析不同样本和马尔可夫链数量下的算法加速情况。结果表明在计算规模较大、动态负载均衡的条件下易于获得较好的加速比,在4个CPU以内时效果显著,之后随着CPU增加加速效果出现波动或趋于稳定。研究表明并行化MCMC能够利用多核CPU硬件设施获得加速效果,更多核数的加速性能存在进一步优化的空间。展开更多
为了减少芯片面积,提高电荷泵的增益,提出一种基于共享技术的电荷泵电路。通过改变两个子电荷泵的串并连接关系,既可以产生一种电压较高而电流驱动能力较小的负高压,也可以产生一种电压较低但是电流驱动能力很大的负高压,这不仅满足了...为了减少芯片面积,提高电荷泵的增益,提出一种基于共享技术的电荷泵电路。通过改变两个子电荷泵的串并连接关系,既可以产生一种电压较高而电流驱动能力较小的负高压,也可以产生一种电压较低但是电流驱动能力很大的负高压,这不仅满足了系统在编程和擦除时对高压的不同需求,而且还节省了大约50%的芯片面积。电荷泵电路还采取了对其中P型M O S管的衬底电压进行动态控制的方法。模拟结果表明,该电荷泵的增益提高了大约14%。该电路特别适用于需要两种以上负高压以完成编程和擦除操作的快闪存储器。展开更多
False sharing is one of the most important factors impacting the performance of DSM (distributed shared memory) systems. The single-writer approach is simple, but it cannot avoid the ping-pong effect of the data page...False sharing is one of the most important factors impacting the performance of DSM (distributed shared memory) systems. The single-writer approach is simple, but it cannot avoid the ping-pong effect of the data page thrashing, while the multiple-writer approach is effective for false sharing but with high cost. This paper proposes a new approach, called limited multiple-writer (LMW) to handling multiple writers in software DSM. It distinguishes two kinds of multiple-writer as lock-based form and barrier-based form, and handles them with different policies. It discards the Twin and Diffin traditional multiple-writer approach, and simplifies the implementation of multiple-writer in software DSM systems. The implementation of LMW in a CVM (Coherent Virtual Machine) software DSM system, which is based on a network of workstations, is introduced. Evaluation results show that for some applications such as SOR (Successive Over-Relaxation), LU (Lower triangular and Upper triangular), FFT (Fast Fourier Transformation), and IS (Integer Sorting), LMW provides a significant reduction in'execution time (11%, 16%, 33% and 46%) compared with the traditional multiple-writer approach on the platform.展开更多
文摘为了提高作物生长模型的计算速度,论文提出了多种分布式并行调度方案。综合分析了田块尺度下作物生长子模型以及子模型内部组分的数据依赖关系和计算流程。以流水线技术和分治策略为基础,分别在模型组分层、子模型层和驱动数据层设计了不同的分布式并行调度方案。在WCCS2003(Windows Compute Cluster Server 2003)组成的PC集群环境下,分别采用了OpenMP、MPI_OpenMP混合以及MPI编程模型实现了多种调度方案的并行模拟。并行加速比的实验分析表明,优化后的子模型层并行调度方案,在6个双核CPUs组成的PC集群上的平均加速比可达到8.2,更接近模型并行计算加速比的预测值。在分布式集群环境下,采用基于MPI的子模型层中等粒度的并行调度方案具有更快的计算速度,更适合于作物生长模拟系统。
文摘马尔科夫链蒙特卡洛MCMC(Markov Chain Monte Carlo)算法广泛应用于地球系统模型中参数不确定性分析和模拟。由于地球环境科学数据的高维度、大容量特性,迫切需求高性能的MCMC算法满足应用需求。采用数据分治法实现该算法的多核并行化。利用静态和动态分配策略将算法中的多个输入链分配到各CPU;独立计算并通过共享内存实现进程间通信;主进程回收各单元计算结果,合成最终的马尔可夫链输出矩阵。采用控制变量法分析不同样本和马尔可夫链数量下的算法加速情况。结果表明在计算规模较大、动态负载均衡的条件下易于获得较好的加速比,在4个CPU以内时效果显著,之后随着CPU增加加速效果出现波动或趋于稳定。研究表明并行化MCMC能够利用多核CPU硬件设施获得加速效果,更多核数的加速性能存在进一步优化的空间。
文摘为了减少芯片面积,提高电荷泵的增益,提出一种基于共享技术的电荷泵电路。通过改变两个子电荷泵的串并连接关系,既可以产生一种电压较高而电流驱动能力较小的负高压,也可以产生一种电压较低但是电流驱动能力很大的负高压,这不仅满足了系统在编程和擦除时对高压的不同需求,而且还节省了大约50%的芯片面积。电荷泵电路还采取了对其中P型M O S管的衬底电压进行动态控制的方法。模拟结果表明,该电荷泵的增益提高了大约14%。该电路特别适用于需要两种以上负高压以完成编程和擦除操作的快闪存储器。
基金This work is supported in part by the National Natural Science Foundation of China under grant No.69896250 and in part by the N
文摘False sharing is one of the most important factors impacting the performance of DSM (distributed shared memory) systems. The single-writer approach is simple, but it cannot avoid the ping-pong effect of the data page thrashing, while the multiple-writer approach is effective for false sharing but with high cost. This paper proposes a new approach, called limited multiple-writer (LMW) to handling multiple writers in software DSM. It distinguishes two kinds of multiple-writer as lock-based form and barrier-based form, and handles them with different policies. It discards the Twin and Diffin traditional multiple-writer approach, and simplifies the implementation of multiple-writer in software DSM systems. The implementation of LMW in a CVM (Coherent Virtual Machine) software DSM system, which is based on a network of workstations, is introduced. Evaluation results show that for some applications such as SOR (Successive Over-Relaxation), LU (Lower triangular and Upper triangular), FFT (Fast Fourier Transformation), and IS (Integer Sorting), LMW provides a significant reduction in'execution time (11%, 16%, 33% and 46%) compared with the traditional multiple-writer approach on the platform.