快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依...快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依赖于数据集的密度估计和截断距离(dc)的人为选择问题,提出一种基于核密度估计的KCFSFDP算法。该算法利用无参的核密度估计分析数据点的分布特征并自适应地选取dc,从而搜索和发现数据点的密度峰值,并以峰值点数据作为初始聚类中心。基于4个典型数据集的仿真结果表明,K-CFSFDP算法比CFSFDP,K-means和DBSCAN算法具有更高的准确度和更强的鲁棒性。展开更多
特大型城市的公交车上普遍安装了自动售票(auto fare collection,AFC)系统和车载GPS导航定位设备,记录了乘客出行与行车轨迹、时间等数据,连续运行的公交车和众多的出行乘客形成了城市公共交通运行和出行大数据。如何高效、准确地从...特大型城市的公交车上普遍安装了自动售票(auto fare collection,AFC)系统和车载GPS导航定位设备,记录了乘客出行与行车轨迹、时间等数据,连续运行的公交车和众多的出行乘客形成了城市公共交通运行和出行大数据。如何高效、准确地从公交大数据中识别公交乘客下车站点,对于提高交通运行效率、科学布局组织交通具有重要的意义和作用。基于深圳市公交车AFC和GPS数据,利用时间匹配和基于带噪声空间密度聚类的方法判别上车站点;在仅有的公交数据基础上,通过分析乘客出行行为,根据乘客多天的出行以及各站点的上车频率,利用乘客高频站点和下游站点吸引权,提出一种推算方法,实现乘客下车站点的推断。算法模型的检验和实例分析表明该方法的有效性。展开更多
快速搜索与发现密度峰值聚类算法(Fast Search and Discovery Density Peak Clustering Algorithm,CFSFDP)的聚类效果十分依赖截断距离dc的主观选取,而最佳dc值的确定并不容易,并且当处理分布复杂、密度变化大的数据集时,算法生成的决...快速搜索与发现密度峰值聚类算法(Fast Search and Discovery Density Peak Clustering Algorithm,CFSFDP)的聚类效果十分依赖截断距离dc的主观选取,而最佳dc值的确定并不容易,并且当处理分布复杂、密度变化大的数据集时,算法生成的决策图中类簇中心点与非类簇中心点的区分不够明显,使类簇中心的选取变得困难。针对这些问题,对其算法进行了优化,并提出了基于K近邻的比较密度峰值聚类算法(Comparative Density Peak Clustering algorithm Based on K-Nearest Neighbors,CDPC-KNN)。算法结合K近邻概念重新定义了截断距离和局部密度的度量方法,对任意数据集能自适应地生成截断距离,并使局部密度的计算结果更符合数据的真实分布。同时在决策图中引入距离比较量代替原距离参数,使类簇中心在决策图上更加明显。通过实验验证,CDPC-KNN算法的聚类效果整体上优于CFSFDP算法与DBSCAN算法,分离度实验表明新算法使类簇中心与非类簇中心点的区分度得到有效提高。展开更多
In this study,we investigate the cluster radioactivity(CR)of new superheavy elements with Z=119 and 120 based on two successful theoretical methods with modified parameters:the density-dependent cluster model(DDCM)and...In this study,we investigate the cluster radioactivity(CR)of new superheavy elements with Z=119 and 120 based on two successful theoretical methods with modified parameters:the density-dependent cluster model(DDCM)and unified decay formula(UDF).First,we employ the DDCM and UDF to accurately reproduce the experimental half-lives of cluster emissions,which demonstrates the high reliability of our theoretical methods.Then,we systematically predict the probable cluster modes of ^(293-311)119 and ^(293-302)120 as well as their corresponding decay energies and half-lives.The half-lives of cluster decay derived from the DDCM are consistent with those from the UDF.Therefore,our results reveal that the cluster emission of ^(8)Be,emitted from the Z=119 and 120 isotopic chains,exhibits the minimum half-life for cluster emission,and hence,^(8)Be emission is considered the most probable cluster decay mode.Moreover,we explore the competition betweenαdecay and CR and find thatαdecay may be the dominant decay mode against CR.Furthermore,the good linear relationship between the decay energy and the number ofαparticles within the emitted cluster is extended to the range of superheavy nuclei(SHN).We anticipate that our theoretical predictions for CR will provide valuable references for the experimental synthesis of new SHN.展开更多
文摘快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依赖于数据集的密度估计和截断距离(dc)的人为选择问题,提出一种基于核密度估计的KCFSFDP算法。该算法利用无参的核密度估计分析数据点的分布特征并自适应地选取dc,从而搜索和发现数据点的密度峰值,并以峰值点数据作为初始聚类中心。基于4个典型数据集的仿真结果表明,K-CFSFDP算法比CFSFDP,K-means和DBSCAN算法具有更高的准确度和更强的鲁棒性。
文摘特大型城市的公交车上普遍安装了自动售票(auto fare collection,AFC)系统和车载GPS导航定位设备,记录了乘客出行与行车轨迹、时间等数据,连续运行的公交车和众多的出行乘客形成了城市公共交通运行和出行大数据。如何高效、准确地从公交大数据中识别公交乘客下车站点,对于提高交通运行效率、科学布局组织交通具有重要的意义和作用。基于深圳市公交车AFC和GPS数据,利用时间匹配和基于带噪声空间密度聚类的方法判别上车站点;在仅有的公交数据基础上,通过分析乘客出行行为,根据乘客多天的出行以及各站点的上车频率,利用乘客高频站点和下游站点吸引权,提出一种推算方法,实现乘客下车站点的推断。算法模型的检验和实例分析表明该方法的有效性。
文摘快速搜索与发现密度峰值聚类算法(Fast Search and Discovery Density Peak Clustering Algorithm,CFSFDP)的聚类效果十分依赖截断距离dc的主观选取,而最佳dc值的确定并不容易,并且当处理分布复杂、密度变化大的数据集时,算法生成的决策图中类簇中心点与非类簇中心点的区分不够明显,使类簇中心的选取变得困难。针对这些问题,对其算法进行了优化,并提出了基于K近邻的比较密度峰值聚类算法(Comparative Density Peak Clustering algorithm Based on K-Nearest Neighbors,CDPC-KNN)。算法结合K近邻概念重新定义了截断距离和局部密度的度量方法,对任意数据集能自适应地生成截断距离,并使局部密度的计算结果更符合数据的真实分布。同时在决策图中引入距离比较量代替原距离参数,使类簇中心在决策图上更加明显。通过实验验证,CDPC-KNN算法的聚类效果整体上优于CFSFDP算法与DBSCAN算法,分离度实验表明新算法使类簇中心与非类簇中心点的区分度得到有效提高。
基金Supported by the National Natural Science Foundation of China(12035011,11975167,11947211,11905103,11881240623,11961141003)the National Key R&D Program of China(2018YFA0404403)。
文摘In this study,we investigate the cluster radioactivity(CR)of new superheavy elements with Z=119 and 120 based on two successful theoretical methods with modified parameters:the density-dependent cluster model(DDCM)and unified decay formula(UDF).First,we employ the DDCM and UDF to accurately reproduce the experimental half-lives of cluster emissions,which demonstrates the high reliability of our theoretical methods.Then,we systematically predict the probable cluster modes of ^(293-311)119 and ^(293-302)120 as well as their corresponding decay energies and half-lives.The half-lives of cluster decay derived from the DDCM are consistent with those from the UDF.Therefore,our results reveal that the cluster emission of ^(8)Be,emitted from the Z=119 and 120 isotopic chains,exhibits the minimum half-life for cluster emission,and hence,^(8)Be emission is considered the most probable cluster decay mode.Moreover,we explore the competition betweenαdecay and CR and find thatαdecay may be the dominant decay mode against CR.Furthermore,the good linear relationship between the decay energy and the number ofαparticles within the emitted cluster is extended to the range of superheavy nuclei(SHN).We anticipate that our theoretical predictions for CR will provide valuable references for the experimental synthesis of new SHN.