期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
Metabonomic analysis of hepatitis B virus-induced liver failure:identification of potential diagnostic biomarkers by fuzzy support vector machine 被引量:11
1
作者 Yong MAO Xin HUANG +3 位作者 Ke YU Hai-bin QU Chang-xiao LIU Yi-yu CHENG 《Journal of Zhejiang University-Science B(Biomedicine & Biotechnology)》 SCIE CAS CSCD 2008年第6期474-481,共8页
Hepatitis B virus (HBV)-induced liver failure is an emergent liver disease leading to high mortality. The severity of liver failure may be reflected by the profile of some metabolites. This study assessed the potent... Hepatitis B virus (HBV)-induced liver failure is an emergent liver disease leading to high mortality. The severity of liver failure may be reflected by the profile of some metabolites. This study assessed the potential of using metabolites as biomarkers for liver failure by identifying metabolites with good discriminative performance for its phenotype. The serum samples from 24 HBV-indueed liver failure patients and 23 healthy volunteers were collected and analyzed by gas chromatography-mass spectrometry (GC-MS) to generate metabolite profiles. The 24 patients were further grouped into two classes according to the severity of liver failure. Twenty-five eommensal peaks in all metabolite profiles were extracted, and the relative area values of these peaks were used as features for each sample. Three algorithms, F-test, k-nearest neighbor (KNN) and fuzzy support vector machine (FSVM) combined with exhaustive search (ES), were employed to identify a subset of metabolites (biomarkers) that best predict liver failure. Based on the achieved experimental dataset, 93.62% predictive accuracy by 6 features was selected with FSVM-ES and three key metabolites, glyeerie acid, cis-aeonitie acid and citric acid, are identified as potential diagnostic biomarkers. 展开更多
关键词 Metabolite profile analysis Potential diagnostic biomarker identification k-nearest neighbor knn Fuzzy supportvector machine (FSVM) Exhaustive search (ES) Gas chromatography-mass spectrometry (GC-MS) Hepatitis B virus (HBV)-induced liver failure
下载PDF
BC-iDistance:基于位码的优化高维索引 被引量:3
2
作者 梁俊杰 冯玉才 《小型微型计算机系统》 CSCD 北大核心 2007年第9期1647-1651,共5页
在高维空间KNN查询算法中,近似向量和一维转换表示法能有效克服维数灾难,本文结合这两种思想,提出一种基于位码的优化高维索引结构(BC-iDistance).针对iDistance缺点,高维向一维转换引起的大量数据信息丢失,BC-iDistance不仅利用一维距... 在高维空间KNN查询算法中,近似向量和一维转换表示法能有效克服维数灾难,本文结合这两种思想,提出一种基于位码的优化高维索引结构(BC-iDistance).针对iDistance缺点,高维向一维转换引起的大量数据信息丢失,BC-iDistance不仅利用一维距离表示点对象和参考点间的远近关系,而且引入位码近似表示它们之间的位置关系,将高维向量压缩为二维向量表示.利用特殊的B+树组织,KNN检索时实现两层剪枝处理,降低I/O和距离计算代价.采用模拟数据和真实数据,实验验证了优化后的索引具有更高的检索效率. 展开更多
关键词 高维索引 knn查询位码 近似向量
下载PDF
基于KNN算法的组合式非搜索特征选择算法 被引量:6
3
作者 苏映雪 付耀文 《计算机工程》 CAS CSCD 北大核心 2007年第18期217-218,221,共3页
随着特征维数的不断增长,搜索性特征选择算法付出巨大的时间代价,而非搜索性算法则由于其时间代价小,而且能有效去除冗余特征等优越性越来越受到关注。该文介绍了一种非搜索性算法——KNN特征选择算法,该算法通过计算特征间的相关性来... 随着特征维数的不断增长,搜索性特征选择算法付出巨大的时间代价,而非搜索性算法则由于其时间代价小,而且能有效去除冗余特征等优越性越来越受到关注。该文介绍了一种非搜索性算法——KNN特征选择算法,该算法通过计算特征间的相关性来消除冗余特征,时间代价小。在此基础上,该文提出了一种基于KNN算法的组合式非搜索特征选择算法。 展开更多
关键词 特征选择 非搜索 最大信息压缩指数 knn
下载PDF
LBD:基于局部位码比较的高维空间KNN搜索算法 被引量:3
4
作者 梁俊杰 冯玉才 《计算机科学》 CSCD 北大核心 2007年第6期145-148,161,共5页
利用高维数据空间合理划分,提出一种简单有效的KNN检索算法-LBD。通过聚类将数据划分成多个子集空间,对每个聚类子集内的高维向量,利用距离和位码定义简化表示形式。KNN搜索时,首先利用距离信息确定候选范围,然后利用某些维上的位码不... 利用高维数据空间合理划分,提出一种简单有效的KNN检索算法-LBD。通过聚类将数据划分成多个子集空间,对每个聚类子集内的高维向量,利用距离和位码定义简化表示形式。KNN搜索时,首先利用距离信息确定候选范围,然后利用某些维上的位码不相同信息进一步缩小搜索范围,提高剪枝效率。位码字符串比较时,按照维度贡献优先顺序,大大加快非候选点过滤。LBD利用特殊的B+树组织,降低I/O和距离计算代价。采用模拟数据和真实数据,实验验证了LBD具有更高的检索效率。 展开更多
关键词 高维索引 knn查询 位码 近似向量
下载PDF
利用分区和距离实现高维空间快速KNN查询 被引量:4
5
作者 梁俊杰 王长磊 《计算机研究与发展》 EI CSCD 北大核心 2007年第11期1980-1985,共6页
在高维空间KNN查询算法中,近似向量和一维转换表示法能有效克服维数灾难,结合这两种思想,提出一种基于区位码和距离的索引结构(BD)以实现快速KNN查询.根据高维空间向量分布特点,合理分区使得大量分布在空间表面的点尽可能地划分到不同... 在高维空间KNN查询算法中,近似向量和一维转换表示法能有效克服维数灾难,结合这两种思想,提出一种基于区位码和距离的索引结构(BD)以实现快速KNN查询.根据高维空间向量分布特点,合理分区使得大量分布在空间表面的点尽可能地划分到不同的分区中,提高检索剪枝效率.引入区位码概念和转换函数,将高维向量近似表示并转换为一维数值形式,组织成B+树索引.利用快速KNN查询算法,实现两层过滤,缩小搜索范围,降低树搜索代价.采用模拟数据和真实数据,大量实验验证了BD比其他同类索引具有更高的检索效率. 展开更多
关键词 高维向量空间 knn查询 区位码 近似向量 索引结构
下载PDF
一种高维向量空间K近邻快速搜索方法 被引量:5
6
作者 徐国天 《小型微型计算机系统》 CSCD 北大核心 2020年第11期2274-2281,共8页
针对基于Ball-tree结构的KNN算法初始K个近邻点位置固定,导致剪枝半径过大,剪枝效果差,查询效率低的问题,本文提出一种基于“双树”结构的高维向量空间K近邻快速搜索方法.在训练阶段,将原始数据集按照8∶2比例划分为训练集和测试集,利... 针对基于Ball-tree结构的KNN算法初始K个近邻点位置固定,导致剪枝半径过大,剪枝效果差,查询效率低的问题,本文提出一种基于“双树”结构的高维向量空间K近邻快速搜索方法.在训练阶段,将原始数据集按照8∶2比例划分为训练集和测试集,利用随机选择方法共生成10组训练和测试集合,通过统计分析,得到最优“双树”构造参数.利用最优参数从原始数据点集合中过滤出极少量数据点构成剪枝树,过滤剩余数据点构成被删树,剪枝树需要最大限度地保留原始数据点集合在高维空间的分布形态.在查询阶段,由于剪枝树内数据点个数很少,可以快速定位最近邻点,再利用这个近邻点作为被删树的初始近邻点,在被删树内搜索K近邻.实验结果表明,由于初始近邻点位置不再固定,而是位于待查点附近,有效缩小了剪枝半径,改善了剪枝效果,提升了K近邻查询效率. 展开更多
关键词 Ball-tree 双树 knn 高维空间 搜索
下载PDF
基于指数平滑和WKNN的金融时间序列相似性搜索 被引量:4
7
作者 张乔夫 何文明 《现代计算机》 2019年第29期21-25,共5页
采用三重指数移动平均平滑金融时间序列。使用动态时间弯曲方法,计算当前样本与历史高收益样本之间的柔性距离。平均收益随平滑次数(0~3次)增加而提高;收益率加权KNN优于中位数KNN,后者又优于1NN;观察长度等于50时,平均收益最高。最优... 采用三重指数移动平均平滑金融时间序列。使用动态时间弯曲方法,计算当前样本与历史高收益样本之间的柔性距离。平均收益随平滑次数(0~3次)增加而提高;收益率加权KNN优于中位数KNN,后者又优于1NN;观察长度等于50时,平均收益最高。最优参数可以将平均收益从2.02%提高到4.8%。 展开更多
关键词 加权knn 动态时间弯曲 相似性搜索 金融时间序列
下载PDF
KNN-FCM聚类算法在中文搜索引擎文本过滤中的应用 被引量:2
8
作者 张俊丽 张帆 《图书与情报》 CSSCI 2007年第4期48-51,62,共5页
目前,大多数搜索引擎都是用相关度或page-rank或HITS(Hyperlink-Induced Topic Search)算法对匹配的结果进行排序,然后以列表的方式呈现给用户。事实表明:其索引质量不高,对所收集的信息缺乏有效的分类处理,用户面对成千上万的搜索结果... 目前,大多数搜索引擎都是用相关度或page-rank或HITS(Hyperlink-Induced Topic Search)算法对匹配的结果进行排序,然后以列表的方式呈现给用户。事实表明:其索引质量不高,对所收集的信息缺乏有效的分类处理,用户面对成千上万的搜索结果无法一一查看,而真正符合需要的搜索结果常常因为排在后面而被漏检,返回的结果只有极少部分得到了用户的有效利用。文章提出运用基于K近邻的模糊C均值算法(以下简称KNN-FCM)对搜索引擎的初始结果进行自动聚类,系统再针对用户作出的适时反馈进行相应的输出调整,从而方便用户查找信息。 展开更多
关键词 搜索引擎 knn 模糊C均值 文本过滤
下载PDF
基于多标签学习的旋转机械分级复合故障诊断 被引量:2
9
作者 马鑫 陈庆 +2 位作者 柴榕敏 崔明亮 王友清 《控制与决策》 EI CSCD 北大核心 2022年第7期1772-1778,共7页
传统故障诊断方法大多是针对单一故障类型,然而在实际工业中多种故障会同时出现,即复合故障.针对复合故障诊断问题,一些学者引入多标签学习思想,多标签K近邻算法(ML-KNN)就是其中之一.然而ML-KNN算法作为一阶算法,只考虑标签与对应样本... 传统故障诊断方法大多是针对单一故障类型,然而在实际工业中多种故障会同时出现,即复合故障.针对复合故障诊断问题,一些学者引入多标签学习思想,多标签K近邻算法(ML-KNN)就是其中之一.然而ML-KNN算法作为一阶算法,只考虑标签与对应样本数据间的关系,却忽略了标签间的联系.针对该问题提出一种分级多标签学习算法,名为分层多标签K近邻算法(HML-KNN).HML-KNN算法将机械设备的退化阶段和故障类型分为两级,将第1级得到的标签信息进行转化,转化后的信息作为新特征放入第2级进行判断.HML-KNN算法是一种高阶算法,考虑了全局的标签信息,并在算法中包含了标签的特征转化,使得到的结果准确率更高.最后通过XJTU-SY数据集验证HML-KNN算法在处理复合故障诊断问题上的优越性. 展开更多
关键词 多标签学习 ML-knn 复合故障 故障诊断 分级处理 相似性搜索
原文传递
高维主存kNN连接索引结构的核心算法
10
作者 刘艳 郝忠孝 《计算机科学》 CSCD 北大核心 2011年第9期146-149,共4页
kNN(k最近邻)连接是高维数据库中的一种重要但代价昂贵的基本操作。随着RAM容量越来越大且价格逐渐低廉,更多的数据集能够被装入主存。如何实现快速主存kNN连接,引起人们的关注。索引Δ-tree-R和-Δtree-S是根据kNN连接的特点专门为主存... kNN(k最近邻)连接是高维数据库中的一种重要但代价昂贵的基本操作。随着RAM容量越来越大且价格逐渐低廉,更多的数据集能够被装入主存。如何实现快速主存kNN连接,引起人们的关注。索引Δ-tree-R和-Δtree-S是根据kNN连接的特点专门为主存kNN连接设计的索引。结合编码、节点中心重合技术,给出了构建Δ-tree-R和-Δtree-S的核心算法及相关证明,实验表明,基于该索引的主存kNN连接算法-Δtree-KNN-Join明显优于目前已存在的可用于主存的kNN连接算法Gorder。 展开更多
关键词 knn连接 高维空间 主存 索引结构 knn搜索
下载PDF
对ORL人脸数据库识别过程中的参数选择策略 被引量:1
11
作者 冯加明 《计算机时代》 2022年第2期27-30,共4页
对ORL人脸数据库的识别大致分为两步骤:使用PCA对训练集降维提取特征向量和使用KNN对样本集进行分类。在该过程中,有两个参数直接影响着人脸识别的准确率:PCA选取的特征向量数目n和KNN中的k值。如果对它们的选取没有一个良好的策略,就... 对ORL人脸数据库的识别大致分为两步骤:使用PCA对训练集降维提取特征向量和使用KNN对样本集进行分类。在该过程中,有两个参数直接影响着人脸识别的准确率:PCA选取的特征向量数目n和KNN中的k值。如果对它们的选取没有一个良好的策略,就会出现正确率太低、时间复杂度太高、过拟合等问题。文章采用状态空间搜索找到准确率与时间复杂度中的平衡点,得到了有效的搜索结果。 展开更多
关键词 人脸识别 PCA knn 图搜索
下载PDF
Performance Estimation of Machine Learning Algorithms in the Factor Analysis of COVID-19 Dataset 被引量:2
12
作者 Ashutosh Kumar Dubey Sushil Narang +2 位作者 Abhishek Kumar Satya Murthy Sasubilli Vicente García-Díaz 《Computers, Materials & Continua》 SCIE EI 2021年第2期1921-1936,共16页
Novel Coronavirus Disease(COVID-19)is a communicable disease that originated during December 2019,when China officially informed the World Health Organization(WHO)regarding the constellation of cases of the disease in... Novel Coronavirus Disease(COVID-19)is a communicable disease that originated during December 2019,when China officially informed the World Health Organization(WHO)regarding the constellation of cases of the disease in the city of Wuhan.Subsequently,the disease started spreading to the rest of the world.Until this point in time,no specific vaccine or medicine is available for the prevention and cure of the disease.Several research works are being carried out in the fields of medicinal and pharmaceutical sciences aided by data analytics and machine learning in the direction of treatment and early detection of this viral disease.The present report describes the use of machine learning algorithms[Linear and Logistic Regression,Decision Tree(DT),K-Nearest Neighbor(KNN),Support Vector Machine(SVM),and SVM with Grid Search]for the prediction and classification in relation to COVID-19.The data used for experimentation was the COVID-19 dataset acquired from the Center for Systems Science and Engineering(CSSE),Johns Hopkins University(JHU).The assimilated results indicated that the risk period for the patients is 12–14 days,beyond which the probability of survival of the patient may increase.In addition,it was also indicated that the probability of death in COVID cases increases with age.The death probability was found to be higher in males as compared to females.SVM with Grid search methods demonstrated the highest accuracy of approximately 95%,followed by the decision tree algorithm with an accuracy of approximately 94%.The present study and analysis pave a way in the direction of attribute correlation,estimation of survival days,and the prediction of death probability.The findings of the present study clearly indicate that machine learning algorithms have strong capabilities of prediction and classification in relation to COVID-19 as well. 展开更多
关键词 COVID-19 linear and logistic regression DT knn SVM SVMwith grid search
下载PDF
集中式环境下的局部敏感哈希算法综述 被引量:1
13
作者 刘根平 《移动通信》 2015年第10期46-51,共6页
局部敏感哈希算法是一种很流行的高维相似性查找算法。通过总结多篇已发表论文,介绍了集中式环境下的局部敏感哈希算法及其实现,分析了各种局部敏感哈希算法的特点和优缺点。在近似最近邻查询中的广泛应用证实了局部敏感哈希算法的有效性。
关键词 高维数据 相似性搜索 knn查询 局部敏感哈希算法
下载PDF
一种基于贪婪算法的KNN参数选择策略 被引量:1
14
作者 金自翔 戴新宇 陈家骏 《广西师范大学学报(自然科学版)》 CAS 北大核心 2008年第1期182-185,共4页
K近邻算法是基于向量空间模型的最好的文本分类算法之一。使用KNN算法时通常要用贪婪算法进行参数选择,最终的参数不仅取决于每个参数的初始值及候选值,而且和参数选择的顺序密切相关。不同的参数选择策略间存在较大差异,通过实验,指出... K近邻算法是基于向量空间模型的最好的文本分类算法之一。使用KNN算法时通常要用贪婪算法进行参数选择,最终的参数不仅取决于每个参数的初始值及候选值,而且和参数选择的顺序密切相关。不同的参数选择策略间存在较大差异,通过实验,指出了KNN算法进行文本分类时一个较好的参数选择策略。 展开更多
关键词 文本分类 K近邻 参数调节 贪婪算法
下载PDF
基于点云数据的牙齿表面重建算法 被引量:1
15
作者 曹巍 袁赞 吴志红 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第3期517-522,共6页
由三维扫描仪对牙齿进行扫描,得到散乱的点云模型,首先通过构建K-D树的方法对每个点进行K邻域搜索;然后根据这种邻域关系,利用最小二乘原理拟合平面,估算出每个点的法向量信息;接着确定点云边界,选取极值点作为初始点并建立种子三角形;... 由三维扫描仪对牙齿进行扫描,得到散乱的点云模型,首先通过构建K-D树的方法对每个点进行K邻域搜索;然后根据这种邻域关系,利用最小二乘原理拟合平面,估算出每个点的法向量信息;接着确定点云边界,选取极值点作为初始点并建立种子三角形;最后采用基于多约束的局部最优三角网格生长算法,从种子三角形开始,以边为扩展条件,逐层搜索点并建立新的三角形;在此过程中添加了四个约束条件,能够较好的选取扩展点并对已存在的三角形边向外扩展,从而形成互相邻接的三角形网格,实现了牙齿表面的重建. 展开更多
关键词 点云模型 K邻域搜索 最小二乘 区域增长 三维表面重建
原文传递
Efficient secure and verifiable KNN set similarity search over outsourced clouds
16
作者 Xufeng Jiang Lu Li 《High-Confidence Computing》 2023年第1期38-46,共9页
KNN set similarity search is a foundational operation in various realistic applications in cloud computing.However,for security consideration,sensitive data will always be encrypted before uploading to the cloud serve... KNN set similarity search is a foundational operation in various realistic applications in cloud computing.However,for security consideration,sensitive data will always be encrypted before uploading to the cloud servers,which makes the search processing a challenging task.In this paper,we focus on the problem of KNN set similarity search over the encrypted datasets.We use Yao’s garbled circuits and secret sharing as underlying tools.To achieve better querying efficiency,we construct a secure R-Tree index structure based on a novel secure grouping protocol,which enables grouping appropriate private values in an oblivious way.Along with several elaborately designed secure arithmetic subroutines,we propose an efficient secure and verifiable KNN set similarity search framework over outsourced clouds.Theoretically,we analyze the complexity of our schemes in detail,and prove the security in the presence of semi-honest adversaries.Finally,we evaluate the performance and feasibility of our proposed methods by extensive experiments. 展开更多
关键词 Privacy preservation knn set similarity search Yao’s garbled circuits Cloud computing
原文传递
BC-iDistance:an optimized high-dimensional index for KNN processing
17
作者 梁俊杰 冯玉才 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2008年第6期856-861,共6页
To facilitate high-dimensional KNN queries,based on techniques of approximate vector presentation and one-dimensional transformation,an optimal index is proposed,namely Bit-Code based iDistance(BC-iDistance).To overco... To facilitate high-dimensional KNN queries,based on techniques of approximate vector presentation and one-dimensional transformation,an optimal index is proposed,namely Bit-Code based iDistance(BC-iDistance).To overcome the defect of much information loss for iDistance in one-dimensional transformation,the BC-iDistance adopts a novel representation of compressing a d-dimensional vector into a two-dimensional vector,and employs the concepts of bit code and one-dimensional distance to reflect the location and similarity of the data point relative to the corresponding reference point respectively.By employing the classical B+tree,this representation realizes a two-level pruning process and facilitates the use of a single index structure to further speed up the processing.Experimental evaluations using synthetic data and real data demonstrate that the BC-iDistance outperforms the iDistance and sequential scan for KNN search in high-dimensional spaces. 展开更多
关键词 high-dimensional index knn search bit code approximate vector
下载PDF
Indexing the bit-code and distance for fast KNN search in high-dimensional spaces
18
作者 LIANG Jun-jie FENG Yu-cai 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2007年第6期857-863,共7页
Various index structures have recently been proposed to facilitate high-dimensional KNN queries, among which the techniques of approximate vector presentation and one-dimensional (1D) transformation can break the curs... Various index structures have recently been proposed to facilitate high-dimensional KNN queries, among which the techniques of approximate vector presentation and one-dimensional (1D) transformation can break the curse of dimensionality. Based on the two techniques above, a novel high-dimensional index is proposed, called Bit-code and Distance based index (BD). BD is based on a special partitioning strategy which is optimized for high-dimensional data. By the definitions of bit code and transformation function, a high-dimensional vector can be first approximately represented and then transformed into a 1D vector, the key managed by a B+-tree. A new KNN search algorithm is also proposed that exploits the bit code and distance to prune the search space more effectively. Results of extensive experiments using both synthetic and real data demonstrated that BD out- performs the existing index structures for KNN search in high-dimensional spaces. 展开更多
关键词 High-dimensional spaces knn search Bit-code and distance based index (BD) Approximate vector
下载PDF
用卫星数据域改善高维数据的相似性检索性能
19
作者 常立喆 李贵 +2 位作者 周项敏 王国仁 廖嘉 《小型微型计算机系统》 CSCD 北大核心 2006年第4期668-672,共5页
提出了一种新的高维数据空间的索引结构XSA-tree.它扩展了现有索引结构SA-tree,提出了卫星数据域的思想,以增强索引的过滤能力.通过对根节点中数据点选取进行优化,以得到相对平衡的索引树.文中给出了该索引结构并详细介绍了相关索引算法... 提出了一种新的高维数据空间的索引结构XSA-tree.它扩展了现有索引结构SA-tree,提出了卫星数据域的思想,以增强索引的过滤能力.通过对根节点中数据点选取进行优化,以得到相对平衡的索引树.文中给出了该索引结构并详细介绍了相关索引算法.实验结果表明,该索引结构显著提高了高维数据空间中相似性检索性能.是一种有效的高维索引结构. 展开更多
关键词 高维数据 索引结构 相似性检索 knn查找
下载PDF
一种K值自适应和局部搜索的KNN矩阵修复方法
20
作者 王社会 杨俊安 《电子信息对抗技术》 2014年第6期60-63,共4页
数据在采集和传输过程中由于多种原因会造成矩阵残缺,因此在数据分析之前需要对残缺矩阵进行修复。常见的KNN修复方法 k值选取不合理,且需在整个矩阵中搜索近邻,影响算法的修复效果。在其基础上提出了一种k值自适应的局部KNN矩阵修复方... 数据在采集和传输过程中由于多种原因会造成矩阵残缺,因此在数据分析之前需要对残缺矩阵进行修复。常见的KNN修复方法 k值选取不合理,且需在整个矩阵中搜索近邻,影响算法的修复效果。在其基础上提出了一种k值自适应的局部KNN矩阵修复方法,合理考虑了k值的选取和近邻项的搜索范围。实验证明了该方法能有效提高矩阵修复的正确率,且算法的时效性有所提高。 展开更多
关键词 数据缺失 矩阵修复 knn理论 自适应K 局部最近邻
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部