期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
中文文本自动校对的语义级查错研究 被引量:13
1
作者 骆卫华 罗振声 龚小谨 《计算机工程与应用》 CSCD 北大核心 2003年第12期115-118,共4页
目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略... 目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略,既能检查局部语义限制,也能检查长距离的语义搭配,收到了较好的效果,也为中文自动校对的发展提供了新的思路。 展开更多
关键词 中文文本自动校对 基于实例 语义相邻矩阵 语义共现矩阵
下载PDF
A Hybrid Instance Selection Using Nearest-Neighbor for Cross-Project Defect Prediction 被引量:10
2
作者 Duksan Ryu Jong-In Jang Jongmoon Baik 《Journal of Computer Science & Technology》 SCIE EI CSCD 2015年第5期969-980,共12页
Software defect prediction (SDP) is an active research field in software engineering to identify defect-prone modules. Thanks to SDP, limited testing resources can be effectively allocated to defect-prone modules. A... Software defect prediction (SDP) is an active research field in software engineering to identify defect-prone modules. Thanks to SDP, limited testing resources can be effectively allocated to defect-prone modules. Although SDP requires sufficient local data within a company, there are cases where local data are not available, e.g., pilot projects. Companies without local data can employ cross-project defect prediction (CPDP) using external data to build classifiers. The major challenge of CPDP is different distributions between training and test data. To tackle this, instances of source data similar to target data are selected to build classifiers. Software datasets have a class imbalance problem meaning the ratio of defective class to clean class is far low. It usually lowers the performance of classifiers. We propose a Hybrid Instance Selection Using Nearest-Neighbor (HISNN) method that performs a hybrid classification selectively learning local knowledge (via k-nearest neighbor) and global knowledge (via na/ve Bayes). Instances having strong local knowledge are identified via nearest-neighbors with the same class label. Previous studies showed low PD (probability of detection) or high PF (probability of false alarm) which is impractical to overall performance as well as high PD and low PF. use. The experimental results show that HISNN produces high overall performance as well as high PD and low PF. 展开更多
关键词 software defect analysis instance-based learning nearest-neighbor algorithm data cleaning
原文传递
基于实例的隐喻理解与生成 被引量:7
3
作者 贾玉祥 俞士汶 《计算机科学》 CSCD 北大核心 2009年第3期138-141,共4页
语言中的明喻可以看作是带标记的隐喻,比较容易识别,为隐喻的理解和生成提供了很好的知识源。利用Web搜索引擎大规模获取明喻实例,自动构建明喻知识库。基于明喻知识库,考察了汉语隐喻的源域分布情况;提出了一个基于实例的隐喻自动理解... 语言中的明喻可以看作是带标记的隐喻,比较容易识别,为隐喻的理解和生成提供了很好的知识源。利用Web搜索引擎大规模获取明喻实例,自动构建明喻知识库。基于明喻知识库,考察了汉语隐喻的源域分布情况;提出了一个基于实例的隐喻自动理解和生成方法。实验结果表明,隐喻的理解和生成均取得了较高的准确率。该方法具有很好的可扩展性。明喻知识库中所表达的概念之间的组合关系也可以用于其他多种自然语言处理任务。 展开更多
关键词 基于实例 隐喻理解与生成 自然语言理解 概念组合关系
下载PDF
基于实例的任务牵引式电子对抗无人机装备教学模式 被引量:4
4
作者 赵宏涛 江平 +1 位作者 刘危 祁承超 《空军预警学院学报》 2021年第1期64-67,71,共5页
为了提升电子对抗无人机装备教学质量,首先分析了我院无人机装备教学模式现状;然后基于建构主义学习理论,将大量演训实例转化为系列化场景式任务,以弹性可行性任务的完成牵引装备教学的全过程,提出了基于实例的任务牵引式装备教学模式;... 为了提升电子对抗无人机装备教学质量,首先分析了我院无人机装备教学模式现状;然后基于建构主义学习理论,将大量演训实例转化为系列化场景式任务,以弹性可行性任务的完成牵引装备教学的全过程,提出了基于实例的任务牵引式装备教学模式;最后给出了应用举例.应用结果表明,所提模式能激发学员的主观能动性,提升其装备运用岗位任职能力. 展开更多
关键词 无人机装备教学 基于实例 任务牵引 建构主义 岗位任职能力
下载PDF
Research on Personal Credit Risk Assessment Model Based on Instance-Based Transfer Learning
5
作者 Maoguang Wang Hang Yang 《International Journal of Intelligence Science》 2021年第1期44-55,共12页
Personal credit risk assessment is an important part of the development of financial enterprises. Big data credit investigation is an inevitable trend of personal credit risk assessment, but some data are missing and ... Personal credit risk assessment is an important part of the development of financial enterprises. Big data credit investigation is an inevitable trend of personal credit risk assessment, but some data are missing and the amount of data is small, so it is difficult to train. At the same time, for different financial platforms, we need to use different models to train according to the characteristics of the current samples, which is time-consuming. <span style="font-family:Verdana;">In view of</span><span style="font-family:Verdana;"> these two problems, this paper uses the idea of transfer learning to build a transferable personal credit risk model based on Instance-based Transfer Learning (Instance-based TL). The model balances the weight of the samples in the source domain, and migrates the existing large dataset samples to the target domain of small samples, and finds out the commonness between them. At the same time, we have done a lot of experiments on the selection of base learners, including traditional machine learning algorithms and ensemble learning algorithms, such as decision tree, logistic regression, </span><span style="font-family:Verdana;">xgboost</span> <span style="font-family:Verdana;">and</span><span style="font-family:Verdana;"> so on. The datasets are from P2P platform and bank, the results show that the AUC value of Instance-based TL is 24% higher than that of the traditional machine learning model, which fully proves that the model in this paper has good application value. The model’s evaluation uses AUC, prediction, recall, F1. These criteria prove that this model has good application value from many aspects. At present, we are trying to apply this model to more fields to improve the robustness and applicability of the model;on the other hand, we are trying to do more in-depth research on domain adaptation to enrich the model.</span> 展开更多
关键词 Personal Credit Risk Big Data Credit Investigation instance-based Transfer Learning
下载PDF
Weighted Learning for Feedforward Neural Networks
6
作者 Rong-Fang Xu Thao-Tsen Chen Shie-Jue Lee 《Journal of Electronic Science and Technology》 CAS 2014年第3期299-304,共6页
In this paper, we propose two weighted learning methods for the construction of single hidden layer feedforward neural networks. Both methods incorporate weighted least squares. Our idea is to allow the training insta... In this paper, we propose two weighted learning methods for the construction of single hidden layer feedforward neural networks. Both methods incorporate weighted least squares. Our idea is to allow the training instances nearer to the query to offer bigger contributions to the estimated output. By minimizing the weighted mean square error function, optimal networks can be obtained. The results of a number of experiments demonstrate the effectiveness of our proposed methods. 展开更多
关键词 Extreme learning machine hybrid learning instance-based learning weighted least squares
下载PDF
An integrated heterogeneous web service retrieval via combination of instance-and metadata-based schema matching method
7
作者 Jie HE Wei WANG 《Geo-Spatial Information Science》 SCIE CSCD 2015年第2期111-123,共13页
Schema matching is a critical step in the integration of heterogeneous web service,which contains various types of web services and multi-version services of the same type.Mapping loss or mismatch usually occurs due t... Schema matching is a critical step in the integration of heterogeneous web service,which contains various types of web services and multi-version services of the same type.Mapping loss or mismatch usually occurs due to schema differences in structure and content and the variety in concept definition and organization.Current instance schema matching methods are not mature enough for heterogeneous web service because they cannot deal with the instance data in web service domain and capture all the semantics,especially metadata semantics.The metadata-based and the instance-based matching methods,in the case of being employed individually,are not efficient to determine the concept relationships,which are crucial for finding high-quality matches between schema attributes.In this paper,we propose an improved schema matching method,based on the combination of instance and metadata(CIM)matcher.The main method of our approach is to utilize schema structure,element labels,and the corresponding instance data information.The matching process is divided into two phases.In the first phase,the metadata-based matchers are used to compute the element label similarity of multi-version open geospatial consortium web service schema,and the generated matching results are raw mappings,which will be reused in the next instance matching phase.In the second phase,the designed instance matching algorithms are employed to the instance data of the raw mappings and fine mappings are generated.Finally,the raw mappings and the fine mappings are combined,and the final mappings are obtained.Our experiments are executed on different versions of web coverage service and web feature service instance data deployed in Geoserver.The results indicate that,the CIM method can obtain more accurate matching results and is flexible enough to handle the web service instance data. 展开更多
关键词 schema matching web coverage service(WCS) metadata-based matcher instance-based matcher web feature service(WFS)
原文传递
Machine Learning: A Review
8
作者 Isonkobong Christopher Udousoro 《Semiconductor Science and Information Devices》 2020年第2期5-14,共10页
Due to the complexity of data,interpretation of pattern or extraction of information becomes difficult;therefore application of machine learning is used to teach machines how to handle data more efficiently.With the i... Due to the complexity of data,interpretation of pattern or extraction of information becomes difficult;therefore application of machine learning is used to teach machines how to handle data more efficiently.With the increase of datasets,various organizations now apply machine learning applications and algorithms.Many industries apply machine learning to extract relevant information for analysis purposes.Many scholars,mathematicians and programmers have carried out research and applied several machine learning approaches in order to find solution to problems.In this paper,we focus on general review of machine learning including various machine learning techniques.These techniques can be applied to different fields like image processing,data mining,predictive analysis and so on.The paper aims at reviewing machine learning techniques and algorithms.The research methodology is based on qualitative analysis where various literatures is being reviewed based on machine learning. 展开更多
关键词 Machine learning Supervised learning Unsupervised learning Reinforcement learning Semi-supervised learning Multitask learning Ensemble learning Neural Network instance-based
下载PDF
一种提高K-近邻算法效率的新算法 被引量:22
9
作者 陆微微 刘晶 《计算机工程与应用》 CSCD 北大核心 2008年第4期163-165,178,共4页
K-近邻(K-Nearest-Neighbor,KNN)算法是一种最基本的基于实例的学习方法,被广泛应用于机器学习与数据挖掘。其学习过程只是简单地存储已知的训练数据。当遇到新的查询实例时,一系列相似的实例被从存储器中取出,并用来分类新的查询实例。... K-近邻(K-Nearest-Neighbor,KNN)算法是一种最基本的基于实例的学习方法,被广泛应用于机器学习与数据挖掘。其学习过程只是简单地存储已知的训练数据。当遇到新的查询实例时,一系列相似的实例被从存储器中取出,并用来分类新的查询实例。KNN的一个不足是分类新实例的开销可能很大。这是因为几乎所有的计算都发生在分类时,而不是在第一次遇到训练实例时。所以,如何有效地索引训练实例,以减少查询时所需计算是一个重要的实践问题。为解决这个问题,提出了一种新的算法。该算法把部分原本发生在分类阶段的计算移到训练阶段来完成。实验表明,算法能够提高KNN效率80%以上。此外,算法的思想还可以应用于KNN的所有变体中。 展开更多
关键词 K-近邻算法 器于买例的字习 效率 分类
下载PDF
基于IBL算法的CBR系统中索引与检索机制研究 被引量:6
10
作者 郭茂祖 苏晓红 +1 位作者 王亚东 李媛 《计算机工程与应用》 CSCD 北大核心 2001年第5期67-69,95,共4页
文章介绍了基于示例学习算法IBL的概况,并对其加以改进,提出了一个新的算法IBL-Cluster。它主要由概念描述形成算法和概念描述修改算法构成。在此基础上建立了应用在基于事例的推理系统CBR中的基于IBL算法的索引与检索机制。实验表... 文章介绍了基于示例学习算法IBL的概况,并对其加以改进,提出了一个新的算法IBL-Cluster。它主要由概念描述形成算法和概念描述修改算法构成。在此基础上建立了应用在基于事例的推理系统CBR中的基于IBL算法的索引与检索机制。实验表明新算法IBL-Cluster在存储空间及测试正确率方面均有改善。 展开更多
关键词 人工智能 IBL算法 CBR系统 索引 检索 机器学习
下载PDF
基于K-最近邻的导弹靶试数据分析方法 被引量:7
11
作者 郑鹍鹏 李海峰 华建林 《航空兵器》 2011年第3期7-10,共4页
导弹气动模型是控制系统设计、系统仿真、性能评估的前提和基础。如何从飞行试验数据中获取对导弹气动特性的准确描述是导弹气动力建模方面的一个重要问题。本文将K-最近邻算法引入靶试数据气动力辨识分析,并针对数据特点采取了相应的... 导弹气动模型是控制系统设计、系统仿真、性能评估的前提和基础。如何从飞行试验数据中获取对导弹气动特性的准确描述是导弹气动力建模方面的一个重要问题。本文将K-最近邻算法引入靶试数据气动力辨识分析,并针对数据特点采取了相应的改进措施,建立了基于气动力辨识数据的气动力模型,为飞行试验数据的应用拓宽了思路。验证结果表明,K-最近邻模型预测结果接近气动力真值,从而证明了方法的可行性。 展开更多
关键词 气动辨识 实例学习 K-最近邻
下载PDF
基于实例迁移的跨项目软件缺陷预测 被引量:7
12
作者 毛发贵 李碧雯 沈备军 《计算机科学与探索》 CSCD 北大核心 2016年第1期43-55,共13页
跨项目软件缺陷预测是解决项目初期缺陷预测缺乏数据集的有效途径,但是项目间的差异性降低了预测准确率。针对这一问题,研究提出了基于实例迁移的跨项目缺陷预测方法。该方法采用迁移学习和自适应增强技术,从其他项目数据集中提取并迁... 跨项目软件缺陷预测是解决项目初期缺陷预测缺乏数据集的有效途径,但是项目间的差异性降低了预测准确率。针对这一问题,研究提出了基于实例迁移的跨项目缺陷预测方法。该方法采用迁移学习和自适应增强技术,从其他项目数据集中提取并迁移转化出与目标数据集关联性高的训练数据集,训练出更有效的预测模型。使用PROMISE数据集进行了对比实验,结果表明所提出的新方法有效避免了单源单目标缺陷预测两极分化问题,获得了更高的预测准确率和查全率;在目标项目数据集不足的情况下,能达到甚至超过数据集充足时项目内缺陷预测的预测效果。 展开更多
关键词 跨项目缺陷预测 迁移学习 基于实例的迁移 自适应增强
下载PDF
基于实例迁移学习的跨工况刀具剩余寿命预测
13
作者 强碧瑶 史恺宁 +1 位作者 任军学 史耀耀 《航空学报》 EI CAS CSCD 北大核心 2024年第13期197-209,共13页
精确可靠的刀具剩余寿命预测可以减少加工过程中刀具过度使用和未充分使用的比率,从而最大限度地提高加工可靠性并降低生产成本。传统机器学习方法在预测刀具剩余寿命时依赖于训练数据和测试数据遵循相同分布的假设,以及广泛的离线测量... 精确可靠的刀具剩余寿命预测可以减少加工过程中刀具过度使用和未充分使用的比率,从而最大限度地提高加工可靠性并降低生产成本。传统机器学习方法在预测刀具剩余寿命时依赖于训练数据和测试数据遵循相同分布的假设,以及广泛的离线测量数据。然而在实际加工过程中,由于加工条件的变化和有限的刀具磨损数据,致使传统方法在跨工况预测刀具剩余寿命时精度较差。针对该问题,提出一种基于实例迁移学习的刀具剩余寿命预测方法,以达到准确预测跨工况条件下刀具剩余寿命的目的。首先,利用迁移学习算法动态调整多个源域中所有实例的权重,充分利用与目标数据高度相关的源域信息来改善模型的泛化能力,从而利用少量目标域数据预测目标工况下的刀具剩余寿命。其次,为了提升迁移学习算法的时间序列预测能力,开发了递归高斯过程回归模型作为基学习器,通过延迟反馈对相邻时刻的刀具剩余寿命进行约束,与此同时还减少了特征准备工作并降低了模型复杂度。结果表明,该方法可以有效提升跨工况下刀具剩余寿命的预测精度,预测效果也证实了方法的稳定性和可靠性。 展开更多
关键词 跨工况 实例迁移学习 递归高斯过程回归 时间序列预测 刀具剩余寿命
原文传递
基于改进实例学习算法的风电机组齿轮箱状态监测
14
作者 张书瑶 刘长良 +2 位作者 王梓齐 刘帅 刘卫亮 《动力工程学报》 CAS CSCD 北大核心 2024年第10期1620-1631,共12页
风电机组齿轮箱的运行过程是复杂的非线性过程,采用实例学习(IBL)算法建立模型可有效对其进行状态监测。针对实例学习模型对训练数据质量敏感的特点,提出综合考虑多种性质的两步主动学习样本选择方法。首先提出一种基于拉丁超立方体抽... 风电机组齿轮箱的运行过程是复杂的非线性过程,采用实例学习(IBL)算法建立模型可有效对其进行状态监测。针对实例学习模型对训练数据质量敏感的特点,提出综合考虑多种性质的两步主动学习样本选择方法。首先提出一种基于拉丁超立方体抽样思想的网格划分初始样本选取方法,并基于z-score方法剔除其中的离群点。然后第一步基于信息性和代表性的综合得分选出候选样本来避免离群点影响,第二步基于多样性使第一步的候选样本稀疏化,从而避免冗余点影响。最后,基于指数加权移动平均控制图对实例学习回归模型输出的残差进行分析,并根据故障率对风电机组齿轮箱实现状态监测。利用某风电机组实际故障数据进行验证。结果表明:所提出的方法能选出优质样本,模型精度在验证集上较未改进前有所提升,且运算效率提升约50%,可实现齿轮箱异常的早期预警。 展开更多
关键词 风电机组齿轮箱 状态监测 样本选择 主动学习算法 拉丁超立方体抽样 实例学习算法
下载PDF
基于元学习的软件缺陷预测推荐方法 被引量:3
15
作者 程俊 张雪莹 李瑞贤 《中国电子科学研究院学报》 北大核心 2015年第6期620-627,共8页
基于机器学习的分类算法已被广泛地应用于预测软件缺陷。然而,软件缺陷数据的多样化,导致单一分类算法难以在所有的软件缺陷预测过程中均获得最优的分类性能,即不同的数据集上最适用的分类算法也不尽相同。本文提出了一种基于元学习和... 基于机器学习的分类算法已被广泛地应用于预测软件缺陷。然而,软件缺陷数据的多样化,导致单一分类算法难以在所有的软件缺陷预测过程中均获得最优的分类性能,即不同的数据集上最适用的分类算法也不尽相同。本文提出了一种基于元学习和实例学习的软件缺陷预测算法推荐方法。该方法仅依据待预测软件缺陷数据的特征,为其推荐最适用的分类算法。 展开更多
关键词 软件缺陷预测 元学习 实例学习 算法推荐
下载PDF
基于简单查询接口的Web数据库模式识别 被引量:3
16
作者 林玲 周立柱 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第4期551-555,共5页
Web数据库(WDB)提供了不同形式的数据查询接口,基于关键字的简单查询接口(SQI)是其中一种被广泛应用的查询接口,而现有研究主要讨论通过复杂查询接口对WDB作探测查询和模式识别。为此该文提出了一种基于SQI的WDB探测查询和模式识别方法... Web数据库(WDB)提供了不同形式的数据查询接口,基于关键字的简单查询接口(SQI)是其中一种被广泛应用的查询接口,而现有研究主要讨论通过复杂查询接口对WDB作探测查询和模式识别。为此该文提出了一种基于SQI的WDB探测查询和模式识别方法。根据SQI的查询特性提出了基于SQI的满条件查询定义及其生成策略,用以识别接口模式;在结果模式识别中,通过对结果页面中的非查询关键词作扩展识别,提高了结果模式识别的属性召回率。在图书、电影和手机3个领域共35个WDB上的实验证明了该方法可以准确高效地识别数据库模式。 展开更多
关键词 WEB数据库 模式识别 简单查询接口 基于实例的探测查询
原文传递
基于实例迁移的磨煤机过程监测建模 被引量:2
17
作者 常玉清 赵炜炜 +1 位作者 刘乐源 康孝云 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第10期1369-1375,共7页
当工业生产过程数据匮乏时,很难利用基于数据统计的方法建立其过程监测模型,这给过程监测的准确性和及时性带来很大影响,迁移学习为解决上述问题提供了有效的途径.针对目标域磨煤机过程数据较少的情况,在源域磨煤机数据的基础上,建立基... 当工业生产过程数据匮乏时,很难利用基于数据统计的方法建立其过程监测模型,这给过程监测的准确性和及时性带来很大影响,迁移学习为解决上述问题提供了有效的途径.针对目标域磨煤机过程数据较少的情况,在源域磨煤机数据的基础上,建立基于实例迁移高斯混合模型(Gaussian mixture model,GMM)的目标域磨煤机过程监测模型.利用实例迁移对源域生产过程和目标域过程数据进行权重分配,通过改进的高斯混合模型算法得到最佳高斯组分数目和对应的模型参数,应用过程监测的全局概率指标实现磨煤机过程的跨域监测.磨煤机过程的研究结果验证了所提出方法的可行性和有效性. 展开更多
关键词 过程监测 高斯混合模型 实例迁移 权重分配 全局概率指标
下载PDF
基于实例学习的并行负荷分配中的训练实例选择问题
18
作者 龙舜 林永听 王会进 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期228-232,共5页
基于实例学习的可适应性并行任务负荷分配算法能根据应用程序的静态特征估计其运算负荷,选定好的任务负荷分配方案使其多线程并行接近甚至达到最优,它具有低成本和高效率的特点.通过一系列实验,分析研究训练实例的选择对基于实例学习优... 基于实例学习的可适应性并行任务负荷分配算法能根据应用程序的静态特征估计其运算负荷,选定好的任务负荷分配方案使其多线程并行接近甚至达到最优,它具有低成本和高效率的特点.通过一系列实验,分析研究训练实例的选择对基于实例学习优化的效果的影响,从中总结一些有益的经验,以便进一步提高算法性能. 展开更多
关键词 运行性能 并行化 基于实例的学习 训练实例
下载PDF
基于Fuzzy Rough集模型的汉语人称代词消解 被引量:1
19
作者 李凡 刘启和 李洪伟 《计算机科学》 CSCD 北大核心 2010年第1期245-250,共6页
指代消解是自然语言处理中重要的研究课题之一。结合基于实例的学习方法,提出了一种基于Fuzzy Rough集模型的中文人称代词消解方法。该方法的第一步过滤掉与人称代词性别和单复数特征不一致的名词短语,构成候选集,然后按照仅涉及浅层语... 指代消解是自然语言处理中重要的研究课题之一。结合基于实例的学习方法,提出了一种基于Fuzzy Rough集模型的中文人称代词消解方法。该方法的第一步过滤掉与人称代词性别和单复数特征不一致的名词短语,构成候选集,然后按照仅涉及浅层语义和语法知识的属性集对其中的每个名词短语进行标记。第二步利用Fuzzy Rough集模型中相关概念选择代表性较强的实例,并对其进行属性值约简,以提高这些实例的泛化能力。以上两步即为学习阶段。第三步即可根据这些实例判断新输入的名词短语是否为代词的先行语。该方法用人民日报语料进行了测试,测试结果表明该方法是有效的。 展开更多
关键词 指代消解 先行语 FUZZY ROUGH集 基于实例的学习
下载PDF
机器学习在产品信息字符视觉检测中的应用 被引量:1
20
作者 崔香芝 潘存海 裴志军 《天津科技大学学报》 CAS 2009年第2期47-50,共4页
现代工业自动化生产对产品信息字符视觉检测提出了更高要求.应用基于实例学习的机器学习方法,通过训练建立适合特定应用任务的字体实例和产品信息字符模式实例,获得优化检测参数,从而进行实时高效产品信息检测.
关键词 机器视觉 基于实例学习 字符模式
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部