期刊文献+
共找到2,792篇文章
< 1 2 140 >
每页显示 20 50 100
基于深度学习的文本中细粒度知识元抽取方法研究 被引量:37
1
作者 余丽 钱力 +1 位作者 付常雷 赵华茗 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第1期38-45,共8页
【目的】改进Bootstrapping方法,建立深度学习模型从文本中抽取多类型细粒度的知识元。【方法】利用搜索引擎和Elsevier关键词构建知识元词库;基于Bootstrapping技术自动构建大规模的标注语料库,利用知识元评分模型和模式评分模型控制... 【目的】改进Bootstrapping方法,建立深度学习模型从文本中抽取多类型细粒度的知识元。【方法】利用搜索引擎和Elsevier关键词构建知识元词库;基于Bootstrapping技术自动构建大规模的标注语料库,利用知识元评分模型和模式评分模型控制标注的质量;基于已标注多类型知识元的语料库训练LSTM-CRF模型,从文本中抽取新的知识元。【结果】基于17 756篇ACL论文摘要抽取"研究范畴"、"研究方法"、"实验数据"、"评价指标及取值"这4种知识元,其人工评价平均正确率为91%。【局限】模型参数的预设与调整需要人工参与,未对不同领域文本进行适用性验证。【结论】引入知识元与模式的评分模型,能够有效缓解"语义漂移"问题;基于深度学习模型抽取知识元实现快速且正确率高,为情报大数据智能分析提供了一种高效可靠的数据获取手段。 展开更多
关键词 知识元抽取 命名实体识别 深度学习 bootstrapping LSTM-CRF
原文传递
开放式地理实体关系抽取的Bootstrapping方法 被引量:26
2
作者 余丽 陆锋 刘希亮 《测绘学报》 EI CSCD 北大核心 2016年第5期616-622,共7页
从网络文本中抽取地理实体间空间关系和语义关系要求高时效性和强鲁棒性。本文提出一种开放式地理实体关系的自动抽取方法,通过bootstrapping技术统计词语的词性、位置和距离特征来计算语境中词语权值,据此确定描述地理实体关系的关键词... 从网络文本中抽取地理实体间空间关系和语义关系要求高时效性和强鲁棒性。本文提出一种开放式地理实体关系的自动抽取方法,通过bootstrapping技术统计词语的词性、位置和距离特征来计算语境中词语权值,据此确定描述地理实体关系的关键词,最终组织成结构化实例,并使用百度百科和Stanford CoreNLP开展了试验。研究结果表明,本文方法能自动挖掘自然语言的部分词法特征,无须领域专家知识和大规模标注语料,适用于未知关系类型的信息抽取任务;较之经典的Frequency、TFIDF和PPMI频率统计方法,精度和召回率分别提升约5%和23%。 展开更多
关键词 文本挖掘 地理实体 关系抽取 定量评价 bootstrapping
下载PDF
词义标注语料库建设综述 被引量:17
3
作者 金澎 吴云芳 俞士汶 《中文信息学报》 CSCD 北大核心 2008年第3期16-23,共8页
词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、词典选择、标注规模和标注质量等方面介绍已经建成的较有影响的若干词义标注语料库。在自动构建词义标注语料库的方法中,本文集中介绍bootstrapping策略... 词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、词典选择、标注规模和标注质量等方面介绍已经建成的较有影响的若干词义标注语料库。在自动构建词义标注语料库的方法中,本文集中介绍bootstrapping策略在语料库建设方面的应用以及利用双语对齐语料库开展的相关研究。最后,针对词义标注语料库建设存在的问题提出自己的分析和思考。 展开更多
关键词 计算机应用 中文信息处理 词义消歧 词义标注语料库 平行语料库 bootstrapping
下载PDF
中介效应检验方法比较 被引量:16
4
作者 许水平 尹继东 《科技管理研究》 CSSCI 北大核心 2014年第18期203-205,212,共4页
中介效应的识别与检验在社会科学研究中具有重要意义。依次介绍中介效应检验的因果分析法、系数相乘法、bootstrap法、乘积分布法等4种方法的主要思想及其发展脉络;以科技中介接受模型为例,比较不同方法对中介效应检验的结果。
关键词 中介效应 因果分析法 系数相乘法 bootstrap 乘积分布法
下载PDF
基于优化Transformer网络的绿色目标果实高效检测模型 被引量:15
5
作者 贾伟宽 孟虎 +3 位作者 马晓慧 赵艳娜 Ji Ze 郑元杰 《农业工程学报》 EI CAS CSCD 北大核心 2021年第14期163-170,共8页
果园环境中,检测目标果实易受复杂背景、果实姿态和颜色等因素影响,为提高绿色目标果实检测的精度与效率,满足果园智能测产和自动化采摘要求,本研究针对不同光照环境和果实姿态,提出一种适于样本数量不足的绿色目标果实高效检测模型。... 果园环境中,检测目标果实易受复杂背景、果实姿态和颜色等因素影响,为提高绿色目标果实检测的精度与效率,满足果园智能测产和自动化采摘要求,本研究针对不同光照环境和果实姿态,提出一种适于样本数量不足的绿色目标果实高效检测模型。该模型采用优化Transformer结构,首先借助卷积神经网络(Convolutional Neural Network,CNN)网络提取图像特征;然后输入编码-解码器生成一组目标果实预测框,最后通过前馈神经网络(Feed-forward Network,FFN)结构预测检测结果。在训练过程中,引入重采样法扩充样本数量,解决样本数量不足问题;引入迁移学习,加速网络收敛。分别制作苹果、柿子数据集用于模型训练。试验结果表明,经迁移学习后该模型训练效率大幅提高;与流行的目标检测模型相比,优化后的模型在检测绿色柿子与绿色苹果时,精度分别为93.27%和91.35%。该方法可为其他果蔬绿色目标检测提供理论借鉴。 展开更多
关键词 目标检测 绿色果实 重采样法 迁移学习 Transformer网络
下载PDF
抑郁在青少年核心自我评价与自杀意念间的中介作用:基于Bootstrap法和MCMC法的实证研究 被引量:14
6
作者 马泽威 全鹏 《心理科学》 CSSCI CSCD 北大核心 2015年第2期379-382,共4页
考察抑郁在青少年核心自我评价与自杀意念间的中介作用。对502名高中生进行量表测评。通过偏差校正的Bootstrap法和有先验信息的MCMC法求出中介效应值的95%置信区间分别为[-.030,-.011]和[-.024,-.014],提示抑郁的中介效应显著。效应量k... 考察抑郁在青少年核心自我评价与自杀意念间的中介作用。对502名高中生进行量表测评。通过偏差校正的Bootstrap法和有先验信息的MCMC法求出中介效应值的95%置信区间分别为[-.030,-.011]和[-.024,-.014],提示抑郁的中介效应显著。效应量k2、R2med分别为.124、.104,偏差校正的Bootstrap法抽样5000次后,构建的效应量的95%置信区间分别为[.070,.178]、[.063,.156],两种指标共同验证效应量为中等。研究结果说明抑郁在核心自我评价与自杀意念间起部分中介作用,效应量中等。 展开更多
关键词 抑郁 核心自我评价 自杀意念 自助抽样法 马尔科夫链的蒙特卡洛法
下载PDF
基于双层模型的维吾尔语突发事件因果关系抽取 被引量:11
7
作者 钟军 禹龙 +1 位作者 田生伟 吐尔根.依布拉音 《自动化学报》 EI CSCD 北大核心 2014年第4期771-779,共9页
针对传统事件因果关系识别覆盖范围小和人工标注代价高等不足,提出了一种基于双层模型的维吾尔语突发事件因果关系抽取方法.该方法采用分治思想,将因果关系抽取问题转化为对事件序列的两次模式识别标注.采用Bootstrapping算法,在第一次... 针对传统事件因果关系识别覆盖范围小和人工标注代价高等不足,提出了一种基于双层模型的维吾尔语突发事件因果关系抽取方法.该方法采用分治思想,将因果关系抽取问题转化为对事件序列的两次模式识别标注.采用Bootstrapping算法,在第一次模式识别时,标注因果关系的语义角色,并将标注的语义角色标签作为新的特征传递给第二层模式识别,用于因果关系边界标注.该方法用于维吾尔语突发事件显式因果关系的抽取准确率为85.39%,召回率为77.53%,证明了本文提出的方法在维吾尔语主题突发事件因果关系抽取上的有效性和实用性. 展开更多
关键词 因果关系 维吾尔语 突发事件 bootstrapping 模式软匹配
下载PDF
实体关系的自动抽取研究 被引量:10
8
作者 张素香 文娟 +2 位作者 秦颖 袁彩霞 钟义信 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2006年第B07期370-373,共4页
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地... 针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地设计了9个特征,尽可能全方位地描述文实体的真实情况.搭建了实验所需的系统框架,实现了实体关系的自动抽取.实验结果表明:该方法能够有效地解决实体关系的自动生成问题. 展开更多
关键词 极大熵 bootstrapping 特征选择 实体关系抽取 评测
下载PDF
基于BootStrapping的集成分类器的中文观点句识别方法 被引量:8
9
作者 吕云云 李旸 王素格 《中文信息学报》 CSCD 北大核心 2013年第5期84-92,共9页
领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机... 领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机和最大熵分类器。最后,通过给三个训练好的分类器赋权获得一个集成分类器。实验结果表明,集成后的分类器性能优于单分类器,并且该方法在使用部分标注训练数据的情况下也能取得与采用全部标注训练数据相近的实验结果。 展开更多
关键词 观点句识别 bootstrapping 集成分类器
下载PDF
面向信息检索的概念关系自动构建 被引量:6
10
作者 胡熠 陆汝占 刘慧 《中文信息学报》 CSCD 北大核心 2007年第5期46-50,共5页
概念之间的依存分析是提高信息检索性能的关键。相比概念关系的强弱而言,识别关系的类型更有意义。本文在Bootstrapping框架下,以"(地理)领属","(实体)功能"和"(动作)对象"三种语义关系类型为例,获得了... 概念之间的依存分析是提高信息检索性能的关键。相比概念关系的强弱而言,识别关系的类型更有意义。本文在Bootstrapping框架下,以"(地理)领属","(实体)功能"和"(动作)对象"三种语义关系类型为例,获得了构建上下文中两个概念特定关系的语义模板,并开发了一个名为SPG的系统。本文的工作:(1)引入了生物信息计算中序列比对的方法两两生成相似上下文的模板;(2)定义了新的模板评价机制估计模板的置信度。就这三种概念关系的识别而言,SPG获得的模板集合相比DIPRE系统获得了更高的正确率和覆盖能力。 展开更多
关键词 计算机应用 中文信息处理 文本检索模型 概念关系构建 bootstrapping
下载PDF
基于网络挖掘的实体关系元组自动获取 被引量:7
11
作者 李维刚 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2007年第11期2111-2116,共6页
二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一种新的从Web上抽取实体关系元组... 二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一种新的从Web上抽取实体关系元组的方法.基准方法的平均准确率达到了78.12%,采用过滤措施后抽取方法的平均准确率达到了98.42%.实验结果表明,利用网络挖掘方法获取的实体关系元组能够很好满足信息抽取的应用,对抽取出的元组进一步处理,能够获取更多有价值的信息. 展开更多
关键词 自举方法 实体关系 元组 信息抽取 网络挖掘
下载PDF
On Splitting Training and Validation Set:A Comparative Study of Cross-Validation,Bootstrap and Systematic Sampling for Estimating the Generalization Performance of Supervised Learning 被引量:8
12
作者 Yun Xu Royston Goodacre 《Journal of Analysis and Testing》 EI 2018年第3期249-262,共14页
Model validation is the most important part of building a supervised model.For building a model with good generalization performance one must have a sensible data splitting strategy,and this is crucial for model valid... Model validation is the most important part of building a supervised model.For building a model with good generalization performance one must have a sensible data splitting strategy,and this is crucial for model validation.In this study,we con-ducted a comparative study on various reported data splitting methods.The MixSim model was employed to generate nine simulated datasets with different probabilities of mis-classification and variable sample sizes.Then partial least squares for discriminant analysis and support vector machines for classification were applied to these datasets.Data splitting methods tested included variants of cross-validation,bootstrapping,bootstrapped Latin partition,Kennard-Stone algorithm(K-S)and sample set partitioning based on joint X-Y distances algorithm(SPXY).These methods were employed to split the data into training and validation sets.The estimated generalization performances from the validation sets were then compared with the ones obtained from the blind test sets which were generated from the same distribution but were unseen by the train-ing/validation procedure used in model construction.The results showed that the size of the data is the deciding factor for the qualities of the generalization performance estimated from the validation set.We found that there was a significant gap between the performance estimated from the validation set and the one from the test set for the all the data splitting methods employed on small datasets.Such disparity decreased when more samples were available for training/validation,and this is because the models were then moving towards approximations of the central limit theory for the simulated datasets used.We also found that having too many or too few samples in the training set had a negative effect on the estimated model performance,suggesting that it is necessary to have a good balance between the sizes of training set and validation set to have a reliable estimation of model performance.We also found that systematic sampling method such a 展开更多
关键词 Cross-validation bootstrapping bootstrapped Latin partition Kennard-Stone algorithm SPXY Model selection Model validation Partial least squares for discriminant analysis Support vector machines
原文传递
亚热带森林土壤理化性质的异质性和最佳取样量 被引量:8
13
作者 张广杰 巢林 +3 位作者 张伟东 汪思龙 余鑫 郑文辉 《应用生态学报》 CAS CSCD 北大核心 2018年第7期2139-2148,共10页
准确获取最佳取样量有助于提高土壤理化性质的测量精度.采用经典统计学方法,研究了亚热带常绿阔叶林和杉木人工林2个林型土壤理化性质的异质性,运用传统法和自助法研究在90%精度下评估土壤养分含量的最佳取样量.结果表明:2个林型中土壤p... 准确获取最佳取样量有助于提高土壤理化性质的测量精度.采用经典统计学方法,研究了亚热带常绿阔叶林和杉木人工林2个林型土壤理化性质的异质性,运用传统法和自助法研究在90%精度下评估土壤养分含量的最佳取样量.结果表明:2个林型中土壤pH值和C/N表现为弱变异,其他养分指标均为中等程度变异;常绿阔叶林土壤全C、全N等全量土壤指标的变异系数显著大于杉木人工林,而速效指标差异不显著;2个林型中所有土壤指标的评估误差均随取样量的增加呈现出先急剧曲线下降后稳定的趋势,均值也由剧烈波动转向平稳,并且过多的取样并不能有效提高均值测定精度;常绿阔叶林土壤含水率、全C、全N、NO_3^--N、全K、全Ca、全Mg的取样量都显著大于杉木人工林,杉木林土壤NH_4^+-N的取样量显著大于阔叶林,而其他指标二者间差异不显著;同一林型各个指标间取样量差异更加明显,NH_4^+-N、NO_3^--N等速效指标的取样量显著大于全C、全N等全量指标.因此,建议在土壤调查或监测过程中充分考虑土壤理化性质的异质性,最佳取样量必须依据于取样的目的和土壤指标的变异信息. 展开更多
关键词 常绿阔叶林 土壤异质性 取样设计 最佳取样量 自助法
原文传递
基于语义模式的半监督中文观点句识别研究 被引量:5
14
作者 刘荣 郝晓燕 李颖 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第5期967-973,共7页
大规模和高质量的标注语料是进行监督算法分类器训练的重要前提,而进行大规模的语料标注是一项费时费力的工作,并且针对特定的领域还需要该领域专家的介入.提出一种基于语义模式的半监督中文观点句识别方法,可以通过小规模语料的训练识... 大规模和高质量的标注语料是进行监督算法分类器训练的重要前提,而进行大规模的语料标注是一项费时费力的工作,并且针对特定的领域还需要该领域专家的介入.提出一种基于语义模式的半监督中文观点句识别方法,可以通过小规模语料的训练识别出中文观点句.首先,通过语义模型提取算法从训练集当中识别出观点句语义模型和非观点句语义模型;然后,将两种模型转化为语义特征,并且加入词汇特征和词性特征两方面特征,通过BootStrapping对小规模标注语料进行训练,得到朴素贝叶斯分类器;接着,使用朴素贝叶斯分类器对大规模未标注的语料进行分类,将可信度高的样本加入训练模型迭代进行训练,直到无样本加入;最后经过多轮迭代得到最终的分类器.实验表明,该方法在只具备少量样本的情况下就可达到83.7%的准确性,证明了该方法的有效性. 展开更多
关键词 观点句识别 语义模式 朴素贝叶斯分类器 bootstrapping 特征值 半监督学习
下载PDF
基于叙词表的领域知识图谱初始种子集自动生成算法 被引量:5
15
作者 韩其琛 赵亚伟 +1 位作者 姚郑 付立军 《中文信息学报》 CSCD 北大核心 2018年第8期1-8,共8页
随着认知计算的飞速发展,通用知识图谱的自动构建取得了极大的进步,但在垂直领域由于缺乏本体等语义信息,导致进展缓慢。叙词表广泛分布于各个专业领域且蕴藏着丰富的语义信息,如能对这些语义信息进行合理的提取和利用,必然能在一定程... 随着认知计算的飞速发展,通用知识图谱的自动构建取得了极大的进步,但在垂直领域由于缺乏本体等语义信息,导致进展缓慢。叙词表广泛分布于各个专业领域且蕴藏着丰富的语义信息,如能对这些语义信息进行合理的提取和利用,必然能在一定程度上帮助领域知识图谱的自动构建。该文提出两个假设,利用假设可以从叙词表内部结构中提取实体类型和关系类型,进而设计了一种基于叙词表的领域知识图谱初始种子集自动生成算法。最后,以地质领域和林业领域的叙词表作为实验对象,采用Bootstrapping算法,利用由叙词表自动生成的初始种子集进行抽取工作,通过对抽取到的结果进行分析,结果表明利用叙词表得到的初始种子集可以取得同人工设计种子比较接近的效果。此外,所提模型具有通用性,为叙词表在构建领域知识图谱中的应用提供了一种新的思路。 展开更多
关键词 叙词表 bootstrapping 领域 知识图谱
下载PDF
Bootstrapping Data Envelopment Analysis of Efficiency and Productivity of County Public Hospitals in Eastern, Central, and Western China after the Public Hospital Reform 被引量:5
16
作者 王曼丽 方海清 +5 位作者 陶红兵 程兆辉 林小军 蔡苗 许昌 蒋帅 《Journal of Huazhong University of Science and Technology(Medical Sciences)》 SCIE CAS 2017年第5期681-692,共12页
China implemented the public hospital reform in 2012. This study utilized bootstrapping data envelopment analysis(DEA) to evaluate the technical efficiency(TE) and productivity of county public hospitals in Easter... China implemented the public hospital reform in 2012. This study utilized bootstrapping data envelopment analysis(DEA) to evaluate the technical efficiency(TE) and productivity of county public hospitals in Eastern, Central, and Western China after the 2012 public hospital reform. Data from 127 county public hospitals(39, 45, and 43 in Eastern, Central, and Western China, respectively) were collected during 2012–2015. Changes of TE and productivity over time were estimated by bootstrapping DEA and bootstrapping Malmquist. The disparities in TE and productivity among public hospitals in the three regions of China were compared by Kruskal–Wallis H test and Mann–Whitney U test. The average bias-corrected TE values for the four-year period were 0.6442, 0.5785, 0.6099, and 0.6094 in Eastern, Central, and Western China, and the entire country respectively, with average non-technical efficiency, low pure technical efficiency(PTE), and high scale efficiency found. Productivity increased by 8.12%, 0.25%, 12.11%, and 11.58% in China and its three regions during 2012–2015, and such increase in productivity resulted from progressive technological changes by 16.42%, 6.32%, 21.08%, and 21.42%, respectively. The TE and PTE of the county hospitals significantly differed among the three regions of China. Eastern and Western China showed significantly higher TE and PTE than Central China. More than 60% of county public hospitals in China and its three areas operated at decreasing return scales. There was a considerable space for TE improvement in county hospitals in China and its three regions. During 2012–2015, the hospitals experienced progressive productivity; however, the PTE changed adversely. Moreover, Central China continuously achieved a significantly lower efficiency score than Eastern and Western China. Decision makers and administrators in China should identify the causes of the observed inefficiencies and take appropriate measures to increase the efficiency of county public hospitals in the th 展开更多
关键词 county public hospital data envelopment analysis technical efficiency Malmquist productivity index bootstrapping
下载PDF
Establishment and verification of a surgical prognostic model for cervical spinal cord injury without radiological abnormality 被引量:5
17
作者 Jie Wang Shuai Guo +2 位作者 Xuan Cai Jia-Wei Xu Hao-Peng Li 《Neural Regeneration Research》 SCIE CAS CSCD 2019年第4期713-720,共8页
Some studies have suggested that early surgical treatment can effectively improve the prognosis of cervical spinal cord injury without radiological abnormality, but no research has focused on the development of a prog... Some studies have suggested that early surgical treatment can effectively improve the prognosis of cervical spinal cord injury without radiological abnormality, but no research has focused on the development of a prognostic model of cervical spinal cord injury without radiological abnormality. This retrospective analysis included 43 patients with cervical spinal cord injury without radiological abnormality. Seven potential factors were assessed: age, sex, external force strength causing damage, duration of disease, degree of cervical spinal stenosis, Japanese Orthopaedic Association score, and physiological cervical curvature. A model was established using multiple binary logistic regression analysis. The model was evaluated by concordant profiling and the area under the receiver operating characteristic curve. Bootstrapping was used for internal validation. The prognostic model was as follows: logit(P) =-25.4545 + 21.2576 VALUE + 1.2160SCORE-3.4224 TIME, where VALUE refers to the Pavlov ratio indicating the extent of cervical spinal stenosis, SCORE refers to the Japanese Orthopaedic Association score(0–17) after the operation, and TIME refers to the disease duration(from injury to operation). The area under the receiver operating characteristic curve for all patients was 0.8941(95% confidence interval, 0.7930–0.9952). Three factors assessed in the predictive model were associated with patient outcomes: a great extent of cervical stenosis, a poor preoperative neurological status, and a long disease duration. These three factors could worsen patient outcomes. Moreover, the disease prognosis was considered good when logit(P) ≥-2.5105. Overall, the model displayed a certain clinical value. This study was approved by the Biomedical Ethics Committee of the Second Affiliated Hospital of Xi'an Jiaotong University, China(approval number: 2018063) on May 8, 2018. 展开更多
关键词 nerve REGENERATION SURGICAL prognostic model CERVICAL SPINAL cord injury retrospective study MULTIPLE binary logistic regression analysis bootstrapping internal validation MULTIPLE imputations CERVICAL SPINAL stenosis duration of disease Pavlov ratio neural REGENERATION
下载PDF
基于Bootstrapping支持向量机算法的森林干扰遥感监测 被引量:5
18
作者 李天宏 张洁 魏江月 《应用基础与工程科学学报》 EI CSCD 北大核心 2015年第2期308-317,共10页
森林干扰在全球和区域碳平衡、气候变化、植被生产力、蒸散发等多方面都有着重要的影响.遥感技术以其在动态监测中经济便捷的优势而成为大尺度森林干扰监测的主要手段.本文以大兴安岭为研究区域,利用2006年1km分辨率的MODIS反射率、LST... 森林干扰在全球和区域碳平衡、气候变化、植被生产力、蒸散发等多方面都有着重要的影响.遥感技术以其在动态监测中经济便捷的优势而成为大尺度森林干扰监测的主要手段.本文以大兴安岭为研究区域,利用2006年1km分辨率的MODIS反射率、LST和NDVI数据,有效提取归一化森林干扰变化信息.针对本研究扰动象元点与非扰动象元点存在较大差异的不平衡性问题,对比了SVM,one class SVM(OCSVM),和bootstrapping SVM分类器在不平衡分类中的效果,结果表明,bootstrapping SVM能够获得更稳定的模型和更高的精度,总体精度达99.14%,kappa系数为0.87,说明基于MODIS粗分辨率数据和bootstrapping SVM算法可以克服不平衡分类问题、有效提取森林干扰区域,可作为一种经济可行的对大区域甚至全球森林干扰监测的方法. 展开更多
关键词 森林干扰 MODIS bootstrapping SVM 不平衡分类
原文传递
实体关系模板的获取技术 被引量:3
19
作者 陈晓颖 胡熠 陆汝占 《计算机工程》 CAS CSCD 北大核心 2007年第21期199-201,共3页
确定实体间的关系有助于理解文本,提高信息检索的正确率。该文研究中文实体关系模板的获取技术,提出了一种STG的bootstrapping训练方法。该方法采用生物信息学中的序列比对技术计算上下文的语义模板,使用一定的评估机制筛选模板,有效地... 确定实体间的关系有助于理解文本,提高信息检索的正确率。该文研究中文实体关系模板的获取技术,提出了一种STG的bootstrapping训练方法。该方法采用生物信息学中的序列比对技术计算上下文的语义模板,使用一定的评估机制筛选模板,有效地扩充元组以提高下一轮训练的质量。实验结果表明,STG生成的模板不仅能覆盖大量的元组,而且正确率可达99%。 展开更多
关键词 信息提取 机器学习 bootstrapping
下载PDF
基于文献的地质实体关系抽取方法研究 被引量:5
20
作者 吕鹏飞 王春宁 朱月琴 《中国矿业》 北大核心 2017年第10期167-172,共6页
实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语... 实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语言模型作为关系抽取方式、采用Bootstrapping算法作为关系扩展方式。最后据此进行了关联关系发现和关系扩展发现实验。 展开更多
关键词 文献 关系抽取 统计语言模型 bootstrapping
下载PDF
上一页 1 2 140 下一页 到第
使用帮助 返回顶部