期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于结果模式的Deep Web数据抽取 被引量:15
1
作者 马安香 张斌 +2 位作者 高克宁 齐鹏 张引 《计算机研究与发展》 EI CSCD 北大核心 2009年第2期280-288,共9页
高效、准确地获取Deep Web数据是实现Deep Web数据集成系统的关键问题,然而重复语义标注、嵌套属性的存在是Deep Web数据抽取效率和准确率难以提升的瓶颈问题.因此提出基于结果模式的Deep Web数据抽取机制,将数据抽取工作分为结果模式... 高效、准确地获取Deep Web数据是实现Deep Web数据集成系统的关键问题,然而重复语义标注、嵌套属性的存在是Deep Web数据抽取效率和准确率难以提升的瓶颈问题.因此提出基于结果模式的Deep Web数据抽取机制,将数据抽取工作分为结果模式生成和数据抽取两个阶段,属性语义标注放在结果模式生成阶段来完成,有效解决了重复语义标注问题;同时针对嵌套属性问题,提出一种有效的解决方法.与同类成果相比,基于结果模式的数据抽取方法提高了数据抽取的准确率及效率,并且为Deep Web数据集成奠定了良好的基础. 展开更多
关键词 DEEP WEB 数据集成 数据抽取 结果模式 语义标注 网页数据特征矩阵
下载PDF
支持Web信息分类的高性能蜘蛛程序 被引量:6
2
作者 高克宁 柴桥子 +1 位作者 张斌 马安香 《小型微型计算机系统》 CSCD 北大核心 2006年第7期1308-1312,共5页
随着W eb信息的快速增长,如何提高信息检索的准确率,如何展示检索结果,成为W eb信息检索的重点研究内容.本文设计一种新的蜘蛛程序T-Sp ider,采用分布式两级并行控制,在获取W eb信息的同时,获取网站结构,从而支持基于网站结构的信息分类.
关键词 蜘蛛程序 信息分类 网站结构 分布式
下载PDF
面向多样化搜索背景的查询推荐策略 被引量:4
3
作者 孙达明 张斌 +1 位作者 张书波 马安香 《计算机研究与发展》 EI CSCD 北大核心 2014年第S1期81-85,共5页
基于日志的搜索引擎查询推荐方法大多从流行性角度进行查询推荐,这种方式能够带来不错的推荐效果.然而,流行性行为代表群体用户共性的需求,所以这类推荐方法忽略了用户背景不同带来的搜索需求的差异,当小团体用户的搜索需求与流行性需... 基于日志的搜索引擎查询推荐方法大多从流行性角度进行查询推荐,这种方式能够带来不错的推荐效果.然而,流行性行为代表群体用户共性的需求,所以这类推荐方法忽略了用户背景不同带来的搜索需求的差异,当小团体用户的搜索需求与流行性需求不一致时,往往造成小团体搜索需求无法被满足,进而导致针对此类用户的推荐失败.而且,在搜索引擎领域,用户信息难以获取,提供个性化推荐服务也比较困难.为了减少推荐失败的风险,提高查询推荐质量,提出一种折衷的解决方案,面向多样化搜索背景的查询推荐策略.在查询流图的基础上构造密集行为块,通过密集行为块表示用户特征,从而构建典型用户行为模型,并以典型用户行为区分用户背景.另外,还提出了面向多样化搜索背景的查询推荐方法,当搜索词面临多种用户背景时,推荐系统提供多样化的推荐词集合,最后,在真实数据集的实验结果证明了本策略能够在较小程度降低准确度的同时降低推荐失败的风险. 展开更多
关键词 查询推荐 多样化 搜索引擎 搜索背景 查询流图
下载PDF
修辞可控的中国古典诗歌生成
4
作者 杨媛婷 朱泓禹 +3 位作者 马安香 刘玉豪 罗应峰 肖桐 《中文信息学报》 CSCD 北大核心 2024年第5期167-174,共8页
中国古典诗歌是一种语言凝练、语义丰富的文学艺术,它的创作因素有许多方面,修辞手法是其中一个最显著的特征之一,诗人在进行创作时通常会使用修辞手法来增强诗歌的感染力和表现力。该文致力于构建具有修辞手法创作能力的诗歌生成模型,... 中国古典诗歌是一种语言凝练、语义丰富的文学艺术,它的创作因素有许多方面,修辞手法是其中一个最显著的特征之一,诗人在进行创作时通常会使用修辞手法来增强诗歌的感染力和表现力。该文致力于构建具有修辞手法创作能力的诗歌生成模型,以此来提升生成诗歌的多样性、趣味性和新颖性,从而增加读者阅读过程中的审美体验。该文首先通过人工标注、词句特征提取、训练基于BERT的修辞分类器的方式构建一个修辞诗句数据库,然后将每首诗按照一定的方式序列化成一个长句子,并以此来训练语言模型得到诗歌生成模型。自动评测和人工评测结果表明,模型可以生成具有特定修辞手法的诗歌,且生成诗歌的质量相比基线有显著提升。 展开更多
关键词 中国古典诗歌 诗歌生成 修辞可控
下载PDF
云环境下基于冷点虚拟机迁移的热点消除方法 被引量:3
5
作者 郭军 闫永明 +1 位作者 马安香 张斌 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第11期1232-1236,共5页
初始分配的虚拟机资源常常不能满足运行时服务的性能要求,导致资源利用率过高、响应时间过长等“热点”问题。为了消除热点以保障服务性能,传统方法主要包括资源扩展和虚拟机动态迁移,但还存在预留资源空间不足和虚拟机迁移代价过大等... 初始分配的虚拟机资源常常不能满足运行时服务的性能要求,导致资源利用率过高、响应时间过长等“热点”问题。为了消除热点以保障服务性能,传统方法主要包括资源扩展和虚拟机动态迁移,但还存在预留资源空间不足和虚拟机迁移代价过大等问题。针对上述问题,该文提出一种基于冷点虚拟机迁移的热点消除方法,即以冷点虚拟机为迁移对象,将其释放的资源分配给热点虚拟机,以保持热点服务的性能、降低热点消除代价,从而更好地满足服务等级协议约束,并通过实验证明该方法可行有效。 展开更多
关键词 虚拟机迁移 热点消除 冷点虚拟机 服务等级协议
原文传递
基于用户行为的数据关联关系获取方法 被引量:3
6
作者 孙达明 张斌 +1 位作者 张书波 马安香 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第12期1707-1711,共5页
在对数据空间领域的研究中,对数据资源之间关联关系的研究逐渐成为一个研究热点.目前数据关系的研究主要集中在基于数据自身属性方面,基于此建立的数据关联关系没有考虑到用户对其产生的作用,所以在对数据管理、组织以及应用数据服务的... 在对数据空间领域的研究中,对数据资源之间关联关系的研究逐渐成为一个研究热点.目前数据关系的研究主要集中在基于数据自身属性方面,基于此建立的数据关联关系没有考虑到用户对其产生的作用,所以在对数据管理、组织以及应用数据服务的过程中很难体现出用户的意愿.为此,提出一种基于用户行为的数据关联获取方法,通过对用户历史行为进行R/S分析,以判断用户行为是否为用户的有意识访问;并在此基础上对用户行为序列进行模式挖掘,得到用户行为模式,最终将行为模式包含的数据通过iTrail的形式建立数据关联关系.实验证明,采用本文方法可以取得较好的效果. 展开更多
关键词 数据空间 数据关联关系 用户行为 R S分析 HURST指数
下载PDF
一种流行性与相似性结合查询推荐策略 被引量:3
7
作者 孙达明 张斌 +1 位作者 张书波 马安香 《小型微型计算机系统》 CSCD 北大核心 2016年第6期1121-1125,共5页
基于日志的搜索引擎查询推荐方法大多从搜索行为流行性考虑进行查询推荐,这类推荐方法忽略了个体用户背景不同带来的搜索需求的差异,对于一些在搜索引擎日志中有较多记录的用户来讲,难以满足他们更高质量的搜索需求.然而,此类用户的搜... 基于日志的搜索引擎查询推荐方法大多从搜索行为流行性考虑进行查询推荐,这类推荐方法忽略了个体用户背景不同带来的搜索需求的差异,对于一些在搜索引擎日志中有较多记录的用户来讲,难以满足他们更高质量的搜索需求.然而,此类用户的搜索记录又不足以支持系统提供个性化的推荐服务.所以,针对在搜索引擎日志中有较多记录的用户,本文提出一种折衷的解决方案,即流行性与相似性结合的查询推荐策略,提供一种近似于个性化的推荐服务.本文采用社团发现的方法发现搜索日志中的密集行为,从而构建典型用户行为模型代表用户搜索背景,并引入模块度度量典型用户行为的强度,最后结合流行性、群体用户对推荐词的支持程度、用户对用户群体的归属程度以及典型用户行为的强度来产生推荐词集合.本文最后,在真实数据集的实验结果证明了本策略能够在控制推荐失败风险的同时提高用户对推荐结果的满意度. 展开更多
关键词 计算机应用 搜索引擎 查询推荐 查询流图
下载PDF
基于深度置信网络的云应用负载预测方法 被引量:2
8
作者 马安香 张长胜 +1 位作者 张斌 张晓红 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第2期209-213,共5页
为了准确预测云应用负载以便及时执行云应用自适应优化,从而保证云应用性能的稳定,根据云环境下应用负载预测问题的特点,提出了基于深度置信网络的云应用负载预测方法.首先给出能够有效描述负载数据的显式特征和隐式特征并定义了负载预... 为了准确预测云应用负载以便及时执行云应用自适应优化,从而保证云应用性能的稳定,根据云环境下应用负载预测问题的特点,提出了基于深度置信网络的云应用负载预测方法.首先给出能够有效描述负载数据的显式特征和隐式特征并定义了负载预测模型,进而给出基于深度置信网络的负载预测算法.对算法进行了分析并在真实数据集上与相关算法进行了比较,结果表明,本文提出的方法能够更加有效地解决云应用负载预测问题. 展开更多
关键词 云计算 云应用 深度置信网络 负载预测 自适应优化
下载PDF
面向差异化搜索背景的查询推荐方法 被引量:2
9
作者 孙达明 张斌 +1 位作者 张书波 马安香 《计算机工程》 CAS CSCD 北大核心 2016年第11期202-206,共5页
搜索引擎中存在一些用户在查询日志中保存部分搜索记录,但又不足以为用户提供个性化的查询推荐。对于此类用户,对其提供具有针对性的推荐服务能够在一定程度上提高用户对推荐结果的满意度。为此,提出一种面向不同搜索背景的差异化查询... 搜索引擎中存在一些用户在查询日志中保存部分搜索记录,但又不足以为用户提供个性化的查询推荐。对于此类用户,对其提供具有针对性的推荐服务能够在一定程度上提高用户对推荐结果的满意度。为此,提出一种面向不同搜索背景的差异化查询推荐方法,依据用户搜索行为将用户划分为不同群体,针对不同群体提供不同的推荐服务,实现群体用户之间的差异化推荐服务。在真实数据集上的实验结果表明,该方法能在控制推荐失败风险的同时,提高用户对推荐结果的满意度。 展开更多
关键词 查询推荐 差异化 搜索背景 社团发现 查询流图
下载PDF
Web integration based on classification ontology 被引量:2
10
作者 高克宁 马安香 张斌 《Journal of Southeast University(English Edition)》 EI CAS 2006年第3期426-429,共4页
In order to eliminate semantic heterogeneity and implement semantic combination in web information integration, the classification ontology is introduced into web information integration. It constructs a standard clas... In order to eliminate semantic heterogeneity and implement semantic combination in web information integration, the classification ontology is introduced into web information integration. It constructs a standard classification ontology based on web-glossary by extracting classified structures of websites and building mappings between them in order to get unified views. Mapping is defined by calculating concept subordinate matching degrees, concept associate matching degrees and concept dominate matching degrees. A web information integration system is realized, which can effectively solve the problem of classification semantic heterogeneity and implement the integration of web information source and the personal configuration of users. 展开更多
关键词 information integration classification ontology ontology integration PERSONALIZATION
下载PDF
一种求解分类问题的自适应人工蜂群算法 被引量:2
11
作者 马安香 张长胜 +1 位作者 张斌 张晓红 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2016年第1期252-258,共7页
考虑到分类算法学习到的分类器的可理解性,提出一种求解分类问题的自适应人工蜂群算法——A_ABC,该算法生成一组可理解的分类规则。在基于规则的分类方法中,采用合适的规则评价函数能够提高分类算法的性能,A_ABC算法能够针对不同数据集... 考虑到分类算法学习到的分类器的可理解性,提出一种求解分类问题的自适应人工蜂群算法——A_ABC,该算法生成一组可理解的分类规则。在基于规则的分类方法中,采用合适的规则评价函数能够提高分类算法的性能,A_ABC算法能够针对不同数据集自适应选取相适应的规则评价函数,同时能够有效处理连续类型的属性和离散类型的属性。最后,在多个公用的真实数据集上,将A_ABC算法与相关算法进行了比较,结果表明A_ABC算法能够更加有效地解决分类问题。 展开更多
关键词 人工智能 自适应人工蜂群算法 分类问题 规则评价函数
下载PDF
基于重复模式的信息语义表示方法的研究 被引量:1
12
作者 高克宁 马安香 +1 位作者 张斌 魏宏儒 《小型微型计算机系统》 CSCD 北大核心 2009年第1期26-30,共5页
根据Web页面中出现的重复信息对Web页所体现的语义进行表示,可以提高Web页分类正确的精度.基于这一思想,本文通过对传统重复模式表示法的分析,提出基于重复模式的Web信息语义表示法.该方法在形式化描述重复模式的基础上,抽取Web信息中... 根据Web页面中出现的重复信息对Web页所体现的语义进行表示,可以提高Web页分类正确的精度.基于这一思想,本文通过对传统重复模式表示法的分析,提出基于重复模式的Web信息语义表示法.该方法在形式化描述重复模式的基础上,抽取Web信息中的重复模式建立表达Web信息语义特征的相关矩阵,并通过γ相似匹配算法计算重复模式的权重继而进行Web信息分类.实验证明,采用基于重复模式的Web信息语义表示法能够较好的体现Web网页信息的主题特征,可以提高Web信息分类的准确率. 展开更多
关键词 重复模式 Web信息语义表示 相关矩阵 γ近似匹配
下载PDF
基于搜索日志与局部上下文的查询扩展方法 被引量:1
13
作者 张书波 马安香 +1 位作者 张斌 孙达明 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第7期933-936,共4页
当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系... 当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系,抽取查询扩展词,并用局部上下文从相关文档集中提取出频率较大,同时具有时效性的查询扩展词.通过对查询扩展词的查询性能和时效性的计算,该方法为原始查询补充更高质量的查询扩展词.实验结果表明,该方法能够有效地提升准确率和召回率,使原始查询获得更好的查询性能. 展开更多
关键词 信息检索 查询扩展 搜索日志 局部上下文 查询性能
下载PDF
一种自适应蚁群分类算法 被引量:1
14
作者 马安香 张长胜 +1 位作者 张斌 张晓红 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第8期1102-1106,共5页
将分类学习看作是一个找出最优分类规则的优化问题,提出一种自适应蚁群分类算法——Adaptive L_AMP,以得到一组可理解的分类规则.在基于规则的分类方法中,规则评价函数的选取至关重要,本文提出的算法能够针对不同数据集自动选取与之相... 将分类学习看作是一个找出最优分类规则的优化问题,提出一种自适应蚁群分类算法——Adaptive L_AMP,以得到一组可理解的分类规则.在基于规则的分类方法中,规则评价函数的选取至关重要,本文提出的算法能够针对不同数据集自动选取与之相适应的规则评价函数以提高分类准确性.此外,为进一步提高算法的分类准确率,设计了一种局部搜索策略并将其融入到Adaptive L_AMP算法中.最后对算法进行了分析,并在多个公用的真实数据集上与相关算法进行了比较,结果表明Adaptive L_AMP算法能够更加有效地解决分类问题. 展开更多
关键词 蚁群算法 自适应蚁群算法 分类 规则评价函数
下载PDF
基于结果模式的Deep Web数据集成
15
作者 马安香 张斌 +2 位作者 张引 高克宁 孙达明 《小型微型计算机系统》 CSCD 北大核心 2010年第5期813-818,共6页
Deep Web中蕴含了海量可供访问的信息,如何构建一个具有较好适用性和高效数据处理能力的Deep Web数据集成系统是有效利用Deep Web信息的关键.提出一种基于结果模式的DeepWeb数据集成机制,通过结果模式可以实现高效的数据抽取,并且在结... Deep Web中蕴含了海量可供访问的信息,如何构建一个具有较好适用性和高效数据处理能力的Deep Web数据集成系统是有效利用Deep Web信息的关键.提出一种基于结果模式的DeepWeb数据集成机制,通过结果模式可以实现高效的数据抽取,并且在结果模式的基础上可以根据用户查询请求动态生成结果输出模式,为高效的查询结果处理奠定了良好基础;同时,针对Deep Web数据源特点,给出数据源间冲突的分类及解决策略,为解决数据源间的异构问题奠定了良好基础. 展开更多
关键词 DEEP WEB数据集成 结果模式 结果输出模式 冲突
下载PDF
基于CPN网络的Deep Web数据语义标注
16
作者 马安香 高克宁 +1 位作者 张晓红 张斌 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第6期794-797,共4页
全面准确地标注Deep Web数据是实现Deep Web数据集成系统的关键问题,然而现有的DeepWeb数据语义标注方法还不能很好地解决这一问题.提出一种基于CPN网络的Deep Web数据语义标注方法,通过提取属性值的基本特征,采用CPN网络实现Deep Web... 全面准确地标注Deep Web数据是实现Deep Web数据集成系统的关键问题,然而现有的DeepWeb数据语义标注方法还不能很好地解决这一问题.提出一种基于CPN网络的Deep Web数据语义标注方法,通过提取属性值的基本特征,采用CPN网络实现Deep Web数据语义标注.同时,采取了一种有效的方法准确获取Deep Web结果页面中的属性值,为语义标注奠定了良好的基础.与同类成果相比,基于CPN网络的Deep Web数据语义标注方法提高了语义标注的准确率及召回率. 展开更多
关键词 DEEP WEB数据集成 语义标注 CPN网络 特征选取 分隔符序列
下载PDF
基于组件服务质量和服务性能的云服务性能瓶颈诊断方法
17
作者 郭军 马安香 +2 位作者 闫永明 孟煜 张斌 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第2期208-212,共5页
瓶颈组件服务的诊断是保障面向服务业务流程的云服务系统性能的关键环节。传统诊断方法是通过评估组件服务的最大运行时延来确定导致整个组合服务质量变差的组件服务,未考虑组件服务的重要性,影响判断的准确性。该文在分析了各个组件服... 瓶颈组件服务的诊断是保障面向服务业务流程的云服务系统性能的关键环节。传统诊断方法是通过评估组件服务的最大运行时延来确定导致整个组合服务质量变差的组件服务,未考虑组件服务的重要性,影响判断的准确性。该文在分析了各个组件服务质量的基础上,综合评估组件服务质量和重要性,提出了一种基于组件服务质量和服务性能的云服务性能瓶颈诊断方法,用来确定云服务瓶颈组件服务。仿真实验的结果验证了该瓶颈诊断方法的有效性和准确性。 展开更多
关键词 云服务 组件 瓶颈诊断 服务质量 服务性能
原文传递
新工科建设的背景下基于PBL的《数据结构》课程教学模式研究 被引量:23
18
作者 杨雷 马安香 +1 位作者 张晓红 王彤 《高教学刊》 2021年第8期105-108,共4页
为了适应“新工科”对人才综合性和创新性的培养需求,在分析了“数据结构”目前现状的基础上,结合基于问题的学习方法(PBL),提出“传统的教学方法为主,PBL教学方法为辅”的混合教学模式,并从学习方式的确定、问题设计、教学过程以及教... 为了适应“新工科”对人才综合性和创新性的培养需求,在分析了“数据结构”目前现状的基础上,结合基于问题的学习方法(PBL),提出“传统的教学方法为主,PBL教学方法为辅”的混合教学模式,并从学习方式的确定、问题设计、教学过程以及教学评价展开PBL教学法应用方法讨论。 展开更多
关键词 新工科 数据结构 PBL 教学方法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部