期刊文献+
共找到230篇文章
< 1 2 12 >
每页显示 20 50 100
基于大规模日志分析的搜索引擎用户行为分析 被引量:117
1
作者 余慧佳 刘奕群 +2 位作者 张敏 茹立云 马少平 《中文信息学报》 CSCD 北大核心 2007年第1期109-114,共6页
用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近5 000万条查询日志进行了分析。我们... 用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近5 000万条查询日志进行了分析。我们从独立查询词分布、同一session内的用户查询习惯及用户是否使用高级检索功能等方面对用户行为进行了分析。分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都有较好的指导意义。 展开更多
关键词 计算机应用 中文信息处理 网络信息检索 搜索引擎 用户行为分析 点击信息分析
下载PDF
汉语大词汇量连续语音识别系统研究进展 被引量:39
2
作者 倪崇嘉 刘文举 徐波 《中文信息学报》 CSCD 北大核心 2009年第1期112-123,128,共13页
大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的... 大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。 展开更多
关键词 计算机应用 中文信息处理 综述 语音识别 模型自适应 搜索技术
下载PDF
基于日志挖掘的搜索引擎用户行为分析 被引量:31
3
作者 岑荣伟 刘奕群 +2 位作者 张敏 茹立云 马少平 《中文信息学报》 CSCD 北大核心 2010年第3期49-54,共6页
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日... 随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长度、查询修改率、相关搜索点击率、首次/最后一次点击位置分布以及查询内点击数分布等信息。该文还基于不同类型的查询集合,考察用户在不同查询需求下的行为差异性。相关分析结果对搜索引擎算法优化和系统改进等都具有一定的参考意义。 展开更多
关键词 计算机应用 中文信息处理 用户行为分析 搜索引擎 网络信息检索
下载PDF
一种提高中文搜索引擎检索质量的HTML解析方法 被引量:20
4
作者 宋睿华 马少平 +1 位作者 陈刚 李景阳 《中文信息学报》 CSCD 北大核心 2003年第4期19-26,共8页
中文搜索引擎经常会返回大量的无关项或者不含具体信息的间接项 ,产生这类问题的一个原因是网页中存在着大量与主题无关的文字。对使用关键字检索方法的搜索引擎来说 ,想在检索或者后处理阶段解决这类问题不仅要付出一定代价 ,而且在大... 中文搜索引擎经常会返回大量的无关项或者不含具体信息的间接项 ,产生这类问题的一个原因是网页中存在着大量与主题无关的文字。对使用关键字检索方法的搜索引擎来说 ,想在检索或者后处理阶段解决这类问题不仅要付出一定代价 ,而且在大多数情况下是不可能的。在这篇论文中 ,我们提出了网页噪声的概念 ,并针对中文网页的特点 ,实现了一种对网页自动分块并去噪的HTML解析方法 ,从而达到在预处理阶段消除潜在无关项和间接项的目的。实验结果表明 ,该方法能够在不占用查询时间的前提下 10 0 %地消除中文搜索引擎隐藏的间接项 ,以及大约 11%的无法过滤或隐藏的无关项或间接项 ,从而大幅度提高检索结果的查准率。 展开更多
关键词 中文搜索引擎 检索质量 HTML解析方法 网页噪声 分块模型 网页去噪 中文信息处理
下载PDF
基于混合人工蜂群算法的多目标柔性作业车间调度问题研究 被引量:27
5
作者 孟冠军 杨大春 陶细佩 《计算机应用研究》 CSCD 北大核心 2019年第4期972-974,979,共4页
传统的优化算法在求解面对多目标柔性作业车间调度时,往往求解效率低且难以获得最优解。为了求解多目标柔性作业车间调度问题,设计了混合人工蜂群算法。种群的初始化采用了多种方法相结合的策略。在人工蜂群算法的不同阶段采用不同的搜... 传统的优化算法在求解面对多目标柔性作业车间调度时,往往求解效率低且难以获得最优解。为了求解多目标柔性作业车间调度问题,设计了混合人工蜂群算法。种群的初始化采用了多种方法相结合的策略。在人工蜂群算法的不同阶段采用不同的搜索机制,在雇佣蜂阶段采用开发搜索,针对跟随蜂阶段蜜蜂跟随的对象的优秀解进行小幅度的更新,从而提高了搜索的表现。禁忌搜索与改进的人工蜂群算法相结合,有效提升了获得最优解的概率。通过相关文献中的标准实例对设计的混合人工蜂群算法进行一系列求解测试,实验的结果有效说明了算法在求解柔性作业车间调度问题时效果显著。通过求解结果对比表明人工蜂群算法的高效性和优越性。 展开更多
关键词 计算机应用 柔性作业车间调度 人工蜂群算法 多目标优化 禁忌搜索
下载PDF
论计算机搜查的法律规制 被引量:16
6
作者 刘品新 《法学家》 CSSCI 北大核心 2008年第4期115-123,共9页
计算机搜查是当前司法实践中一种全新的取证措施,在世界范围内得到了日益广泛的运用,同时也引发了一系列的法律障碍。本文从计算机搜查的基本含义切入,采取比较研究的方法,指出我国实务中计算机搜查应当实现由"一步式"向"... 计算机搜查是当前司法实践中一种全新的取证措施,在世界范围内得到了日益广泛的运用,同时也引发了一系列的法律障碍。本文从计算机搜查的基本含义切入,采取比较研究的方法,指出我国实务中计算机搜查应当实现由"一步式"向"两步式"的根本性转变。在此基础上,本文阐述了我国的计算机搜查在应否申请令状、如何确定搜查范围以及维护案外人的合法权益、借助第三方的协助等方面遭遇的法律问题,并深入地论证了亟待确立的有关法律规则。 展开更多
关键词 计算机搜查 电子证据 法律规制
原文传递
网页搜索引擎查询日志的Session划分研究 被引量:16
7
作者 张磊 李亚楠 +2 位作者 王斌 李鹏 蒋在帆 《中文信息学报》 CSCD 北大核心 2009年第2期54-61,共8页
搜索引擎查询日志中的session(以下简称session)是指某特定用户为得到某个信息需求而在一段时间内的搜索行为的连续序列。Session的正确划分是进行用户搜索行为分析等一系列工作的重要基础,目前尚没有关于session的系统研究工作。本文... 搜索引擎查询日志中的session(以下简称session)是指某特定用户为得到某个信息需求而在一段时间内的搜索行为的连续序列。Session的正确划分是进行用户搜索行为分析等一系列工作的重要基础,目前尚没有关于session的系统研究工作。本文针对相关研究工作的问题重新统一定义了session的概念并进行探索和比较研究,得出结论:(1)统计语言模型因数据稀疏问题不适合做session划分;(2)利用多种属性的决策树方法可以得到比较理想的结果,以session为单位进行评价,F值达到了78.6%。 展开更多
关键词 计算机应用 中文信息处理 网络信息检索 查询日志 session划分
下载PDF
基于用户日志挖掘的搜索引擎广告效果分析 被引量:16
8
作者 陈磊 刘奕群 +1 位作者 茹立云 马少平 《中文信息学报》 CSCD 北大核心 2008年第6期92-97,共6页
随着搜索引擎市场的飞速发展,竞价排名广告以其有效、低风险、灵活等特点逐渐受到中小企业用户的青睐,成为搜索引擎稳定的收益增长点。然而竞价排名广告是否会影响用户体验,从而削弱其宣传效果并且影响用户对于搜索引擎的忠实度成为了... 随着搜索引擎市场的飞速发展,竞价排名广告以其有效、低风险、灵活等特点逐渐受到中小企业用户的青睐,成为搜索引擎稳定的收益增长点。然而竞价排名广告是否会影响用户体验,从而削弱其宣传效果并且影响用户对于搜索引擎的忠实度成为了企业及搜索引擎所担忧的问题。该文从网络用户日志中挖掘出网络用户对于广告的实际交互行为,并给出了各大搜索引擎竞价排名广告方面的统计数据。对于企业用户如何更有效地利用竞价排名广告以及搜索引擎如何平衡广告的经济效益和用户体验之间的关系都有较高的指导意义。 展开更多
关键词 计算机应用 中文信息处理 搜索引擎 用户行为分析 竞价排名广告
下载PDF
基于加权SimRank的中文查询推荐研究 被引量:15
9
作者 李亚楠 许晟 王斌 《中文信息学报》 CSCD 北大核心 2010年第3期3-10,共8页
查询推荐是搜索引擎系统中的一项重要技术,其通过推荐更合适的查询以提高用户的搜索体验。现有方法能够找到直接通过某种属性关联的相似查询,却忽略了具有间接关联的语义相关查询。该文将用户查询及查询间直接联系建模为查询关系图,并... 查询推荐是搜索引擎系统中的一项重要技术,其通过推荐更合适的查询以提高用户的搜索体验。现有方法能够找到直接通过某种属性关联的相似查询,却忽略了具有间接关联的语义相关查询。该文将用户查询及查询间直接联系建模为查询关系图,并在图结构相似度算法SimRank的基础上提出了加权SimRank(简称WSimRank)用于查询推荐。WSimRank综合考虑了查询关系图的全局信息,因而能挖掘出查询间的间接关联和语义关系。然而,WSimRank复杂度太高而难以实用,该文将WSimRank转换为一个状态层次图的遍历和计算过程,进而采用动态规划、剪枝等策略对其进行优化从而可以实际应用。在大规模真实Web搜索日志上的实验表明,WSimRank在各项评价指标上均优于SimRank和传统查询推荐方法,其MAP指标接近0.9。 展开更多
关键词 计算机应用 中文信息处理 搜索引擎 查询推荐 SIMRANK wSimRank
下载PDF
基于柱搜索的高阶依存句法分析 被引量:13
10
作者 李正华 车万翔 刘挺 《中文信息学报》 CSCD 北大核心 2010年第1期37-41,共5页
该文提出使用所有的孙子节点构成祖孙特征的高阶依存模型,并且使用柱搜索策略限制搜索空间,最终找到近似最优依存树。另外,该文以较小的时间复杂度为代价,使用了丰富的依存关系特征,并且允许模型在解码的过程中进行依存关系选择。作者... 该文提出使用所有的孙子节点构成祖孙特征的高阶依存模型,并且使用柱搜索策略限制搜索空间,最终找到近似最优依存树。另外,该文以较小的时间复杂度为代价,使用了丰富的依存关系特征,并且允许模型在解码的过程中进行依存关系选择。作者参加了CoNLL 2009年多语依存句法分析和语义角色标注国际评测,最终获得联合任务总成绩第一名,依存句法分析总成绩第三名。 展开更多
关键词 计算机应用 中文信息处理 柱搜索 高阶特征 依存分析
下载PDF
针灸治疗原发性三叉神经痛的系统评价 被引量:12
11
作者 方莉 陈勤 +5 位作者 董薇 罗培 张璐 孙晶 沈亚芳 方剑乔 《浙江中医药大学学报》 CAS 2013年第12期1433-1436,共4页
[目的]系统评价针灸治疗原发性三叉神经痛的疗效。[方法]计算机检索与手工检索针灸治疗原发性三叉神经痛的随机对照试验(RCT),参照Cochrane系统评价员手册5.0.1推荐的对偏倚风险的评价工具进行文献质量评价,并采用RevMan 5.1软件进行Met... [目的]系统评价针灸治疗原发性三叉神经痛的疗效。[方法]计算机检索与手工检索针灸治疗原发性三叉神经痛的随机对照试验(RCT),参照Cochrane系统评价员手册5.0.1推荐的对偏倚风险的评价工具进行文献质量评价,并采用RevMan 5.1软件进行Meta分析。[结果]最终纳入15个RCT,共1255例患者进行分析,合并RR值为1.19,95%C(I1.13,1.25),合并效应检验值Z=6.85,P<0.01,针灸组与对照组的疗效差异有统计学意义,针灸组疗效优于西药组。[结论]针灸治疗原发性三叉神经痛安全、有效,但尚需严格设计、多中心、大样本的随机对照试验结果支持。 展开更多
关键词 针灸疗法 原发性三叉神经痛 计算机检索 手工检索 系统评价
下载PDF
中国象棋与国际象棋比较分析 被引量:7
12
作者 王晓鹏 王骄 +1 位作者 徐心和 郑新颖 《重庆工学院学报》 2007年第1期71-76,共6页
众所周知,国际象棋的计算机博弈已经有了很长的历史,国际象棋的世界棋王也一度被深蓝"计算机打败,然而中国象棋的计算机博弈却开展得不尽人意.中国象棋和国际象棋同属于二人零和完全知识博弈.尽管2种棋的目标都是将对方的将(帅或王... 众所周知,国际象棋的计算机博弈已经有了很长的历史,国际象棋的世界棋王也一度被深蓝"计算机打败,然而中国象棋的计算机博弈却开展得不尽人意.中国象棋和国际象棋同属于二人零和完全知识博弈.尽管2种棋的目标都是将对方的将(帅或王)将死,但二者在棋盘、棋子、规则上却存在着很大的差异.从计算机博弈的角度,在棋盘、棋子、博弈复杂度、计算机博弈关键技术等方面对中国象棋和国际象棋进行比较分析,以便更好地开展中国象棋的计算机博弈活动. 展开更多
关键词 中国象棋 国际象棋 比较分析 计算机博弈 博弈复杂度 着法生成 评估函数 搜索引擎
下载PDF
搜索引擎中的聚类浏览技术 被引量:9
13
作者 李红梅 丁振国 +1 位作者 周水生 周利华 《中文信息学报》 CSCD 北大核心 2008年第3期56-63,共8页
搜索引擎大多以文档列表的形式将搜索结果显示给用户,随着Web文档数量的剧增,使得用户查找相关信息变得越来越困难,一种解决方法是对搜索结果进行聚类提高其可浏览性。搜索引擎的聚类浏览技术能使用户在更高的主题层次上查看搜索结果,... 搜索引擎大多以文档列表的形式将搜索结果显示给用户,随着Web文档数量的剧增,使得用户查找相关信息变得越来越困难,一种解决方法是对搜索结果进行聚类提高其可浏览性。搜索引擎的聚类浏览技术能使用户在更高的主题层次上查看搜索结果,方便地找到感兴趣的信息。本文介绍了搜索引擎的聚类浏览技术对聚类算法的基本要求及其分类方法,研究分析了主要聚类算法及其改进方法的特点,讨论了对聚类质量的评价,最后指出了聚类浏览技术的发展趋势。 展开更多
关键词 计算机应用 中文信息处理 搜索引擎 文档聚类 信息检索 聚类标识
下载PDF
基于P-F方法的软件过程建模的复用性 被引量:8
14
作者 周之英 《软件学报》 EI CSCD 北大核心 2001年第8期1258-1264,共7页
P- F方法可以直观而精确地提供软件过程的复用机制 .软件过程的复用问题如同软件本身的复用性 ,具有同样重要的意义 .为了抽象过程复用机制 ,P- F方法使用 3层复用结构 :过程模板、模式和元模式 .过程模板代表由 P- F方法描述的部分过... P- F方法可以直观而精确地提供软件过程的复用机制 .软件过程的复用问题如同软件本身的复用性 ,具有同样重要的意义 .为了抽象过程复用机制 ,P- F方法使用 3层复用结构 :过程模板、模式和元模式 .过程模板代表由 P- F方法描述的部分过程的可复用类 .模式是模板的拓扑结构 .最底层是元模式 ,代表最基本的模式 ,也是建成良结构过程 /模板 /模式的基本材料 .利用元模式来构造软件过程可以避免病态的软件过程 ,并可以改进软件过程管理 .形式化地定义了可复用结构部件间的操作 .这些操作帮助实现软件过程的定义、复用或集成 .软件过程的可复用特性在许多方面增强了 P- F方法的优点 :便于不同管理层次的交流 ;满足当前快速变化环境的变动要求 ;提供创建、分析、执行、控制、委任过程责任以及便于记录文档资料的工具 .P- F方法的抽象特性 ,便于构造针对一般过程的、由 P- F引擎驱动的 P- F虚拟机或 P- F计算机器 . 展开更多
关键词 软件过程 PETRI网 模板 P-F方法 建模 复用性 软件开发
下载PDF
基于二叉树结构高速铁路联锁系统设计与实现 被引量:9
15
作者 杨美娜 杨扬 《铁路计算机应用》 2017年第4期20-24,共5页
计算机联锁系统的进路搜索算法需要有更高的可靠性、安全性以及更快的搜索效率,才能满足高速铁路联锁系统的要求。针对这一需求,采用二叉树结构的进路搜索算法设计高速铁路的计算机联锁系统。基于二叉树的计算机联锁系统,其关键部分就... 计算机联锁系统的进路搜索算法需要有更高的可靠性、安全性以及更快的搜索效率,才能满足高速铁路联锁系统的要求。针对这一需求,采用二叉树结构的进路搜索算法设计高速铁路的计算机联锁系统。基于二叉树的计算机联锁系统,其关键部分就是要将信号平面布置图上的信号点建立成二叉树模型。二叉树模型与站场形状有一定的相似性,在设备间的关系上,二叉树模型的结点与站场的联锁设备一一对应。因此,通过站场的平面布置图很容易建立二叉树模型,为编写程序提供方便,同时二叉树的数据结构有利于进路搜索,为选排进路提供了方便。 展开更多
关键词 计算机联锁 二叉树 进路搜索 高速铁路
下载PDF
一种基于文档相似度的检索结果重排序方法 被引量:9
16
作者 周博 岑荣伟 +3 位作者 刘奕群 张敏 金奕江 马少平 《中文信息学报》 CSCD 北大核心 2010年第3期19-23,36,共6页
对相关反馈问题的研究已有近30年的历史,相关反馈也被证明可以大程度稳定地提升检索系统的性能。当前网络环境下相关反馈的应用以及用户提供反馈信息的方式已经发生了明显的变化,因此相关反馈研究又一次引起了研究界的注意。该文提出了... 对相关反馈问题的研究已有近30年的历史,相关反馈也被证明可以大程度稳定地提升检索系统的性能。当前网络环境下相关反馈的应用以及用户提供反馈信息的方式已经发生了明显的变化,因此相关反馈研究又一次引起了研究界的注意。该文提出了一种基于文档相似度的搜索结果重排序方法,该方法同时利用了反馈信息中的相关文档与不相关文档。在大规模网络信息检索标准实验数据上的实验结果表明:该方法不仅可以稳定地提高系统的检索性能,并且相较于经典的查询扩展方法有着明显的优势。 展开更多
关键词 计算机应用 中文信息处理 相关反馈 文档重排序 信息检索
下载PDF
基于语义分析的垂直搜索网络蜘蛛 被引量:8
17
作者 罗立宏 陈志 《计算机工程与设计》 CSCD 北大核心 2008年第18期4662-4665,4812,共5页
通用搜索引擎数据量庞大,但查询结果不够准确。分类目录正好相反。为了综合两者优势,对垂直搜索引擎进行了研究和分析。着重研究了垂直搜索引擎的核心模块——智能网络搜索蜘蛛。提出了搜索分析的新概念——规则。研究了蜘蛛中定义支持... 通用搜索引擎数据量庞大,但查询结果不够准确。分类目录正好相反。为了综合两者优势,对垂直搜索引擎进行了研究和分析。着重研究了垂直搜索引擎的核心模块——智能网络搜索蜘蛛。提出了搜索分析的新概念——规则。研究了蜘蛛中定义支持同义词的语义词典的方法,给出了按照规则分析和检索的实现方法和流程。程序需要定义多种规则,让蜘蛛依照规则进行网页爬行和信息采集。最后给出一个项目实例,证明了上述方法的可行性。 展开更多
关键词 计算机应用 互联网 搜索引擎 垂直搜索 网络蜘蛛 语义分析
下载PDF
LZW无损压缩算法在计算机取证中的应用研究 被引量:6
18
作者 郭晓岩 郝永胜 《测控技术》 CSCD 2006年第11期64-67,共4页
介绍了计算机取证和LZW无损压缩算法的基本概念和应用特点。在此基础上,详细分析了计算机取证技术的搜索时间成本问题,并提出了一种降低时间成本的解决方案。
关键词 计算机取证 LZW无损压缩算法 搜索
下载PDF
基于分解转移矩阵的PageRank迭代计算方法 被引量:4
19
作者 刘松彬 都云程 施水才 《中文信息学报》 CSCD 北大核心 2007年第5期41-45,共5页
本文提出了一种基于分解转移矩阵的PageRank的迭代计算方法。该方法对PageRank理论模型进一步推导,把其Markov状态转移矩阵进行了分解,从而降低存储开销和计算复杂度,减少I/O需求,使得PageRank计算的工程化实现更为简单。实验表明1 700... 本文提出了一种基于分解转移矩阵的PageRank的迭代计算方法。该方法对PageRank理论模型进一步推导,把其Markov状态转移矩阵进行了分解,从而降低存储开销和计算复杂度,减少I/O需求,使得PageRank计算的工程化实现更为简单。实验表明1 700多万的网页2.8亿条链接,可以在30秒内完成一次迭代,内存需求峰值585MB,可以满足工程化应用的需求。 展开更多
关键词 计算机应用 中文信息处理 PAGERANK 搜索引擎 Markov状态转移矩阵 矩阵分解
下载PDF
基于改进差分进化的高精度粒子滤波算法 被引量:7
20
作者 曹洁 李玉琴 吴迪 《上海交通大学学报》 EI CAS CSCD 北大核心 2014年第12期1714-1720,共7页
针对智能优化粒子滤波算法精度较低和收敛速度慢的问题,提出一种改进适应度函数和搜索策略的差分进化粒子滤波算法(IDE-PF).该算法通过自适应融合粒子权值和量测误差得到适应度函数,并利用该函数评价粒子的可信度,引导粒子向后验概率密... 针对智能优化粒子滤波算法精度较低和收敛速度慢的问题,提出一种改进适应度函数和搜索策略的差分进化粒子滤波算法(IDE-PF).该算法通过自适应融合粒子权值和量测误差得到适应度函数,并利用该函数评价粒子的可信度,引导粒子向后验概率密度取值高的位置移动,同时引入新的搜索策略,不仅保持了粒子多样性,还加快了算法收敛的速度.仿真结果表明,该算法可有效提高智能优化粒子滤波对于非线性系统状态估计的精度和实时性. 展开更多
关键词 计算机应用 粒子滤波 差分进化 适应度函数 搜索策略
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部