期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
数据库物理结构优化技术 被引量:30
1
作者 崔跃生 张勇 +2 位作者 曾春 冯建华 邢春晓 《软件学报》 EI CSCD 北大核心 2013年第4期761-780,共20页
面对快速增长的数据量和复杂的查询请求,关系数据库要满足用户检索的高效性,不能仅仅依靠SQL查询优化,必须针对不同的应用背景,对数据库的物理结构进行优化,从底层提高数据库的检索查询效率.描述了4种已被商业数据库优化的物理结构,总... 面对快速增长的数据量和复杂的查询请求,关系数据库要满足用户检索的高效性,不能仅仅依靠SQL查询优化,必须针对不同的应用背景,对数据库的物理结构进行优化,从底层提高数据库的检索查询效率.描述了4种已被商业数据库优化的物理结构,总结了物理结构优化领域的关键技术,并介绍了商业数据库中使用的数据库物理结构优化推荐工具,最后展望了未来的研究方向. 展开更多
关键词 物理结构 优化 推荐 工作负荷 抽样 如果假设分析 组合爆炸
下载PDF
文本可视化研究综述 被引量:52
2
作者 唐家渝 刘知远 孙茂松 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2013年第3期273-285,共13页
随着海量文本的涌现,信息超载和数据过剩等问题促使了文本可视化技术的出现.文本可视化技术综合了文本分析、数据挖掘、数据可视化、计算机图形学、人机交互、认知科学等学科的理论和方法,为人们提供了一种理解复杂文本的内容、结构和... 随着海量文本的涌现,信息超载和数据过剩等问题促使了文本可视化技术的出现.文本可视化技术综合了文本分析、数据挖掘、数据可视化、计算机图形学、人机交互、认知科学等学科的理论和方法,为人们提供了一种理解复杂文本的内容、结构和内在规律等信息的有效手段.文中首先阐述了文本可视化的概念和重要性,然后按照不同可视化对象类型综述了文本可视化的研究现状,并介绍了典型的文本可视化方法与方案;最后,对文本可视化的未来研究方向进行了展望. 展开更多
关键词 信息可视化 可视分析 文本分析 信息抽取 人机交互界面
下载PDF
基于日志挖掘的搜索引擎用户行为分析 被引量:31
3
作者 岑荣伟 刘奕群 +2 位作者 张敏 茹立云 马少平 《中文信息学报》 CSCD 北大核心 2010年第3期49-54,共6页
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日... 随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长度、查询修改率、相关搜索点击率、首次/最后一次点击位置分布以及查询内点击数分布等信息。该文还基于不同类型的查询集合,考察用户在不同查询需求下的行为差异性。相关分析结果对搜索引擎算法优化和系统改进等都具有一定的参考意义。 展开更多
关键词 计算机应用 中文信息处理 用户行为分析 搜索引擎 网络信息检索
下载PDF
面向用户互联网访问日志的异常点击分析 被引量:5
4
作者 王倩 刘奕群 +1 位作者 马少平 茹立云 《中文信息学报》 CSCD 北大核心 2010年第3期44-48,61,共6页
随着互联网用户人数的日益增长,用户行为分析已经成为互联网技术领域重要的研究方法之一。在日志中去除异常点击,对于准确挖掘用户行为的意图和习惯十分重要。该文采用某公司提供的真实用户互联网访问日志,对日志中的连续点击,单IP多用... 随着互联网用户人数的日益增长,用户行为分析已经成为互联网技术领域重要的研究方法之一。在日志中去除异常点击,对于准确挖掘用户行为的意图和习惯十分重要。该文采用某公司提供的真实用户互联网访问日志,对日志中的连续点击,单IP多用户以及单用户多IP等可能的异常点击,从访问集中度,用户平均访问量等方面进行了分析。我们认为对于连续点击,用户行为分析研究人员可以分情况滤去多余点击或该用户所有点击,而对于单IP多用户和单用户多IP的点击,我们建议不做处理。 展开更多
关键词 计算机应用 中文信息处理 用户行为分析 互联网访问日志 异常点击
下载PDF
基于图像多域特征缩放与BP网络的信息隐藏盲检测 被引量:3
5
作者 罗向阳 王道顺 +1 位作者 汪萍 刘粉林 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第A01期87-91,共5页
为了提高图像信息隐藏通用盲检测的正确检测率,扩大通用盲检测的适用范围,提出一种基于多域特征缩放的图像信息隐藏盲检测方法.从图像的空域、DCT域和DWT域分别提取相邻像素对统计偏离度、DCT系数宏块中拉普拉斯分布的尺度参数的方差,... 为了提高图像信息隐藏通用盲检测的正确检测率,扩大通用盲检测的适用范围,提出一种基于多域特征缩放的图像信息隐藏盲检测方法.从图像的空域、DCT域和DWT域分别提取相邻像素对统计偏离度、DCT系数宏块中拉普拉斯分布的尺度参数的方差,以及小波系数高阶统计量作为特征,并按域进行特征值缩放,组成26维向量;然后设计BP神经网络分类器,进行训练和分类实现.对8种BMP和JPEG图像典型隐藏方法在多种嵌入比率情况下进行了实验,结果表明:该方法能对多种典型隐藏方法进行较为可靠的盲检测. 展开更多
关键词 信息隐藏 盲检测 特征缩放 BP神经网络
下载PDF
网页质量评价体系的研究 被引量:4
6
作者 魏超 陈飞 +3 位作者 许丹青 张敏 刘奕群 马少平 《中文信息学报》 CSCD 北大核心 2011年第5期3-8,共6页
网络数据的飞速增长为搜索引擎带来了巨大的存储和网络服务压力,大量冗余、低质量乃至垃圾数据造成了搜索引擎存储与运算能力的巨大浪费,在这种情况下,如何建立适合万维网实际应用环境的网页数据质量评估体系与评估算法成为了信息检索... 网络数据的飞速增长为搜索引擎带来了巨大的存储和网络服务压力,大量冗余、低质量乃至垃圾数据造成了搜索引擎存储与运算能力的巨大浪费,在这种情况下,如何建立适合万维网实际应用环境的网页数据质量评估体系与评估算法成为了信息检索领域的重要研究课题。在前人工作的基础上,通过网络用户及网页设计人员的参与,文章提出了包括权威知名度、内容、时效性和网页外观呈现四个维度十三个因素的网页质量评价体系;标注数据显示我们的网页质量评价体系具有较强的可操作性,标注结果比较一致;文章最后使用Ordinal Logistic Regres-sion模型对评价体系的各个维度的重要性进行了分析并得出了一些启发性的结论:互联网网页内容和实效性能否满足用户需求是决定其质量的重要因素。 展开更多
关键词 信息检索 网页质量评价 ORDINAL LOGISTIC Regression
下载PDF
分布式协商:建立稳固分布式大数据系统的基石 被引量:2
7
作者 陈康 黄剑 刘建楠 《大数据》 2016年第4期24-35,共12页
分布式协商的目的是在分布式环境下在一组进程之间决定一个共同的值,这是在分布式系统中最基本的问题。分布式协商问题的目标非常简单,但是在面对节点出错、网络出错、网络时延等环境的时候,协议设计以及处理起来十分困难。讨论分布式... 分布式协商的目的是在分布式环境下在一组进程之间决定一个共同的值,这是在分布式系统中最基本的问题。分布式协商问题的目标非常简单,但是在面对节点出错、网络出错、网络时延等环境的时候,协议设计以及处理起来十分困难。讨论分布式协商问题的基本形式,在不同的系统假设下的基本结果以及分布式协商在构建稳固的分布式大数据系统中的作用。 展开更多
关键词 分布式协商 副本状态机 网络错误 安全性 活跃性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部