期刊文献+
共找到129篇文章
< 1 2 7 >
每页显示 20 50 100
Web文本挖掘技术研究 被引量:275
1
作者 王继成 潘金贵 张福炎 《计算机研究与发展》 EI CSCD 北大核心 2000年第5期513-520,共8页
作为从浩瀚的 Web信息资源中发现潜在的、有价值知识的一种有效技术 ,Web挖掘正悄然兴起 ,倍受关注 .目前 ,Web挖掘的研究正处于发展阶段 ,尚无统一的结论 ,需要国内外学者在理论上开展更多的讨论 .同时 ,Web挖掘系统的开发对其研究也... 作为从浩瀚的 Web信息资源中发现潜在的、有价值知识的一种有效技术 ,Web挖掘正悄然兴起 ,倍受关注 .目前 ,Web挖掘的研究正处于发展阶段 ,尚无统一的结论 ,需要国内外学者在理论上开展更多的讨论 .同时 ,Web挖掘系统的开发对其研究也将起到很大推进作用 .首先探讨了 Web挖掘的有关理论 ,从 Web挖掘的定义、Web挖掘与 Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述 .然后重点分析了 Web文本挖掘的方法 ,包括 :文本的特征表示、文本分类与文本聚类 .在此基础上简单介绍了一个 Web文本挖掘系统原型Web Miner.Web Miner采用了多 agent体系结构 ,将多维文本分析与文本挖掘这两种技术有机地结合起来 ,以帮助用户快速、有效地挖掘 Web上的 HTML 文档 . 展开更多
关键词 文本挖掘 文本分类 文本聚类 信息检索 web
下载PDF
文本挖掘技术研究 被引量:63
2
作者 薛为民 陆玉昌 《北京联合大学学报》 CAS 2005年第4期59-63,共5页
文本挖掘是数据挖掘的重要内容之一,其应用十分广泛。对文本挖掘技术的基本概念和理论进行系统地归纳总结,首先给出了数据挖掘、文本挖掘和Web文本挖掘的基本概念及主要研究方向,然后分析了文本挖掘的过程和关键技术,最后对文本挖掘技... 文本挖掘是数据挖掘的重要内容之一,其应用十分广泛。对文本挖掘技术的基本概念和理论进行系统地归纳总结,首先给出了数据挖掘、文本挖掘和Web文本挖掘的基本概念及主要研究方向,然后分析了文本挖掘的过程和关键技术,最后对文本挖掘技术进行总结和展望。 展开更多
关键词 文本挖掘 数据挖掘 web文本挖掘 文本挖掘模型
下载PDF
Web数据挖掘技术及工具研究 被引量:32
3
作者 邓英 李明 《计算机工程与应用》 CSCD 北大核心 2001年第20期92-94,共3页
Internet应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。文章就Web挖掘技术的概念、分类及文本挖掘和用户访问模式挖掘的实现技术做了详细的阐述,并在此基础上介绍了一些实用的Web挖掘工具。
关键词 web 数据挖掘 数据库 数据挖掘工具 INTERNET
下载PDF
基于文本挖掘的景区旅游形象感知研究——以杭州西溪国家湿地公园为例 被引量:57
4
作者 陈天琪 张建春 《资源开发与市场》 CAS 北大核心 2021年第6期741-746,共6页
以携程网抓取的网络评论文本为研究素材,利用ROST Content Mining软件,从游客认知、情感等方面挖掘游客对杭州西溪国家湿地公园的旅游形象感知。结果表明:①游客对景区认可度较高,对湿地景区旅游的整体感知和旅游体验总体较好,线下问卷... 以携程网抓取的网络评论文本为研究素材,利用ROST Content Mining软件,从游客认知、情感等方面挖掘游客对杭州西溪国家湿地公园的旅游形象感知。结果表明:①游客对景区认可度较高,对湿地景区旅游的整体感知和旅游体验总体较好,线下问卷调查游客的总体体验满意度为94%,并表现出一定的重游和推荐意愿。②旅游者对西溪国家湿地公园的整体形象感知是积极的,正面评论占比为84.48%,线下问卷调查游客的综合满意度平均为88.2%,中性和消极情绪较少。③综合分析游客对西溪国家湿地公园的旅游吸引物、旅游环境、旅游设施与服务、旅游体验、旅游评价等方面形象感知的特征与差异,发现湿地景区仍存在许多有待改善的地方。 展开更多
关键词 西溪国家湿地公园 网络文本 文本挖掘 旅游形象感知
下载PDF
老年在线社区用户健康信息需求挖掘研究 被引量:54
5
作者 钱宇星 周华阳 +2 位作者 周利琴 任美伶 李浩 《现代情报》 CSSCI 2019年第6期59-69,共11页
[目的/意义]研究老年在线社区用户的健康信息需求,为利用互联网开展精准的医学教育和科普服务提供依据,优化在线社区服务,吸引和鼓励更多老年人使用网络分享和获取健康信息。[方法/过程]本文采取网络文本挖掘的方法,选取老年论坛"... [目的/意义]研究老年在线社区用户的健康信息需求,为利用互联网开展精准的医学教育和科普服务提供依据,优化在线社区服务,吸引和鼓励更多老年人使用网络分享和获取健康信息。[方法/过程]本文采取网络文本挖掘的方法,选取老年论坛"老年人之家"中5 296条用户发布的健康相关文本作为语料库,利用TextRank和TF-IDF两种关键词抽取算法对每条文本抽取关键词,构造关键词共现网络,进行社会网络分析,识别重要关键词和主题,研究老年在线社区用户的健康信息需求。[结果/结论]老年在线社区用户信息需求主要可划分为中医养生原理与方法、生活方式调整与改变、疾病防治与应对老化、食品营养价值与功效4个类型,且不同需求类型间存在复杂的交错关系;用户表露的健康信息需求停留在生理健康层面,而心理健康和社会适应力是潜在的信息需求。通过网络文本挖掘的方法能有效利用用户生成的文本数据,展现用户健康信息需求并发现其中的问题。 展开更多
关键词 在线社区 老年人 网络文本挖掘 健康信息需求
下载PDF
Web内容挖掘技术研究 被引量:23
6
作者 涂承胜 鲁明羽 陆玉昌 《计算机应用研究》 CSCD 北大核心 2003年第11期5-9,15,共6页
简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征... 简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等,讨论了多媒体文本分类挖掘方法。 展开更多
关键词 web挖掘 web内容挖掘 文本的分类 文本聚类 多媒体文本挖掘
下载PDF
基于Web的文本挖掘技术研究 被引量:19
7
作者 许高建 《计算机技术与发展》 2007年第6期187-190,共4页
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,... Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。 展开更多
关键词 web挖掘 文本挖掘 文本分类 文本聚类
下载PDF
数据挖掘技术在高校图书馆中的应用 被引量:24
8
作者 赵卫军 《图书馆论坛》 CSSCI 北大核心 2007年第4期126-128,共3页
数据挖掘技术是一种新兴的信息处理技术,其算法及应用是目前国际研究热点,在信息的利用和提取中发挥着日益重要的作用。文章在论述数据挖掘技术的基础上,探讨了数据挖掘在高校图书馆的应用领域和产生的价值。并重点探讨了在优化资源、... 数据挖掘技术是一种新兴的信息处理技术,其算法及应用是目前国际研究热点,在信息的利用和提取中发挥着日益重要的作用。文章在论述数据挖掘技术的基础上,探讨了数据挖掘在高校图书馆的应用领域和产生的价值。并重点探讨了在优化资源、智能化服务、提供个性化服务、信息自动化处理等几方面的应用。 展开更多
关键词 数据挖掘 图书馆 信息管理 文本挖掘 web挖掘
下载PDF
Web文本挖掘系统及聚类分析算法 被引量:7
9
作者 朱克斌 唐菁 杨炳儒 《计算机工程》 CAS CSCD 北大核心 2004年第13期138-139,183,共3页
给出了Web文本挖掘系统WTMS的系统总体结构图,开发并实现了基于SOM的Web文档层次聚类算法。同时结合现代远程教育背景实现了Web文本挖掘的原型系统。该系统可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘,从而帮助人们快... 给出了Web文本挖掘系统WTMS的系统总体结构图,开发并实现了基于SOM的Web文档层次聚类算法。同时结合现代远程教育背景实现了Web文本挖掘的原型系统。该系统可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘,从而帮助人们快速进行文本 信息导航,获取重要的知识。 展开更多
关键词 web文本挖掘 知识发现 文本聚类
下载PDF
Web文本挖掘中的特征选取方法研究 被引量:14
10
作者 和亚丽 陈立潮 《计算机工程》 EI CAS CSCD 北大核心 2005年第5期181-182,190,共3页
研究了Web文本挖掘中的高维特征选取问题,对常见的评估函数法、主成分分析法、模拟退火法等特征选取和降维算法进行了理论分析与性能比较,通过实验对各种算法的优劣性及适用性进行了讨论。旨在通过降维处理来解决高维空间的文本挖掘问题。
关键词 特征选取 降维算法 web挖掘 文本挖掘
下载PDF
基于网络文本挖掘的旅游演艺体验特征的比较研究——以《印象·刘三姐》《宋城千古情》和《藏谜》为例 被引量:18
11
作者 展梦雪 孔少君 《旅游论坛》 2016年第3期37-43,共7页
作为旅游目的地特色娱乐活动,旅游演艺活动在延长旅游者逗留时间和丰富旅游者体验方面发挥着越来越重要的作用。以《印象·刘三姐》《宋城千古情》《藏谜》为例,搜集旅游者网络游记和旅游网站在线评论,利用ROST软件对3类旅游演艺游... 作为旅游目的地特色娱乐活动,旅游演艺活动在延长旅游者逗留时间和丰富旅游者体验方面发挥着越来越重要的作用。以《印象·刘三姐》《宋城千古情》《藏谜》为例,搜集旅游者网络游记和旅游网站在线评论,利用ROST软件对3类旅游演艺游客体验的网络文本进行高频词提取、社会网络K-核分析和情感分析,发现不同类型的旅游演艺活动在旅游者核心体验、旅游者情感满意度以及评价影响因素方面存在显著差异。从旅游者视角对旅游演艺的观后体验进行研究,对旅游演艺产品的品牌塑造和可持续发展具有重要意义。 展开更多
关键词 旅游演艺 网络文本挖掘 旅游体验 比较研究
下载PDF
Web文本挖掘中数据预处理技术研究 被引量:13
12
作者 胡静 蒋外文 朱华 《现代计算机》 2009年第3期48-51,共4页
数据预处理是将原始的Web文档转化为适合进行数据挖掘的中间表示形式,在Web文本挖掘过程中起着至关重要的作用。介绍Web文本挖掘的概念及Web文本挖掘的一般流程,对Web文本挖掘中的特征表示、中文分词、特征选择等数据预处理关键技术进... 数据预处理是将原始的Web文档转化为适合进行数据挖掘的中间表示形式,在Web文本挖掘过程中起着至关重要的作用。介绍Web文本挖掘的概念及Web文本挖掘的一般流程,对Web文本挖掘中的特征表示、中文分词、特征选择等数据预处理关键技术进行详尽的分析。 展开更多
关键词 web文本挖掘 向量空间模型 中文分词 特征选择
下载PDF
基于WEB文本数据挖掘的研究 被引量:10
13
作者 刘晓鹏 邢长征 《计算机与数字工程》 2005年第9期75-79,共5页
万维网是一个巨大的、分布广泛和全球性的信息服务中心,它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其他信息服务。Web文本挖掘系统是挖掘技术的重要应用方向,它是指在给定的分类体系下,根据网页的内容自动判别... 万维网是一个巨大的、分布广泛和全球性的信息服务中心,它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其他信息服务。Web文本挖掘系统是挖掘技术的重要应用方向,它是指在给定的分类体系下,根据网页的内容自动判别内容类别的过程。 展开更多
关键词 web挖掘 文本挖掘 特征提取 关联 文本分类 文本聚类
下载PDF
基于用户搜索意图的Web网页动态泛化 被引量:14
14
作者 王大玲 于戈 +2 位作者 鲍玉斌 张沫 沈洲 《软件学报》 EI CSCD 北大核心 2010年第5期1083-1097,共15页
基于目前对用户搜索意图的分类,进一步分析了每种用户意图的信息需求,提出了基于用户搜索意图的Web网页动态泛化模型,为搜索的Web网页动态地建立文档片段、关键词、导航类型、文档格式之间的概念层次,通过网页内容、类型和格式的泛化为... 基于目前对用户搜索意图的分类,进一步分析了每种用户意图的信息需求,提出了基于用户搜索意图的Web网页动态泛化模型,为搜索的Web网页动态地建立文档片段、关键词、导航类型、文档格式之间的概念层次,通过网页内容、类型和格式的泛化为不同的访问意图提供进一步的搜索导航,从而返回与搜索意图更相关的结果.与相关工作对比,重点并非获取用户意图,也不是对用户意图分类,而是基于用户搜索意图的Web网页动态泛化模型的建立及Web网页泛化过程的实现.实验结果表明,该泛化模型不仅能够通过导航自动获取用户搜索意图,而且能够基于该意图提供相关搜索结果以及进一步的搜索导航. 展开更多
关键词 网页泛化 用户意图 动态建模 搜索导航 文本挖掘
下载PDF
中国科技创新合作网络研究 被引量:13
15
作者 吴翌琳 吴洁琼 《统计研究》 CSSCI 北大核心 2017年第5期94-101,共8页
本文利用网络爬虫技术对万方知识平台的科技论文大数据进行抓取,基于社会网络方法构建了作者合作网络、科研机构合作网络和地区合作网络,对网络的基本属性、关键节点进行了个性化分析。研究发现:中国科技创新论文稳步上升并呈现空间集聚... 本文利用网络爬虫技术对万方知识平台的科技论文大数据进行抓取,基于社会网络方法构建了作者合作网络、科研机构合作网络和地区合作网络,对网络的基本属性、关键节点进行了个性化分析。研究发现:中国科技创新论文稳步上升并呈现空间集聚性,"农业"、"大学生"等关键词成为研究热点,产学研合作不断加深,但从区域看,由东向西区域协同创新能力逐渐减弱,核心作者间的信息分享与协同创新较少,处于同一地区、具有相同经营范围或研究方向的机构单位之间更容易展开合作。 展开更多
关键词 科技创新 网络爬虫 文本挖掘 合作网络
下载PDF
基于网络文本的古村落型世界文化遗产地旅游形象感知研究——以宏村为例 被引量:12
16
作者 庞兆玲 仲明明 潘立新 《大理大学学报》 CAS 2017年第3期25-30,共6页
为了解游客对古村落型世界文化遗产地的旅游形象感知,通过收集携程攻略社区中关于宏村的1 704条游友在线评论,借助ROST Content Mining软件,运用词频统计分析、情感分析、社会网络与语义分析方法,提取游客感知的宏村旅游形象高频特征词... 为了解游客对古村落型世界文化遗产地的旅游形象感知,通过收集携程攻略社区中关于宏村的1 704条游友在线评论,借助ROST Content Mining软件,运用词频统计分析、情感分析、社会网络与语义分析方法,提取游客感知的宏村旅游形象高频特征词,分析旅游情感倾向并构建语义网络。研究结果表明:游客对宏村旅游形象的感知综合性明显,存在旅游景点屏蔽效应;对宏村旅游形象深层次的文化性感知不强,存在价格敏感受众;对宏村的旅游形象感知完整性不足,存在感知形象的长尾现象;对宏村旅游形象感知的积极情感倾向显著,存在商业化担忧;对宏村旅游形象的感知受影视作品影响小,隐性构建力量不足。根据以上结论为宏村的旅游形象塑造与传播提出意见和建议。 展开更多
关键词 旅游形象 网络文本 内容挖掘 世界文化遗产地 宏村
下载PDF
数据挖掘在数字图书馆个性化服务中的应用 被引量:9
17
作者 史嘉陵 《农业网络信息》 2009年第4期77-79,共3页
个性化服务是整个数字图书馆服务系统中十分关键的部分。本文从数字图书馆个性化服务、数据挖掘的特点入手,描述了数据挖掘技术和方法,着重探讨了数据挖掘技术在数字图书馆个性化服务中的应用。
关键词 数字图书馆 个性化服务 数据挖掘 web挖掘 文本挖掘
下载PDF
基于XML的Web文本挖掘模型的研究与设计 被引量:4
18
作者 申丽君 孟凡荣 《计算机工程与设计》 CSCD 北大核心 2007年第10期2287-2290,共4页
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点。而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题。介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型... Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点。而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题。介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点。 展开更多
关键词 web数据挖掘 数据挖掘技术 半结构化 数据源 web文本挖掘 基于XML的web文本挖掘模型
下载PDF
基于本体的Web文本挖掘与信息检索 被引量:8
19
作者 艾伟 孙四明 张峰 《计算机工程》 CAS CSCD 北大核心 2010年第22期75-77,80,共4页
针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。... 针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。实验结果初步验证了本体模型在Web文本挖掘技术上应用的可行性。 展开更多
关键词 本体 web文本挖掘 向量空间模型 信息检索
下载PDF
Web文本表示及其分类研究 被引量:7
20
作者 徐甜 肖新峰 《微计算机信息》 北大核心 2007年第21期284-285,283,共3页
Web文本挖掘是Web数据挖掘的一个重要研究领域。文本挖掘的主要方法是文本分类和聚类。本文主要讨论了在文本挖掘中文本的表示,以及文本聚类的算法描述。
关键词 web文本挖掘 分类 聚类
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部