期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于网页特征的TFIDF改进算法 被引量:9
1
作者 宋斌 方小璐 《微计算机应用》 2002年第1期18-20,共3页
本文分析了传统的TFIDF算法。提出了一种改进的TFIDF算法,将提取到的网页特征加入传统的TFIDF算法,从而更为准确地抽取网页中的重要文字。
关键词 权重 网页标记 网页特征 IFIDF算法 计算机网络
下载PDF
突发事件新闻标题与正文提取方法 被引量:10
2
作者 罗永莲 赵昌垣 《计算机应用》 CSCD 北大核心 2014年第10期2865-2868,2873,共5页
针对突发事件新闻网页语料处理问题,提出了一种基于此类新闻特点与网页标记信息的抽取和定位新闻内容的方法。该方法将网页标记与文本相似度作为机器学习的特征项,利用贝叶斯分类方法提取新闻标题。利用事件新闻的用词稳定性与网页标记... 针对突发事件新闻网页语料处理问题,提出了一种基于此类新闻特点与网页标记信息的抽取和定位新闻内容的方法。该方法将网页标记与文本相似度作为机器学习的特征项,利用贝叶斯分类方法提取新闻标题。利用事件新闻的用词稳定性与网页标记的嵌套特点,减少了文本处理数量,降低了文本向量维数,在此基础上计算向量相似度以定位新闻篇首与篇尾。实验结果表明,该方法抽取标题的准确率达到86.5%,抽取正文的平均准确率在78%以上,能有效抽取新闻内容,且易于实现,对其他网页文本处理中挖掘标记信息与文本自身信息具有一定的借鉴意义。 展开更多
关键词 朴素贝叶斯模型 向量空间模型 突发事件新闻 网页标记 内容提取
下载PDF
基于知识点的网页标记方法研究 被引量:4
3
作者 李枫林 王梦亮 《情报科学》 CSSCI 北大核心 2016年第5期130-133,共4页
网页标记在文本检索及信息推荐系统中有重要的作用。本文试图从知识点的角度对网页进行标记,从而提升文本检索与信息推荐的准确度。该方法将利用知网中概念与义元之间的关系及TF/IDF算法来计算词语之间相似度、段落之间相似度以及句子... 网页标记在文本检索及信息推荐系统中有重要的作用。本文试图从知识点的角度对网页进行标记,从而提升文本检索与信息推荐的准确度。该方法将利用知网中概念与义元之间的关系及TF/IDF算法来计算词语之间相似度、段落之间相似度以及句子之间的相似度,从而提取网页的知识点。结果表明,该方法能够较好地完成知识点的抽取以及网页标记任务。 展开更多
关键词 知识点 相似度 网页标记
原文传递
基于网页标记的信息隐藏技术研究与实现 被引量:2
4
作者 王长征 刘建辉 《科技广场》 2007年第5期104-105,共2页
通过对超文本标记的分析,介绍了基于网页标记的信息隐藏技术的概念和特点,提出并实现了一种新的网页文本信息隐藏方法。
关键词 信息隐藏 数字水印 网页标记
下载PDF
一种基于网页源文件的信息提取算法 被引量:1
5
作者 赵晓峰 凌天斌 +1 位作者 彭波 王转妮 《计算机与现代化》 2012年第2期38-39,43,共3页
通过对网页源文件的代码进行分析、设计信息提取的算法,目的是替代人工进行网站相关信息的获取,避免重复性劳动。首先对现有的两种Web结构进行比较分析,然后针对每一种Web结构提出信息提取的方案,接下来以日本著名新闻网站NHK为例,对上... 通过对网页源文件的代码进行分析、设计信息提取的算法,目的是替代人工进行网站相关信息的获取,避免重复性劳动。首先对现有的两种Web结构进行比较分析,然后针对每一种Web结构提出信息提取的方案,接下来以日本著名新闻网站NHK为例,对上述方案进行验证和代码实现,最后对系统的功能扩充进行更高层次的展望。 展开更多
关键词 WEB结构 信息提取 网页标记
下载PDF
一种基于网页结构特征的用户建模技术
6
作者 刘茵 苏一丹 《电脑与电信》 2007年第5期51-52,共2页
本文提出一种基于网页结构特征的用户建模技术。它通过对某些网页标记内的词汇人为提升词频数,将提取到的网页特征加入到用户模型的计算中。实验结果表明,该技术能建立更有效的用户模型。
关键词 网页标记 用户模型 特征提取
下载PDF
iframe脚本攻防完全接触
7
作者 Winbo 《黑客防线》 2010年第1期33-35,共3页
iframe也称为嵌入式框架.它是一个非常普通的HTML语言标记。就像电视机的画中画效果一样,设计者只需采用简单的网页标记〈iframe〉〈/iframe〉.就可以达到栏目丰富化、功能多样化、信息实时化等设计要求。但是.在日常应用中.我们... iframe也称为嵌入式框架.它是一个非常普通的HTML语言标记。就像电视机的画中画效果一样,设计者只需采用简单的网页标记〈iframe〉〈/iframe〉.就可以达到栏目丰富化、功能多样化、信息实时化等设计要求。但是.在日常应用中.我们经常会碰到有关.frame的安全问题。 展开更多
关键词 IFRAME 攻防 脚本 HTML语言 网页标记 功能多样化 安全问题 设计者
原文传递
学术期刊投稿网站网页标记语言正确性之探讨——以图书情报类期刊为例 被引量:1
8
作者 尹楠 《软件》 2017年第11期181-186,共6页
本研究利用国际万维网联盟的网页标记检测工具检测学术期刊论文投稿网站的首页标记语言正确性和规范性。研究方法通过网页格式定义种类、网页错误数及网页错误类型三项指标。被检测的19个学术期刊论文投稿网站的网页格式定义有两种:HTML... 本研究利用国际万维网联盟的网页标记检测工具检测学术期刊论文投稿网站的首页标记语言正确性和规范性。研究方法通过网页格式定义种类、网页错误数及网页错误类型三项指标。被检测的19个学术期刊论文投稿网站的网页格式定义有两种:HTML 4.01 Transitional和XHTML 1.0 Transitional。学术期刊论文投稿网站首页标记语言的正确性检测通过率为0,部分期刊投稿网站的错误数较多,错误类型统计共有121种。研究结论认为期刊论文投稿网站整体的正确性检测就如同对期刊编辑出版工作的审视,学术期刊应将期刊论文投稿网站正确性的检测视为期刊管理业务之一。 展开更多
关键词 学术期刊 投稿网站 网页标记语言
下载PDF
软件技巧
9
《数字生活》 2002年第8期58-58,共1页
抛去“臃肿”的Office系列不说,“记事本”可能是大家最常用的文本工具了,但是“记事本”的功能实在是太简单了,用它编辑的文本总是千篇一律的老样子。怎么办,要不要想点办法,给你的记事本做做美容,以便让它看起来与众不同? 如果你想让... 抛去“臃肿”的Office系列不说,“记事本”可能是大家最常用的文本工具了,但是“记事本”的功能实在是太简单了,用它编辑的文本总是千篇一律的老样子。怎么办,要不要想点办法,给你的记事本做做美容,以便让它看起来与众不同? 如果你想让编辑的文本能与众不同一些,请在“开始”按钮菜单的“运行”中输入“Regedit”(图1)。 展开更多
关键词 IMARKUP 工具软件 网页标记
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部