期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于特征相似度的科技论文元数据提取算法研究 被引量:9
1
作者 钱建立 吴广茂 蒋路 《微电子学与计算机》 CSCD 北大核心 2008年第8期129-132,共4页
通过对论文元数据网页的分析发现论文摘要页面的各种元数据在长度、前置引导词、分隔符等方面都具有特定的规律,并据此提出了基于元数据特征的元数据抽取算法,归纳出了论文元数据的7个形式特征和2个语义特征,定义了确定特征和排除特征,... 通过对论文元数据网页的分析发现论文摘要页面的各种元数据在长度、前置引导词、分隔符等方面都具有特定的规律,并据此提出了基于元数据特征的元数据抽取算法,归纳出了论文元数据的7个形式特征和2个语义特征,定义了确定特征和排除特征,描述了特征相似度算法的6个步骤,给出了分别采用正则表达式方法和特征相似度方法的试验结果,测试表明,采用特征相似度方法的提取成功率从68%提高到了95%,达到了实用水平. 展开更多
关键词 元数据抽取 特征相似度 形式特征 语义特征 确定特征 排除特征 最大相似度原则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部