期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
数字信息资源的自动分类和主题识别——OCLC“蝎子计划”研究 被引量:7
1
作者 薛春香 侯汉清 《图书馆杂志》 CSSCI 北大核心 2005年第1期24-28,共5页
“蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动... “蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨 Scorpion 对中文信息自动分类和主题识别的借鉴意义。 展开更多
关键词 数字信息资源 自动分类 OCLC 中文信息 《杜威十进分类法》 对数 《中图法》 主题识别 知识库 描述
下载PDF
中文Web概念挖掘系统设计与测评 被引量:7
2
作者 章成志 侯汉清 丁璇 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第S1期207-211,共5页
Web概念挖掘系统的总体设计思想是 :基于《中图法》知识库的主题标引和自动分类 ,即依据标引源权重方案进行文本的概念提取 ,利用语义相似度算法进行文本的自动分类 .本文简要介绍了概念挖掘系统的基本情况 ,并进行了 4种加权标引方案... Web概念挖掘系统的总体设计思想是 :基于《中图法》知识库的主题标引和自动分类 ,即依据标引源权重方案进行文本的概念提取 ,利用语义相似度算法进行文本的自动分类 .本文简要介绍了概念挖掘系统的基本情况 ,并进行了 4种加权标引方案的比较和性能的测评 . 展开更多
关键词 概念挖掘 自动标引 主题标引 自动分类
下载PDF
2003—2023年我国自动标引研究及实践进展
3
作者 史雅莉 贺红钰 《情报探索》 2024年第4期120-127,共8页
[目的/意义]对2003年以来我国自动标引的研发现状进行总结并预测未来发展动向,以期为文献自动标引实践的发展提供借鉴和参考。[方法/过程]通过文献调研和相关案例回顾,系统梳理2003—2023年我国文献自动标引的系统研发及典型应用,具体... [目的/意义]对2003年以来我国自动标引的研发现状进行总结并预测未来发展动向,以期为文献自动标引实践的发展提供借鉴和参考。[方法/过程]通过文献调研和相关案例回顾,系统梳理2003—2023年我国文献自动标引的系统研发及典型应用,具体从自动主题标引和自动分类标引两方面展开。[结果/结论]自动标引发展面临不少现实问题,今后自动标引研究及实践应聚焦于技术上重点突破中文自动分词的语言分析问题、研究和探索更高效的语料库智能学习机制、集成化开发多媒体信息自动标引方法、多方联动构建文献自动标引效果的评价体系与监测机制。 展开更多
关键词 自动主题标引 自动分类标引 标引技术 人工智能
下载PDF
基于多因子算法的自动分类研究 被引量:4
4
作者 李娇 黄永文 +2 位作者 罗婷婷 赵瑞雪 鲜国建 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第11期43-51,共9页
【目的】从实用角度出发,研制领域适用性广、人力投入少的分类标引方法,支撑海量信息资源分类管理与学科领域地图揭示。【方法】基于文献中代表主题概念的术语、概念等关键词和分类号的兼容关系,研究设计多因子加权分类算法,在此基础上... 【目的】从实用角度出发,研制领域适用性广、人力投入少的分类标引方法,支撑海量信息资源分类管理与学科领域地图揭示。【方法】基于文献中代表主题概念的术语、概念等关键词和分类号的兼容关系,研究设计多因子加权分类算法,在此基础上提出全流程自动分类标引方案。【结果】以权威的多领域标注语料库和标准集为数据来源进行分类标引实验,单类号文献标引准确率84.1%,召回率79.8%,F值81.9%;双类号文献标引准确率83.4%,召回率78.8%,F值81.0%。【局限】学科分类标引的准确率及完整性依赖高质量标注语料库,且在多类号资源的标引上有待提升。【结论】本文提出的多因子算法自动分类标引具有较高的可操作性和实践应用价值。 展开更多
关键词 自动分类 学科分类 多因子算法
原文传递
面向ESI研究前沿数据的学科领域自动分类方法--以农业领域为例 被引量:1
5
作者 王成卓 孙巍 杨宇 《农业展望》 2021年第8期143-149,共7页
在现有ESI数据库学科分类体系中,如何高效地从内容层面对其研究前沿数据进行特定学科领域的标引与分类,是当前基于ESI数据深入开展领域研究前沿挖掘与分析研究的关键。为解决这一问题,提出了一种面向ESI研究前沿数据的学科领域自动分类... 在现有ESI数据库学科分类体系中,如何高效地从内容层面对其研究前沿数据进行特定学科领域的标引与分类,是当前基于ESI数据深入开展领域研究前沿挖掘与分析研究的关键。为解决这一问题,提出了一种面向ESI研究前沿数据的学科领域自动分类方法,该方法借用了期刊学科分类思想,考虑了学科领域核心论文的贡献度及影响度两方面因素,并以农业领域为例开展了实证分析。分析结果表明,研究前沿自动分类方法具有较高的类目识别度及实用性,有助于科研工作者进行有效的研究前沿挖掘分析,帮助科研管理者和政策制定者制定科技战略发展规划,推进前沿科技创新。 展开更多
关键词 ESI研究前沿 自动学科分类 期刊学科分类 核心论文 农业领域
下载PDF
Research on Web Page Automatic Classification Based on Internet News Corpus
6
作者 蔡巍 王永成 尹中航 《Journal of Shanghai Jiaotong university(Science)》 EI 2007年第6期731-735,共5页
Web pages contain more abundant contents than pure text ,such as hyperlinks,html tags and metadata et al.So that Web page categorization is different from pure text. According to Internet Chinese news pages, a practic... Web pages contain more abundant contents than pure text ,such as hyperlinks,html tags and metadata et al.So that Web page categorization is different from pure text. According to Internet Chinese news pages, a practical algorithm for extracting subject concepts from web page without thesaurus was proposed, when incorporated these category-subject concepts into knowledge base, Web pages was classified by hybrid algorithm, with experiment corpus extracting from Xinhua net. Experimental result shows that the categorization performance is improved using Web page feature. 展开更多
关键词 automatic classification Web PAGES subject EXTRACTION
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部