期刊文献+
共找到108篇文章
< 1 2 6 >
每页显示 20 50 100
基于页面Block的Web档案采集和存储 被引量:12
1
作者 宋杰 王大玲 +1 位作者 鲍玉斌 申德荣 《软件学报》 EI CSCD 北大核心 2008年第2期275-290,共16页
提出了基于页面Block对Web页面的采集和存储方式,并详细表述了该方法如何完成基于布局页面分区、Block主题的抽取、版本和差异的比较以及增量存储的方式.实现了一个Web归档原型系统,并对所提出的算法进行了详细的测试.理论和实验表明,... 提出了基于页面Block对Web页面的采集和存储方式,并详细表述了该方法如何完成基于布局页面分区、Block主题的抽取、版本和差异的比较以及增量存储的方式.实现了一个Web归档原型系统,并对所提出的算法进行了详细的测试.理论和实验表明,所提出的基于页面Block的Web档案(Web archive)采集和存储方法能够很好地适应Web档案的管理方式,并对基于Web档案的查询、搜索、知识发现和数据挖掘等应用提供有利的数据资源. 展开更多
关键词 web档案 页面分区 页块
下载PDF
网络存储信息采集方式研究 被引量:14
2
作者 刘兰 吴振新 《图书馆杂志》 CSSCI 北大核心 2009年第8期28-31,共4页
对网络存储(Web Archive)信息采集方式进行梳理和分析,根据采集对象、采集目的和实施者的不同把网络存储中的信息采集归纳为:面向长期保存的一次采集、基于web仓储的二次采集、面向采集服务的订阅型采集、需求触发的被动采集和事件驱动... 对网络存储(Web Archive)信息采集方式进行梳理和分析,根据采集对象、采集目的和实施者的不同把网络存储中的信息采集归纳为:面向长期保存的一次采集、基于web仓储的二次采集、面向采集服务的订阅型采集、需求触发的被动采集和事件驱动的网络交易采集,期望为国内网络信息采集和保存提供参考。 展开更多
关键词 网络存储 信息采集 采集方式
下载PDF
国内外近年Web Archive技术研究与应用进展 被引量:14
3
作者 黄新平 王萍 《图书馆学研究》 CSSCI 2016年第18期30-35,19,共7页
在对国内外近年相关研究文献和网络存档项目调研的基础上,参照OAIS模型,把网络信息资源长期保存的基本流程归纳为采集、管理、保存、利用等主要阶段,并依此为主线,构建一个系统化的研究框架,在该框架下对Web Archive流程中不同阶段目标... 在对国内外近年相关研究文献和网络存档项目调研的基础上,参照OAIS模型,把网络信息资源长期保存的基本流程归纳为采集、管理、保存、利用等主要阶段,并依此为主线,构建一个系统化的研究框架,在该框架下对Web Archive流程中不同阶段目标的实现所涉及的技术及其应用进行梳理、识别和分析。通过总结近年国内外Web Archive技术的研究成果和洞悉未来网络资源保存技术的发展趋势,以期为我国网络资源保存的研究与实践提供参考和借鉴。 展开更多
关键词 web archive 网络资源 长期保存 技术应用
原文传递
国内外社交媒体存档研究与实践述评 被引量:15
4
作者 黄新荣 高晨翔 《图书情报工作》 CSSCI 北大核心 2019年第4期122-134,共13页
[目的/意义]社交媒体是网络信息资源的重要组成部分,对国内外社交媒体存档的相关研究成果进行总结与梳理,形成比较完整的综述内容,为国内该领域研究提供参考与借鉴。[方法/过程]基于多学科视角,通过文献计量与内容分析得到社交媒体存档... [目的/意义]社交媒体是网络信息资源的重要组成部分,对国内外社交媒体存档的相关研究成果进行总结与梳理,形成比较完整的综述内容,为国内该领域研究提供参考与借鉴。[方法/过程]基于多学科视角,通过文献计量与内容分析得到社交媒体存档领域的文献分布情况,总结社交媒体存档的理论基础,从宏观层面将社交媒体存档理论与实践研究归纳为"目的与主体""政策与指南""问题与障碍"三个研究主题并展开综述。[结果/结论]国内外社交媒体存档研究具有发展速度较快、与实践结合紧密、区域发展不均衡等特征,在未来研究中需要重视研究对象的变化、管理标准的构建以及多主体间的协作。最后对国内社交媒体存档研究与实践的发展提出建议。 展开更多
关键词 社交媒体 网络信息资源 网络存档 数据管护 长期保存
原文传递
Web Archive信息采集流程及关键问题研究 被引量:14
5
作者 刘兰 吴振新 《情报理论与实践》 CSSCI 北大核心 2009年第8期113-117,共5页
通过对国际网络存档项目和系统的调研,把网络信息采集的基本流程归纳为选择、征求所有者许可、实施采集、抽取元数据、质量审核和网络存档等6个部分,并对采集流程中存在的关键问题进行识别和分析。
关键词 互联网 网络存档 信息采集 采集流程
原文传递
国外Web Archive项目对我国的借鉴和启示——以澳大利亚的PANDORA项目为例 被引量:12
6
作者 闫晓创 《档案学研究》 CSSCI 北大核心 2012年第5期79-83,共5页
通过对澳大利亚网络信息资源保存项目PANDOR A的背景信息、网络信息采集策略、网络信息资源的保存方式、保存网络信息所提供的服务、保存网络信息的检索及PANDORA项目的技术架构分析研究。提出了对我国网络信息资源保存在法律环境、战... 通过对澳大利亚网络信息资源保存项目PANDOR A的背景信息、网络信息采集策略、网络信息资源的保存方式、保存网络信息所提供的服务、保存网络信息的检索及PANDORA项目的技术架构分析研究。提出了对我国网络信息资源保存在法律环境、战略定位、合作模式等方面的启示。 展开更多
关键词 web archive PANDOR A项目 网络信息保存
原文传递
基于云计算的政府网站网页在线归档管理平台构建研究 被引量:13
7
作者 黄新平 《北京档案》 北大核心 2019年第12期16-20,共5页
将云计算应用到政府网站网页的长期保存中,发挥其技术与管理优势,能够高效率、低成本地实现海量政府网页的在线归档和集成管理。文章依据文件生命周期理论、OAIS参考模型等理论,设计了政府网站网页在线归档的业务流程。在此基础上,文章... 将云计算应用到政府网站网页的长期保存中,发挥其技术与管理优势,能够高效率、低成本地实现海量政府网页的在线归档和集成管理。文章依据文件生命周期理论、OAIS参考模型等理论,设计了政府网站网页在线归档的业务流程。在此基础上,文章结合云计算服务体系结构,界定了云环境下政府网站网页归档的逻辑体系,并依此构建基于云计算的政府网站网页在线归档管理平台,平台具有云上在线采集、云下数据管理、云中资源保存、云端访问利用等重要功能。 展开更多
关键词 云计算 政府网站 网页存档 长期保存
下载PDF
国内外Web Archive研究综述 被引量:8
8
作者 阳广元 《图书馆杂志》 CSSCI 北大核心 2014年第10期88-94,共7页
通过文献调研,对国内外Web Archive的内涵、相关研究论文、实践项目进行分析比较,总结出目前国内相关研究发展状况及未来发展趋势并提出了一些建议:包括建立统一领导,分布式协作的模式;完善相关法律法规;加快专业人才队伍的建设;建立资... 通过文献调研,对国内外Web Archive的内涵、相关研究论文、实践项目进行分析比较,总结出目前国内相关研究发展状况及未来发展趋势并提出了一些建议:包括建立统一领导,分布式协作的模式;完善相关法律法规;加快专业人才队伍的建设;建立资金投入的长效机制;加快Web Archive的应用等。 展开更多
关键词 web archive 网络信息资源 数字遗产 文化遗产
下载PDF
国外Web Archive研究进展及启示 被引量:8
9
作者 阳广元 《图书馆工作与研究》 CSSCI 北大核心 2016年第6期18-21,共4页
文章概述了国外Web Archive的研究现状,全面总结了国外Web Archive研究发展的经验和需要进一步研究的问题,提出了改进我国Web Archive研究与实践的建议。
关键词 web archive 网络信息资源保存 文化遗产 综述
下载PDF
国外Web Archive资源开发利用的途径及趋势展望 被引量:9
10
作者 王萍 黄新平 张楠雪 《图书馆学研究》 CSSCI 2015年第23期43-49,共7页
基于文献与网络资源调研,对国外主要Web Archive项目存档资源应用的基本情况进行梳理,总结和分析当前网络存档资源开发利用的途径。在此基础上,立足于网络技术的不断发展和演变,以及未来对网络存档资源的应用需求,对其开发利用的发展趋... 基于文献与网络资源调研,对国外主要Web Archive项目存档资源应用的基本情况进行梳理,总结和分析当前网络存档资源开发利用的途径。在此基础上,立足于网络技术的不断发展和演变,以及未来对网络存档资源的应用需求,对其开发利用的发展趋势进行展望,以期对我国网络存档资源的开发利用起到参考作用。 展开更多
关键词 web archive 资源利用 学术研究 数据挖掘
原文传递
Web Archive的内涵、意义与责任、发展进程及未来趋势 被引量:9
11
作者 刘兰 《图书馆建设》 CSSCI 北大核心 2014年第3期28-34,38,共8页
Web Archive对政府、国家文化记忆机构、技术人员、学术科研人员、法律界人士等来说,具有重要的社会、技术、法律和学术意义。全球范围内的Web Archive实践经历了初期各国文化记忆机构的实验探索、中期不同层次规模的合作和后期基于第三... Web Archive对政府、国家文化记忆机构、技术人员、学术科研人员、法律界人士等来说,具有重要的社会、技术、法律和学术意义。全球范围内的Web Archive实践经历了初期各国文化记忆机构的实验探索、中期不同层次规模的合作和后期基于第三方Web Archive服务的历史进程。Web Archive实践研究的未来趋势将涉及以下几个方面:动态交互式网站的采集和长期保存将被关注,移动互联网的存档将引起学界和业界的研究与探索,存档资源价值的评估和挖掘将越来越被重视。 展开更多
关键词 web archive 社会责任 法律意义 学术价值 移动互联网
下载PDF
美国国会图书馆网页归档项目的新动向 被引量:10
12
作者 曹玲 颜祥林 《档案学研究》 CSSCI 北大核心 2018年第2期125-128,共4页
美国国会图书馆网页归档项目—LCWA(Library of Congress Web Archives),其前身为MINERVA(Mapping the Internet Electronic R esources Virtual Archive)。MIN ER VA于2000年由美国国会图书馆发起,旨在对有用的网络信息资源进行归... 美国国会图书馆网页归档项目—LCWA(Library of Congress Web Archives),其前身为MINERVA(Mapping the Internet Electronic R esources Virtual Archive)。MIN ER VA于2000年由美国国会图书馆发起,旨在对有用的网络信息资源进行归档保存。本文从建设模式、资源建设、开发利用三个方面对美国国会图书馆网页归档项目的发展变化进行了系统研究,提出值得我国网页归档项目借鉴的参考之处。 展开更多
关键词 美国国会图书馆 网页归档 MINERVA
原文传递
中外网络资源采集信息服务方式研究与建议 被引量:11
13
作者 马宁宁 曲云鹏 《图书情报工作》 CSSCI 北大核心 2014年第10期85-89,116,共6页
调研欧洲、北美、澳洲、亚洲、非洲发达国家具有代表性的网络资源采集项目,深入剖析其网络采集信息的服务特征(服务对象、服务方式、问题及策略等),介绍我国网络资源采集项目采取的服务形式,提出丰富信息发现与展示服务、提供个性化服... 调研欧洲、北美、澳洲、亚洲、非洲发达国家具有代表性的网络资源采集项目,深入剖析其网络采集信息的服务特征(服务对象、服务方式、问题及策略等),介绍我国网络资源采集项目采取的服务形式,提出丰富信息发现与展示服务、提供个性化服务和信息增值服务等建议,希望为我国的网络资源采集信息服务提供借鉴。 展开更多
关键词 网络资源采集 网页存档 应用与服务
原文传递
面向Web Archive的政府网站网页专题知识库构建研究 被引量:8
14
作者 黄新平 王洁 《图书馆学研究》 CSSCI 北大核心 2021年第15期64-70,共7页
基于文献与网络调研,对国内外关于Web Archive、专题知识库的研究现状进行梳理和分析,创新性地将专题知识库引入到政府网站网页长期保存研究中,在明确面向Web Archive的政府网站网页专题知识库的概念、特征与功能定位的基础上,构建相应... 基于文献与网络调研,对国内外关于Web Archive、专题知识库的研究现状进行梳理和分析,创新性地将专题知识库引入到政府网站网页长期保存研究中,在明确面向Web Archive的政府网站网页专题知识库的概念、特征与功能定位的基础上,构建相应的专题知识库,并以政府网站发布的“疫情防控”专题相关网页资源为例,分别从社会公众、科研机构、政府部门3类不同的用户群体,对所构建的专题知识库的应用场景进行案例描述,旨在为我国政府网站网页长期保存实践项目的建设提供参考。 展开更多
关键词 web archive 政府网站网页 专题知识库 知识服务
原文传递
欧盟FP7社交媒体信息长期保存项目比较与借鉴 被引量:7
15
作者 黄新平 《图书馆学研究》 CSSCI 北大核心 2019年第17期2-9,共8页
近年来,随着社交媒体的迅速发展与广泛应用,社交媒体信息长期保存的问题受到全球图书情报领域的广泛关注,欧美等一些发达国家陆续开始了相关实践探索,并涌现出一批有代表性的实践项目。文章基于文献和网络资源调研,对欧盟第七框架计划... 近年来,随着社交媒体的迅速发展与广泛应用,社交媒体信息长期保存的问题受到全球图书情报领域的广泛关注,欧美等一些发达国家陆续开始了相关实践探索,并涌现出一批有代表性的实践项目。文章基于文献和网络资源调研,对欧盟第七框架计划资助的LiWA、BlogFoever、ARCOMEM、ForgetIT 4个发展成熟的社交媒体信息长期保存项目实施情况进行系统梳理,并从项目内容、开发技术和实践应用三个维度对其进行比较分析,旨在为我国社交媒体信息长期保存项目的建设与应用提供借鉴。 展开更多
关键词 社交媒体长期保存 web archive 欧盟FP7
原文传递
面向Web Archive的社交媒体信息采集——基于ARCOMEM项目的案例分析 被引量:6
16
作者 张卫东 黄新平 《情报资料工作》 CSSCI 北大核心 2017年第1期94-99,共6页
文章通过对欧盟FP7框架下发展成熟且具有代表性的社交媒体信息采集与保存项目ARCOMEM采用的信息采集机制、采集标准、采集策略和采集方法等方面予以深入剖析,提出了建立多元的组织协作采集机制、制定科学规范的采集标准、运用多目标驱... 文章通过对欧盟FP7框架下发展成熟且具有代表性的社交媒体信息采集与保存项目ARCOMEM采用的信息采集机制、采集标准、采集策略和采集方法等方面予以深入剖析,提出了建立多元的组织协作采集机制、制定科学规范的采集标准、运用多目标驱动的采集策略、开发智能化的采集方法等建议,以期为我国社交媒体信息采集与保存的相关研究提供启示和借鉴。 展开更多
关键词 社交媒体 信息采集 web archive ARCOMEM 项目
原文传递
哈佛大学图书馆网络资源保存服务项目的研究和启示 被引量:6
17
作者 张耀蕾 《图书馆建设》 CSSCI 北大核心 2015年第1期88-93,共6页
哈佛大学图书馆于2006年开始启动网络资源保存服务项目,旨在长期保存有学术价值的网络资源。该项目的目标、流程、技术支持、知识产权、成果及服务的研究表明,目前网络资源保存项目的技术门槛已经降低、项目运作成熟化。我国高校图书馆... 哈佛大学图书馆于2006年开始启动网络资源保存服务项目,旨在长期保存有学术价值的网络资源。该项目的目标、流程、技术支持、知识产权、成果及服务的研究表明,目前网络资源保存项目的技术门槛已经降低、项目运作成熟化。我国高校图书馆可以借鉴哈佛大学图书馆,开展网络资源保存项目,保存中文学术性网络资源。 展开更多
关键词 哈佛大学图书馆 网络资源保存 网络资源保存服务项目
下载PDF
国外网络信息存档研究述评 被引量:6
18
作者 冯湘君 《情报资料工作》 CSSCI 北大核心 2014年第6期55-60,共6页
文章对以英文发表的具有代表性的国外网络信息存档研究成果进行综述,分析国外网络信息存档研究的主题、特点与未来趋势,并在此基础上总结了其对国内网络信息存档研究的若干启示。研究发现:国外网络信息存档研究主要是围绕网络信息存档... 文章对以英文发表的具有代表性的国外网络信息存档研究成果进行综述,分析国外网络信息存档研究的主题、特点与未来趋势,并在此基础上总结了其对国内网络信息存档研究的若干启示。研究发现:国外网络信息存档研究主要是围绕网络信息存档流程与环节以及存档项目评价与保障两个主题展开,具有细分网络信息类型与归档情景,研究重心由整体向局部、由前端向后端转移,研究成果以会议论文为主等特点;存档网络信息质量保障问题以及社交网络情境下与大数据环境下的网络信息存档问题将成为未来研究的焦点。 展开更多
关键词 网络信息存档 网络信息存档项目 存档网络信息质量 归档情境
原文传递
基于IIPC开源软件拓展构建国际重要科研机构Web存档系统 被引量:8
19
作者 吴振新 张智雄 +1 位作者 谢靖 胡吉颖 《现代图书情报技术》 CSSCI 2015年第4期1-9,共9页
【目的】构建国际重要科研机构Web存档系统。【方法】基于IIPC开源软件拓展采集存档框架,在采集端采用三层扩展策略,在采集客户端增加自动上传及报告等管理功能,开发WARC文件内容解析模块,利用Solr进行索引。【结果】在采集端实现三层扩... 【目的】构建国际重要科研机构Web存档系统。【方法】基于IIPC开源软件拓展采集存档框架,在采集端采用三层扩展策略,在采集客户端增加自动上传及报告等管理功能,开发WARC文件内容解析模块,利用Solr进行索引。【结果】在采集端实现三层扩展,通过增加采集客户端功能提高存档流程自动化程度,通过增加的WARC文件内容解析功能抽取更多信息,实现索引及检索服务的扩展。【局限】没有使用大规模采集存档进行检验。【结论】扩展后的采集存档框架初步具备分布式、可扩展、全自动化的特点。 展开更多
关键词 开源软件 网络信息存档 系统建设
原文传递
基于云存储的网页归档方案的研究 被引量:5
20
作者 徐飞 郑秋生 高艳霞 《计算机时代》 2017年第4期21-24,28,共5页
目前美国、加拿大和澳大利亚等国的Web Archive(网页归档)技术和方案比较多,有些也比较成熟,部分已经成功应用。在我国也有网页归档的应用,但对采用的技术方案和具体工具的研究很少。结合国外的网页归档技术和最新的云存储技术,提出了... 目前美国、加拿大和澳大利亚等国的Web Archive(网页归档)技术和方案比较多,有些也比较成熟,部分已经成功应用。在我国也有网页归档的应用,但对采用的技术方案和具体工具的研究很少。结合国外的网页归档技术和最新的云存储技术,提出了一种适合我国的网页归档和存储的技术方案。 展开更多
关键词 网页归档 云存储 web采集 HERITRIX
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部