期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
英汉双语句子级平行语料库自动构建 被引量:4
1
作者 王东波 苏新宁 《现代图书情报技术》 CSSCI 北大核心 2009年第12期47-51,共5页
探讨如何基于网络自动构建大规模英汉双语句子级平行语料库的问题,即确定抓取网站和制定相应的抓取底表;利用网络抓取工具Wget自动获取含有英汉双语句子对的网页;对从网页中提取出来的英汉双语句子对进行后续加工以及基于条件随机场对... 探讨如何基于网络自动构建大规模英汉双语句子级平行语料库的问题,即确定抓取网站和制定相应的抓取底表;利用网络抓取工具Wget自动获取含有英汉双语句子对的网页;对从网页中提取出来的英汉双语句子对进行后续加工以及基于条件随机场对汉语句子进行自动分词。最后从675308个网页中共获取1017963对英汉双语句子对并把句子对导入到数据库中完成英汉双语句子级平行语料库的构建。 展开更多
关键词 英汉平行语料库 wget 抓取底表 条件随机场
原文传递
基于服务器流量的网站监控系统研究 被引量:2
2
作者 郑林江 《信息安全与技术》 2013年第4期76-77,共2页
此系统通过wget.exe和zfc.exe等其它功能按时对需监控文件轮询一遍,实时地收集和监视数据信息,建立数据库,并以HTML文档方式显示及报警给管理用户。此系统通过测试,最终实现网站是否中断,网站流量和网站是否被修改主要功能,达到了预定要... 此系统通过wget.exe和zfc.exe等其它功能按时对需监控文件轮询一遍,实时地收集和监视数据信息,建立数据库,并以HTML文档方式显示及报警给管理用户。此系统通过测试,最终实现网站是否中断,网站流量和网站是否被修改主要功能,达到了预定要求,为管理员了解网站运行状态提供了参考。 展开更多
关键词 网站管理 实时监控 wget EXE 网站中断 网站修改 网站差异 数据包
下载PDF
一种高效的GNSS数据自动化下载方法的实现 被引量:2
3
作者 王丞 李磊 张铭彬 《全球定位系统》 CSCD 2018年第3期130-135,共6页
针对传统的GNSS数据下载方法存在无数据下载的登陆与登出这一缺点,对原始的数据下载方式进行了改进。改进的原理是,事先获取ftp存储路径下的文件名,然后再利用数据下载命令进行数据下载,这样可避免传统的数据下载方式的缺点,大大地提高... 针对传统的GNSS数据下载方法存在无数据下载的登陆与登出这一缺点,对原始的数据下载方式进行了改进。改进的原理是,事先获取ftp存储路径下的文件名,然后再利用数据下载命令进行数据下载,这样可避免传统的数据下载方式的缺点,大大地提高了数据的下载效率。实际测试的结果表明,改进的数据下载方式与传统的数据下载方式相比,下载IGS数据平均每小时可节约34min,下载MGEX的数据平均每小时可节约17min,改进的数据下载方法可有效提高数据下载效率。 展开更多
关键词 数据下载 wget mget 自动化
下载PDF
基于开源爬虫wget的网络资源自动获取技术研究 被引量:1
4
作者 许朝阳 刘俊民 +4 位作者 商杰 盖磊 刘琳琳 石建芳 许进 《核电子学与探测技术》 CAS CSCD 北大核心 2012年第12期1406-1408,共3页
在剖析开源爬虫wget这一获取网络资源工具功能的基础上,研究了网络资源自动获取技术,并以获取美国国家海洋和大气管理局网站网络资源为例介绍了自动获取过程。经过较长时间测试和实际应用,表明该自动获取技术方法切实可行。
关键词 开源爬虫 wget 网络资源 自动获取
下载PDF
大批量GNSS数据产品快速下载软件的设计与实现 被引量:1
5
作者 张熙 刘长建 +1 位作者 冯绪 章繁 《测绘科学与工程》 2018年第6期29-33,47,共6页
本文基于Qt编写了可实现大批量GNSS数据产品快速下载的软件。该软件采用多线程并行下载的思想,有效提高了数据下载速度;并通过检核机制确保无数据遗漏下载,单个文件下载完毕后即进行解压,下载任务结束后生成下载日志,用户可以查看每个... 本文基于Qt编写了可实现大批量GNSS数据产品快速下载的软件。该软件采用多线程并行下载的思想,有效提高了数据下载速度;并通过检核机制确保无数据遗漏下载,单个文件下载完毕后即进行解压,下载任务结束后生成下载日志,用户可以查看每个文件的文件名和所在ftp地址。通过与现有的开源程序包rkget对比,其下载速度提高10倍以上。经检验,该软件12分钟内可一次性成功下载1070份文件,验证了单次稳定下载1000份以上文件的可行性。 展开更多
关键词 IGS 数据产品 wget 多线程
下载PDF
Linux平台自动下载FTP服务器数据的实现
6
作者 聂林波 《电脑知识与技术》 2016年第10X期248-,255,共2页
针对Linux环境下自动下载FTP服务器数据文件需要,提出用shell脚本程序实现数据自动下载功能。该方法将Linux系统的crontab命令、date命令、shell脚本和wget软件有机结合实现FTP数据的自动下载。Linux系统能定时自动运行shell脚本调用wge... 针对Linux环境下自动下载FTP服务器数据文件需要,提出用shell脚本程序实现数据自动下载功能。该方法将Linux系统的crontab命令、date命令、shell脚本和wget软件有机结合实现FTP数据的自动下载。Linux系统能定时自动运行shell脚本调用wget软件自动下载数据文件。在Linux系统下灵活组合各种命令能够低成本实现复杂功能。 展开更多
关键词 Linux CRONTAB SHELL wget 定时 下载
下载PDF
英汉对照语言对自动获取
7
作者 王东波 谢靖 《图书情报工作》 CSSCI 北大核心 2010年第17期108-112,共5页
首先,在基于语料库统计和人工内省的语言知识基础上制定抓取底表,使用抓取工具Wget从网络上抓取含有英汉对照语言对的网页。其次,通过程序从抓取网页中提取英汉对照语言对,对获取的英汉对照语言对进行后续整理,如去重、格式转换等。最后... 首先,在基于语料库统计和人工内省的语言知识基础上制定抓取底表,使用抓取工具Wget从网络上抓取含有英汉对照语言对的网页。其次,通过程序从抓取网页中提取英汉对照语言对,对获取的英汉对照语言对进行后续整理,如去重、格式转换等。最后,把英汉对照语言对存入到数据库中。 展开更多
关键词 英汉对照语言对 wget 底表 MYSQL数据库
原文传递
利用WGET实现网络文献保存和发布的技术探讨 被引量:1
8
作者 魏大威 《国家图书馆学刊》 2004年第2期41-45,共5页
介绍网络信息保存方法 ,重点探讨如何利用WGET实现网站镜像 ,以及在站点镜像中所发现的问题和解决的办法。图 2。参考文献 7。
关键词 wget 网络文献 文献保存 文献发布 网站镜像 网页采集
下载PDF
一种面向Web的英汉平行语料库的构建方法 被引量:2
9
作者 徐润华 王东波 《金陵科技学院学报(社会科学版)》 2021年第4期51-56,共6页
随着自然语言处理领域各项研究的发展,平行语料库作为支撑自然语言处理技术的基础资源,发挥着越来越重要的作用。利用Web中的海量信息资源,采取信息抽取的方法,自动获取英汉双语平行语料资源。在获取过程中,首先确定抓取网站和制定词表... 随着自然语言处理领域各项研究的发展,平行语料库作为支撑自然语言处理技术的基础资源,发挥着越来越重要的作用。利用Web中的海量信息资源,采取信息抽取的方法,自动获取英汉双语平行语料资源。在获取过程中,首先确定抓取网站和制定词表,然后利用网络资源抓取工具GUN Wget自动获取网页中的英汉双语句子对资源,在对获得的平行句子对资源进行清洗和去重的基础上,利用条件随机场模型对汉语句子进行自动分词并导入数据库,最终完成大规模英汉双语平行语料库的构建。 展开更多
关键词 平行语料库 GUN wget软件 条件随机场 英汉双语 Web
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部