期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
神经机器翻译中英语单词及其大小写联合预测模型 被引量:12
1
作者 张楠 李响 +1 位作者 靳晓宁 陈伟 《中文信息学报》 CSCD 北大核心 2019年第3期52-58,共7页
英文中单词有大小写之分,如果使用不规范,会降低语句的可读性,甚至造成语义上的根本变化。当前的机器翻译处理流程一般先翻译生成小写的英文译文,再采用独立的大小写恢复工具进行还原,这种方式步骤繁琐且没有考虑上下文信息。另一种方... 英文中单词有大小写之分,如果使用不规范,会降低语句的可读性,甚至造成语义上的根本变化。当前的机器翻译处理流程一般先翻译生成小写的英文译文,再采用独立的大小写恢复工具进行还原,这种方式步骤繁琐且没有考虑上下文信息。另一种方式是抽取包含大小写的词表,但这种方式扩大了词表,增加了模型参数。该文提出了一种在神经机器翻译训练中联合预测英语单词及其大小写属性的方法,在同一个解码器输出层分别预测单词及其大小写属性,预测大小写时充分考虑源端语料和目标端语料上下文信息。该方法不仅减小了词表的大小和模型参数,译文的质量也得到提升。在WMT 2017汉英新闻翻译任务测试集上,相比基线方法,该方法在大小写敏感和大小写不敏感两个评价指标上分别提高0.97BLEU和1.01BLEU,改善了神经机器翻译模型的性能。 展开更多
关键词 机器翻译 大小写恢复 联合预测
下载PDF
利用单语数据改进神经机器翻译压缩模型的翻译质量 被引量:10
2
作者 李响 刘洋 +1 位作者 陈伟 刘群 《中文信息学报》 CSCD 北大核心 2019年第7期46-55,共10页
该文提出利用一个大型且精度高的神经机器翻译模型(教师模型)从单语数据中提取隐性双语知识,从而改进小型且精度低的神经机器翻译模型(学生模型)的翻译质量。该文首先提出了'伪双语数据'的教学方法,利用教师模型翻译单语数据获... 该文提出利用一个大型且精度高的神经机器翻译模型(教师模型)从单语数据中提取隐性双语知识,从而改进小型且精度低的神经机器翻译模型(学生模型)的翻译质量。该文首先提出了'伪双语数据'的教学方法,利用教师模型翻译单语数据获得的合成双语数据改进学生模型,然后提出了'负对数似然—知识蒸馏联合优化'教学方法,除了利用合成双语数据,还利用教师模型获得的目标语言词语概率分布作为知识,从而在知识蒸馏框架下提高学生模型的翻译质量。实验证明,在中英和德英翻译任务上,使用该方法训练的学生模型不仅在领域内测试集上显著超过了基线学生模型,而且在领域外测试集上的泛化性能也得到了提高。 展开更多
关键词 神经机器翻译 知识蒸馏 单语数据
下载PDF
基于ARMv8架构的面向机器翻译的单精度浮点通用矩阵乘法优化 被引量:9
3
作者 龚鸣清 叶煌 +2 位作者 张鉴 卢兴敬 陈伟 《计算机应用》 CSCD 北大核心 2019年第6期1557-1562,共6页
针对使用ARM处理器的移动智能设备执行神经网络推理计算效率不高的问题,提出了一套基于ARMv8架构的单精度浮点通用矩阵乘法(SGEMM)算法优化方案。首先,确定ARMv8架构的处理器执行SGEMM算法的计算效率受限于向量化计算单元使用方案、指... 针对使用ARM处理器的移动智能设备执行神经网络推理计算效率不高的问题,提出了一套基于ARMv8架构的单精度浮点通用矩阵乘法(SGEMM)算法优化方案。首先,确定ARMv8架构的处理器执行SGEMM算法的计算效率受限于向量化计算单元使用方案、指令流水线和缓存未命中的发生概率;其次,针对三点导致计算效率受限的原因实现向量指令内联汇编、数据重排和数据预取三条优化技术;最后,根据语音方向的神经网络中常见的三种矩阵模式设计测试实验,实验中使用RK3399硬件平台运行程序。实验结果表示:方阵模式下单核计算速度为10.23 GFLOPS,达到实测浮点峰值的78.2%;在细长矩阵模式下单核计算速度为6.35 GFLOPS,达到实测浮点峰值的48.1%;在连续小矩阵模式下单核计算速度为2.53 GFLOPS,达到实测浮点峰值19.2%。将优化后的SGEMM算法部署到语音识别神经网络程序中,程序的实际语音识别速度取得了显著提高。 展开更多
关键词 ARMv8 单指令多数据流计算 基础线性代数子程序库 高性能计算
下载PDF
搜索引擎索引网页集合选取方法研究 被引量:9
4
作者 茹立云 李智超 马少平 《计算机研究与发展》 EI CSCD 北大核心 2014年第10期2239-2247,共9页
随着互联网的快速发展,网页数量呈现爆炸式增长,其中充斥着大量内容相似的或低质量的网页.对于搜索引擎来讲,索引这样的网页对于检索效果并没有显著作用,反而增加了搜索引擎索引和检索的负担.提出一种用于海量网页数据中构建搜索引擎的... 随着互联网的快速发展,网页数量呈现爆炸式增长,其中充斥着大量内容相似的或低质量的网页.对于搜索引擎来讲,索引这样的网页对于检索效果并没有显著作用,反而增加了搜索引擎索引和检索的负担.提出一种用于海量网页数据中构建搜索引擎的索引网页集合的网页选取算法.一方面使用基于内容签名的聚类算法对网页进行滤重,压缩索引集合的规模;另一方面融合了网页维度和用户维度的多种特征来保证索引集合的网页质量.相关实验表明,使用该选取算法得到的索引网页集合的规模只有整个网页集合的约1/3,并且能够覆盖绝大多数的用户点击,可以满足实际用户需求. 展开更多
关键词 搜索引擎 内容签名 文本聚类 机器学习 线性回归模型
下载PDF
北京协和医院外科老年患者术后静脉血栓栓塞症流行病学调查 被引量:5
5
作者 柳思华 赵清 +4 位作者 何鑫 王欣 杨煜清 徐庆 施举红 《中华老年多器官疾病杂志》 2021年第11期817-822,共6页
目的调查北京协和医院外科老年患者术后静脉血栓栓塞症(VTE)的流行病学资料,寻找老年患者术后发生VTE的危险因素。方法回顾性分析2016年5月至7月在北京协和医院接受手术的4819例患者的临床资料,收集患者的基本信息、术后及出院后3个月... 目的调查北京协和医院外科老年患者术后静脉血栓栓塞症(VTE)的流行病学资料,寻找老年患者术后发生VTE的危险因素。方法回顾性分析2016年5月至7月在北京协和医院接受手术的4819例患者的临床资料,收集患者的基本信息、术后及出院后3个月内症状性VTE的发生及预防情况。根据年龄将患者分为老年组(≥65岁,925例)和中青年组(<65岁,3894例),比较2组的VTE发生、预防情况以及发生VTE相关危险因素的差异。采用SPSS 26.0软件进行数据分析。根据数据类型,组间比较分别采用t检验、U检验、χ^(2)检验及方差分析。结果老年组和中青年组患者术后VTE的发病率分别为2.59%(24/925)、0.33%(13/3894),老年组VTE的发病风险约为中青年组的8倍(RR=7.952,95%CI 4.033~15.678;P<0.001)。神经外科老年患者的VTE发病率最高(16.67%,4/24),且显著高于其他科室(P=0.003)。老年组有19项危险因素占比显著高于中青年组(P<0.01),其中占比最多的前3项危险因素分别为大手术(>45 min)、恶性肿瘤和肥胖(体质量指数>25 kg/m^(2))。多因素logistic回归分析显示下肢肿胀、当前吸烟和手术时间>2 h是老年患者术后发生VTE的独立危险因素(P<0.05)。老年高危人群使用机械预防和药物预防的比例均高于中青年高危人群[51.42%(399/776)和39.21%(567/1446),P<0.001;31.44%(244/776)和20.95%(303/1446),P<0.001]。老年VTE患者中,有70.83%(17/24)发病前未接受药物预防,58.33%(14/24)仅接受机械预防仍发生症状性VTE。结论老年外科手术患者术后VTE发病率高于中青年患者,对于合并下肢肿胀、当前吸烟和手术时间>2h的老年患者应加强围手术期VTE药物预防。 展开更多
关键词 老年人 外科 静脉血栓栓塞症 发病率 危险因素 预防
下载PDF
面向科学计算云服务环境的数据中转传输 被引量:4
6
作者 刘玉环 王小宁 +2 位作者 肖海力 迟学斌 张阔 《科研信息化技术与应用》 2013年第5期42-50,共9页
在科学计算云服务环境中,出于安全和管理的角度考虑,客户端与计算节点间的数据传输需要经过多个中间服务器进行中转。为此,我们基于SFTP(Secure File Transfer Protocol)协议设计并实现了一个数据中转传输系统MCP,使用文件传输代理模式... 在科学计算云服务环境中,出于安全和管理的角度考虑,客户端与计算节点间的数据传输需要经过多个中间服务器进行中转。为此,我们基于SFTP(Secure File Transfer Protocol)协议设计并实现了一个数据中转传输系统MCP,使用文件传输代理模式进行不落地式中转,实现经多个中间节点的数据中转传输,保证了数据访问的合法性和传输的安全性,数据传输进度可控,并且方便对外提供数据中转传输接口。理论分析和实际测试表明,MCP传输时间少于使用SFTP进行的落地式数据中转传输。 展开更多
关键词 科学计算 云服务环境 数据中转传输 SFTP协议 文件传输代理
原文传递
双向GRU和自注意力机制下微博情感倾向性分析 被引量:3
7
作者 杨凡 薛佳奇 《智能计算机与应用》 2020年第4期193-198,共6页
针对微博文本内容的即时性、随意性、碎片性,本文提出将网络流行语词库、微博表情词词库、网络流行词词库加入到结巴分词词库中,以确保Word2vec模型对文本准确词向量化;针对上下文语义关联的微博文本特征以及双向长短期记忆网络(Bidirec... 针对微博文本内容的即时性、随意性、碎片性,本文提出将网络流行语词库、微博表情词词库、网络流行词词库加入到结巴分词词库中,以确保Word2vec模型对文本准确词向量化;针对上下文语义关联的微博文本特征以及双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)难收敛、训练时间长的问题,采用BiGRU(Bidirectional,Gated Recurrent Unit)神经网络学习微博文本的深层特征;针对当下流行的注意力机制(AttentionMechanism),调整情感词权重,但同时忽略微博内部序列关系的问题。该文使用自注意力机制(Self-Attention)综合微博文本内部关键特征对情感词进行定位,调整情感词的概率权重;然后用softmax函数进行分类。实验证明,本文方法比现有方法的准确率提高了5.34%。 展开更多
关键词 词库 结巴分词 BiGRU Self-Attention
下载PDF
基于经验模态分解的发动机故障诊断技术研究 被引量:2
8
作者 高秀才 李洁英 《内燃机与配件》 2020年第5期6-9,共4页
为及早发现发动机存在的不正常状态,有效判断故障类型,防止发生突发事故,提出了一种对运转条件下的发动机振动信号进行经验模态分解的发动机故障诊断方法,利用不同故障造成的分解子信号能量差异构造故障特征向量,对子信号能量占比按频... 为及早发现发动机存在的不正常状态,有效判断故障类型,防止发生突发事故,提出了一种对运转条件下的发动机振动信号进行经验模态分解的发动机故障诊断方法,利用不同故障造成的分解子信号能量差异构造故障特征向量,对子信号能量占比按频段进行归类,增加了相同故障类型的相似度和不同故障类型的区分度。 展开更多
关键词 发动机 故障 诊断 经验模态分解 能量 特征向量 归类
下载PDF
科技情报大数据挖掘与服务平台AMiner 被引量:1
9
作者 唐杰 李涓子 +5 位作者 张阔 张静 许斌 刘德兵 茹立云 张宇韬 《中国科技成果》 2018年第13期57-58,共2页
科技情报挖掘是情报学、文献学和计算机学科的共性核心技术。发展智能型科技情报分析技术已列入《国家中长期科学和技术发展规划纲要2010-2020年》,对建设世界科技强国具有深远的战略意义。当前,新一轮产业变革正在兴起,以科技创新... 科技情报挖掘是情报学、文献学和计算机学科的共性核心技术。发展智能型科技情报分析技术已列入《国家中长期科学和技术发展规划纲要2010-2020年》,对建设世界科技强国具有深远的战略意义。当前,新一轮产业变革正在兴起,以科技创新为核心的新技术革命深入推进,谁掌握了科技创新规律,谁就掌握了未来经济发展引擎。传统以文献服务和知识服务为标志的情报分析已不能满足“互联网+”环境下智能型科技情报分析的需求,亟需从基础理论到核心技术的自主创新,抢占国际竞争制高点,引领技术革命。 展开更多
关键词 科技情报 数据挖掘 服务平台 新技术革命 情报分析 科技创新 计算机学科 经济发展
原文传递
面向互联网应用的图像LBP算法GPU并行加速 被引量:1
10
作者 王香荣 高飞 +2 位作者 李钦 刘轶 张阔 《计算机工程与科学》 CSCD 北大核心 2013年第11期153-159,共7页
很多互联网应用需要进行海量的图片处理。LBP算法是一种图像纹理特征提取算法,广泛用于图像检索等领域,但该算法较为复杂,在处理互联网环境中的海量图片时面临着性能挑战。解决该问题的办法之一就是采用GPU对LBP算法进行并行加速,特别... 很多互联网应用需要进行海量的图片处理。LBP算法是一种图像纹理特征提取算法,广泛用于图像检索等领域,但该算法较为复杂,在处理互联网环境中的海量图片时面临着性能挑战。解决该问题的办法之一就是采用GPU对LBP算法进行并行加速,特别是针对海量图片处理设计加速方案,使GPU同时进行多幅图像LBP特征的并行提取,并采用异步传输方式使多幅图像数据的复制与Kernel函数的执行并行化。通过对GPU单幅和多幅图像并行处理的实验测试,并将实验数据与CPU程序性能进行对比分析,结果表明:对不同分辨率多幅图像并行处理的加速比可达58倍。 展开更多
关键词 GPU 局部二值模式 异步传输 互联网
下载PDF
基于卷积网络的概率离散事件系统错误诊断研究
11
作者 邓伟林 姜程 林森彬 《软件导刊》 2020年第8期10-13,共4页
在已知模型系统中,采用基于模型的方法可以较好解决概率离散事件系统错误诊断问题。然而在某些实际系统中,要得到完备的概率模型非常困难。关于不完备系统的诊断问题,业内主流解决方案是采用基于数据方法,如关键观察方法和关键树方法。... 在已知模型系统中,采用基于模型的方法可以较好解决概率离散事件系统错误诊断问题。然而在某些实际系统中,要得到完备的概率模型非常困难。关于不完备系统的诊断问题,业内主流解决方案是采用基于数据方法,如关键观察方法和关键树方法。卷积神经网络是一个非常好的数据拟合工具。因此,首先将错误诊断问题转化为文本分类问题,然后应用卷积神经网络求解该问题。仿真实验结果表明,在可诊断概率系统中,该方法在仿真数据集上的平均诊断准确率比关键树方法高出15%。 展开更多
关键词 概率离散事件系统 错误诊断 卷积神经网络
下载PDF
直线加速器粒子模拟可视化
12
作者 田东 张智磊 +3 位作者 单桂华 杨磊 齐记 张阔 《科研信息化技术与应用》 2013年第6期36-40,共5页
直线加速器被广泛应用于国防、能源、医疗等多个领域,加速器粒子模拟可视化是研究大规模高能粒子运动规律的重要方法。本文利用OpenGL和GLSL混合编程,给出了一套针对直线加速器粒子的科学模拟可视化与可视分析的方案,可清晰展示粒子在... 直线加速器被广泛应用于国防、能源、医疗等多个领域,加速器粒子模拟可视化是研究大规模高能粒子运动规律的重要方法。本文利用OpenGL和GLSL混合编程,给出了一套针对直线加速器粒子的科学模拟可视化与可视分析的方案,可清晰展示粒子在加速过程中的整体状态和运动趋势,体现出高速粒子的分类属性及其变化规律,为直线加速器的诊断分析提供了有效的工具。 展开更多
关键词 科学可视化 直线加速器 粒子 OPENGL GLSL
原文传递
基于Android平台的输入法皮肤系统设计与实现
13
作者 李玉娥 《信息与电脑(理论版)》 2014年第7期21-23,共3页
随着智能手机的不断发展,输入法的用户量与日俱增,智能手机用户年轻化,因此一款好的输入法在其功能性满足的基础上,漂亮绚丽的外观更能吸引眼球,故本文提出了在Android平台上一种可以高效,扩展性强的输入法皮肤系统设计。功能机时代每... 随着智能手机的不断发展,输入法的用户量与日俱增,智能手机用户年轻化,因此一款好的输入法在其功能性满足的基础上,漂亮绚丽的外观更能吸引眼球,故本文提出了在Android平台上一种可以高效,扩展性强的输入法皮肤系统设计。功能机时代每台手机都会内置输入法应用,用户的输入法界面千篇一律。进入智能机时代,随着移动互联网的用户群体的改变,绚丽多彩的输入法界面要随心情可以改变。 展开更多
关键词 Android 法界 智能机 键值 背景图片 配置文件 配置图 系统架构设计 TEMPLATE 性满
原文传递
信息化时代下的非物质文化遗产保护与传统文化传承研究
14
作者 刘晶 《河北画报》 2022年第8期4-6,共3页
非物质文化遗产与传统文化是我国重要的文化财产,对彰显民族活力与文化自信具有重要意义。随着时代的发展与科技进步,各种互联网信息技术手段不断渗透到非物质文化遗产保护与传统文化传承中,通过技术创新,能够有效推动非物质文化遗产保... 非物质文化遗产与传统文化是我国重要的文化财产,对彰显民族活力与文化自信具有重要意义。随着时代的发展与科技进步,各种互联网信息技术手段不断渗透到非物质文化遗产保护与传统文化传承中,通过技术创新,能够有效推动非物质文化遗产保护与传统文化传承工作水平的提升,同时,也使得全社会对非物质文化遗产和传统文化的传承与发展有了新的认识。本文主要对信息化时代如何运用各种信息技术手段保护非物质文化遗产并传承传统文化展开相关探讨。 展开更多
关键词 信息化 非物质文化遗产 传统文化 文化传承
下载PDF
以技术创新助力正能量传导
15
作者 王小川 《新闻战线》 2018年第10期52-54,共3页
新媒介生态下,如何认识技术与价值观的关系?科技怎样与传媒结合,助力主流媒体影响力提升和正能量传导?近年来,搜狗通过技术探索和创新,在形成内容多样化、生产高效化、报道形态创新化、用户体验多元化的传播生态方面不断取得新突破。
关键词 技术创新 传导 能量 媒体影响力 媒介生态 报道形态 传播生态 用户体验
原文传递
让民营企业在市场经济浪潮中大显身手
16
作者 陆一 刘永好 +1 位作者 尹同跃 王小川 《中国质量技术监督》 2018年第3期80-81,共2页
开场白:“构建亲清新型政商关系,健全企业家参与涉企政策制定机制。激发和保护企业家精神,增强企业家信心,让民营企业在市场经济浪潮中尽显身手。”2018年3月5日,国务院总理李克强作《政府工作报告》,“保护和激发企业家精神”在... 开场白:“构建亲清新型政商关系,健全企业家参与涉企政策制定机制。激发和保护企业家精神,增强企业家信心,让民营企业在市场经济浪潮中尽显身手。”2018年3月5日,国务院总理李克强作《政府工作报告》,“保护和激发企业家精神”在其中得以明确的表述。 展开更多
关键词 市场经济 民营企业 企业家精神 《政府工作报告》 大显 总理李 国务院 保护
下载PDF
谁有牛产品 谁就拥有话语权
17
作者 王冠雄 《中国商人》 2014年第6期18-19,共2页
这是一个互联网领域“明星换了经纪人”的故事,更是一场从自媒体出发,最后蜕变为社群商业的大冒险、大实验。
关键词 话语权 产品 经纪人 互联网 自媒体 明星 冒险
原文传递
向生命学习!
18
作者 王小川 《经理人》 2018年第3期16-17,共2页
搜狗根本不应生存下来,它活到现在是个世界型的案例。因为互联网世界里有两个铁律:赢者通吃,但搜狗的搜索比竞争对手晚了5年才出现;内部创业极难成功,但搜狗是一家从媒体公司里孵化出的技术公司,而不是独立团队。到底是什么方法... 搜狗根本不应生存下来,它活到现在是个世界型的案例。因为互联网世界里有两个铁律:赢者通吃,但搜狗的搜索比竞争对手晚了5年才出现;内部创业极难成功,但搜狗是一家从媒体公司里孵化出的技术公司,而不是独立团队。到底是什么方法帮助我们从不可能变成可能? 展开更多
关键词 学习 生命 竞争对手 内部创业 技术公司 媒体公司 互联网 世界
原文传递
企业与生命体
19
作者 王小川 《商界(评论)》 2018年第10期110-111,共2页
什么是生命?我在18年前读过—本书《复杂》,其中给出了一个优雅但是冷冰冰的定义:第一句话,性状相对稳定;第二句话,能够自我复制。性状相对稳定,就是一种存在感。生命为了保持存在,会通过新陈代谢等各种方法维持自己;生命能够... 什么是生命?我在18年前读过—本书《复杂》,其中给出了一个优雅但是冷冰冰的定义:第一句话,性状相对稳定;第二句话,能够自我复制。性状相对稳定,就是一种存在感。生命为了保持存在,会通过新陈代谢等各种方法维持自己;生命能够自我复制就是变成更多的存在。 展开更多
关键词 生命体 企业 相对稳定 新陈代谢 性状 复制
下载PDF
手机搜索是个大坑
20
作者 王小川 《中国企业家》 2013年第11期34-35,共2页
本期做客"变量"的是搜狗CEO王小川,如你所知,搜狗最近陷入了一段"绯闻",在此一个月前我们和王小川交流时,他曾谈到搜狗在"谁是敌人,谁是朋友"这个革命首要问题上是混乱的。另外,他还谈到了对移动互联网未来的看法,认为人将是互联... 本期做客"变量"的是搜狗CEO王小川,如你所知,搜狗最近陷入了一段"绯闻",在此一个月前我们和王小川交流时,他曾谈到搜狗在"谁是敌人,谁是朋友"这个革命首要问题上是混乱的。另外,他还谈到了对移动互联网未来的看法,认为人将是互联网的一部分。就像《黑客帝国》的情节,插根线在虚拟世界,拔了线就回到现实中来在产品层面,搜狗必须两线作战。其他巨头在PC端都已经稳定住自己的份额,手持大量现金,开始全力去做移动端,包括小米已经抡开了胳膊去做了。但搜狗PC端的仗还没有打完,发展无线同时要兼顾PC。虽然搜狗2010年才独立,但我们成长速度非常快。经过两年发展, 展开更多
关键词 移动互联网 搜索 手机 《黑客帝国》 2010年 虚拟世界 两线作战 成长速度
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部