期刊文献+
共找到197篇文章
< 1 2 10 >
每页显示 20 50 100
融合实体类别信息的知识图谱表示学习 被引量:11
1
作者 金婧 万怀宇 林友芳 《计算机工程》 CAS CSCD 北大核心 2021年第4期77-83,共7页
知识图谱表示学习通过将实体和关系嵌入连续低维的语义空间中,获取实体和关系的语义关联信息。设计一种融合实体类别信息的类别增强知识图谱表示学习(CEKGRL)模型,构建基于结构与基于类别的实体表示,通过注意力机制捕获实体类别和三元... 知识图谱表示学习通过将实体和关系嵌入连续低维的语义空间中,获取实体和关系的语义关联信息。设计一种融合实体类别信息的类别增强知识图谱表示学习(CEKGRL)模型,构建基于结构与基于类别的实体表示,通过注意力机制捕获实体类别和三元组关系之间的潜在相关性,结合不同实体类别对于某种特定关系的重要程度及实体类别信息进行知识表示学习。在知识图谱补全和三元组分类任务中的实验结果表明,CEKGRL模型在MeanRank和Hit@10评估指标上均取得明显的性能提升,尤其在实体预测任务的Filter设置下相比TKRL模型约分别提升了23.5%和7.2个百分点,具有更好的知识表示学习性能。 展开更多
关键词 知识图谱 知识表示学习 多源信息融合 注意力机制 实体消歧
下载PDF
一种基于射频指纹的电力物联网设备身份识别方法 被引量:10
2
作者 刘铭 刘念 +3 位作者 韩晓艺 彭林宁 付华 陈一悰 《中国电力》 CSCD 北大核心 2021年第3期80-88,共9页
由于通信媒介的开放性,电力物联网设备的无线通信过程面临着信息安全风险。提出使用无线设备固有的射频指纹作为物联网设备身份识别的依据,并利用深度学习技术实现双向设备身份识别,以增强无线接入阶段的安全性。该方法采用边缘计算的思... 由于通信媒介的开放性,电力物联网设备的无线通信过程面临着信息安全风险。提出使用无线设备固有的射频指纹作为物联网设备身份识别的依据,并利用深度学习技术实现双向设备身份识别,以增强无线接入阶段的安全性。该方法采用边缘计算的思路,利用通信信道双向的互易性,将物联网终端设备需要完成的基站身份学习任务转移到基站处完成,降低了对于物联网设备算力、存储、能耗等方面的需求,适用于物联网应用场景。实验结果表明,该方法能够达到良好的设备身份识别性能。 展开更多
关键词 电力物联网 射频指纹 无线接入安全 信道互易 设备身份识别
下载PDF
基于多粒度时间注意力RNN的航班客座率预测 被引量:8
3
作者 邓玉婧 武志昊 林友芳 《计算机工程》 CAS CSCD 北大核心 2020年第1期294-301,共8页
准确预测航班客座率有利于处理航班机票超售、座位虚耗等问题,然而传统时间序列预测方法只关注航班近期每日客座率的变化特点,无法同时考虑其他因素的影响,预测效果不够理想。针对该问题,提出一种基于多粒度时间注意力机制的循环神经网... 准确预测航班客座率有利于处理航班机票超售、座位虚耗等问题,然而传统时间序列预测方法只关注航班近期每日客座率的变化特点,无法同时考虑其他因素的影响,预测效果不够理想。针对该问题,提出一种基于多粒度时间注意力机制的循环神经网络模型MTA-RNN。通过构建多级注意力机制获取航班客座率在不同时间粒度下的时序相关性,同时考虑航班自身属性及节假日等其他因素,得到未来一段时间内的目标航班客座率。在真实历史航班客座率数据集上的实验结果表明,MTA-RNN模型的预测准确率高于ARIMA模型、LSTM模型和Seq2seq模型。 展开更多
关键词 航班客座率预测 时间序列预测 循环神经网络 注意力机制 编解码器模型
下载PDF
基于自适应小波分解的时间序列分类方法 被引量:7
4
作者 梁小慧 郭晟楠 万怀宇 《计算机工程》 CAS CSCD 北大核心 2022年第4期81-88,98,共9页
时间序列分类即通过构建分类模型建模时间序列中的特征来实现对该时间序列的归类,是时间序列挖掘的重要研究分支。现有的时间序列分类方法多数从时域的角度对时间序列进行建模,忽视了时间序列中隐含的频域信息,而时间序列往往同时蕴含... 时间序列分类即通过构建分类模型建模时间序列中的特征来实现对该时间序列的归类,是时间序列挖掘的重要研究分支。现有的时间序列分类方法多数从时域的角度对时间序列进行建模,忽视了时间序列中隐含的频域信息,而时间序列往往同时蕴含着多种不同变化速率的变化模式,这些变化模式在时域上相互叠加,使得时间序列的变化规律变得比较复杂,因此仅从时域的角度进行建模,难以有效地从复杂的规律中捕获其蕴含的多种相对简单的规律。提出一种基于自适应多级小波分解的神经网络方法AMWDNet,使用自适应小波分解建模时间序列中的多级时频信息,自适应小波分解模块能够同时从时域和频域的角度出发,对时间序列中蕴含的多种变化模式进行有效分解,通过使用长短期时间模式提取模块分别建模时间序列中的长期和短期时间模式。选取时间序列分类任务中8个主流的方法作为基准方法,在UCR数据集仓库中的8个数据集上进行对比实验,结果表明,AMWDNet在其中的7个数据集上取得了最高的分类准确率,相比于次优的基准方法提升了0.1~2.2个百分点,整体分类性能优于MLP和FCN等基准方法。 展开更多
关键词 时间序列分类 自适应 小波分解 多分辨率分析 时频分析
下载PDF
基于计算的中药靶点预测研究探讨与实验分析 被引量:7
5
作者 孟志昌 周雪忠 +4 位作者 雷蕾 刘保延 张润顺 王映辉 谢琪 《世界科学技术-中医药现代化》 北大核心 2014年第11期2296-2303,共8页
鉴于药物微观作用具有的基本网络调控特性,网络药理学已经成为药物机理研究和新药研发的新思路。本文从计算方法的角度对网络药理学的核心研究内容之一:药物靶点关系及其预测的分析方法进行综述,在此基础上,总结了近年来药物靶点预测分... 鉴于药物微观作用具有的基本网络调控特性,网络药理学已经成为药物机理研究和新药研发的新思路。本文从计算方法的角度对网络药理学的核心研究内容之一:药物靶点关系及其预测的分析方法进行综述,在此基础上,总结了近年来药物靶点预测分析方法所遵循的一般原理和步骤。鉴于中药成分的多样性、药物的整体调控能力和高质量药理数据的缺乏等问题,中药面向靶点网络的调控机理研究具有更大难度。因此,本文还探讨了中药药物靶点预测分析研究的主要难点与研究趋势。最后,结合实际整合后的中药网络数据、化学结构相似性计算和链接预测方法,应用一种基于复杂网络的中药靶点预测分析方法进行了示范实验研究,并探讨中药靶点预测分析的重点研究方向。 展开更多
关键词 中药靶点预测 链接预测 复杂网络 综述 实验分析
下载PDF
基于手机信令数据的城市区域间交通流分析及可视化 被引量:6
6
作者 曹仲 李付琛 杨皓斐 《计算机与现代化》 2018年第3期116-121,126,共7页
近年来基于包含时间和空间信息的手机信令数据进行各类交通出行问题的研究日益成为一个热点。本文提出一种Spark和MongoDB相结合的技术方案对手机信令数据进行处理,并生成手机用户交通出行轨迹,然后进行城市区域间交通流的分析。以北京... 近年来基于包含时间和空间信息的手机信令数据进行各类交通出行问题的研究日益成为一个热点。本文提出一种Spark和MongoDB相结合的技术方案对手机信令数据进行处理,并生成手机用户交通出行轨迹,然后进行城市区域间交通流的分析。以北京市海淀行政区和三里屯商业区为例,分析区域间交通流量的吸引和发生关系,最后使用OpenLayers提供的JavaScript类库将研究结果进行可视化。 展开更多
关键词 手机信令数据 交通流 可视化
下载PDF
基于用户行为分析的在线订票系统缓存优化策略研究 被引量:5
7
作者 邱鹏 万怀宇 +2 位作者 林友芳 刘宇 姚一 《计算机与现代化》 2017年第5期92-98,共7页
随着互联网和移动终端技术的快速发展,越来越多的用户通过互联网渠道查询和订购机票。为了减轻大量用户访问给在线订票平台带来的巨大后台查询压力,对余票(即机票库存)和票价信息进行缓存逐渐成为各在线订票系统普遍采取的措施。缓存机... 随着互联网和移动终端技术的快速发展,越来越多的用户通过互联网渠道查询和订购机票。为了减轻大量用户访问给在线订票平台带来的巨大后台查询压力,对余票(即机票库存)和票价信息进行缓存逐渐成为各在线订票系统普遍采取的措施。缓存机制中的一个关键问题是如何设置查询关键字的缓存有效时间(TTL)。本文提出一种基于用户查询行为分析的缓存优化策略,通过大量用户的查询记录来挖掘机票的库存变化规律,预测库存变化时间间隔,从而动态地设置TTL。在某在线订票网站的真实查询行为数据集上进行了实验,表明本文提出的方法在保证查询结果准确率的同时,能够极大地提高缓存命中率。 展开更多
关键词 在线订票系统 用户行为分析 库存变化 缓存有效时间
下载PDF
求解资源受限项目调度问题的分支定价算法 被引量:4
8
作者 张宇哲 董兴业 周正 《计算机科学》 CSCD 北大核心 2022年第12期274-282,共9页
资源受限项目调度问题是最具代表性的一类项目调度问题,是很多实际调度问题的抽象表示,属于NP-hard问题,对于大规模问题难以求得全局最优解。文中提出了问题的整数规划模型,通过将模型分解为约束主问题和子问题设计了求解线性松弛模型... 资源受限项目调度问题是最具代表性的一类项目调度问题,是很多实际调度问题的抽象表示,属于NP-hard问题,对于大规模问题难以求得全局最优解。文中提出了问题的整数规划模型,通过将模型分解为约束主问题和子问题设计了求解线性松弛模型的列生成方法,然后通过分支定价寻找问题的整数解。在求解过程中引入松弛变量解决模型伪不可解的问题,设计了剪支策略和分支策略,并根据不同情况提出了两种缩小解空间的方法。在PSPLIB基准数据集上,对于有30个工序的问题,所提算法在10 m内能够求出480个问题中的301个问题的当前最优解;对于有60个工序的问题,在20 m内能够求出480个问题中的269个问题的当前最优解;对于有90个工序的问题,在30 m内能够求出480个问题中的263个问题的当前最优解。同时,算法使用缩小解空间策略后,超时算例的个数明显减少,优化初始解的性能得到明显提升。以上实验结果表明,所提算法具有较好的求解能力。 展开更多
关键词 资源受限项目调度 整数规划 列生成 分支定价 伪不可解
下载PDF
国际临床表型的本体研究概述及问题探讨 被引量:5
9
作者 刘林 周雪忠 +5 位作者 周霞继 张润顺 郭玉峰 王映辉 谢琪 刘保延 《世界科学技术-中医药现代化》 2015年第8期1634-1638,共5页
中医临床症状是辨证论治的主要依据,也是临床个体诊疗的重要数据。但是,中医临床数据应用中仍缺乏规范准确的症状术语本体。本文通过分析当前现代医学中与症状相关的临床表型本体研究及其数据现状,对现有临床表型本体进行了分类整理和介... 中医临床症状是辨证论治的主要依据,也是临床个体诊疗的重要数据。但是,中医临床数据应用中仍缺乏规范准确的症状术语本体。本文通过分析当前现代医学中与症状相关的临床表型本体研究及其数据现状,对现有临床表型本体进行了分类整理和介绍,并探讨了其存在的问题。在此基础上,阐述了围绕"症状"收集并整理相关数据,形成以症状为主涵盖疾病、基因、药物、化学成分、副作用等不同节点的数据网络,构建以症状为核心的中医临床表型集成本体的重要性及其思路。我们认为构建以症状为核心的中医临床表型集成本体,有助于进行中医个体诊疗和精准医疗研究,是进行个体化大数据分析的关键基础工作之一,亟待推进。 展开更多
关键词 中医临床症状 个体诊疗 精准医疗 中医临床表型 集成本体
下载PDF
本体对齐技术概述及其在中医领域的应用探讨 被引量:5
10
作者 郝伟学 于剑 周雪忠 《世界科学技术-中医药现代化》 CSCD 2017年第1期63-69,共7页
本体对齐技术是实现不同来源本体概念和关系整合的知识工程方法,鉴于相同范围的本体(如疾病本体)往往由多个不同领域或机构的研究人员各自独立研发,其术语表述和概念关系都存在较大差异。因此,如何通过对齐处理以实现多源本体的整合成... 本体对齐技术是实现不同来源本体概念和关系整合的知识工程方法,鉴于相同范围的本体(如疾病本体)往往由多个不同领域或机构的研究人员各自独立研发,其术语表述和概念关系都存在较大差异。因此,如何通过对齐处理以实现多源本体的整合成为重要的方法学问题。本文就本体对齐的概念、技术、方法及其相应的工具进行了详细阐述。重点阐述了基于语言学特征的和基于结构特征的本体对齐技术。结合国际上两个实际疾病本体:Disease Ontology和Orphanet,采用本体对齐技术进行了实验及分析,并详述对齐技术的应用问题。针对中医领域本体库研发中也存在的多源性问题,进一步探讨本体对齐应用的必要性和应用前景。 展开更多
关键词 本体对齐 本体预处理 相似性计算 疾病本体 中医本体对齐应用
下载PDF
一种基于灰度值矩阵的文档复原方法研究 被引量:4
11
作者 刘宪国 贾子钰 +1 位作者 刘万军 韩敏 《计算机应用研究》 CSCD 北大核心 2016年第12期3901-3904,3908,共5页
对于切碎英文文档自动拼接还原中无法利用碎纸片几何形状特征的问题,提出一种基于灰度值矩阵的文档碎片拼接方法。利用碎片图像的特征向量消除同行字母处于不同高度的负影响,提取其特征位置作为动态聚类的分类标准,依据文本行特征进行... 对于切碎英文文档自动拼接还原中无法利用碎纸片几何形状特征的问题,提出一种基于灰度值矩阵的文档碎片拼接方法。利用碎片图像的特征向量消除同行字母处于不同高度的负影响,提取其特征位置作为动态聚类的分类标准,依据文本行特征进行动态聚类和类间排序,设计了一种基于原图像碎片边界矩阵的四邻拼接算法进行逐一高效地拼接还原。仿真结果表明,该方法准确率较高且操作简便,对规则碎片拼接还原具有良好的实际意义。 展开更多
关键词 文档碎片拼接 二值图像 特征位置 动态聚类 四邻拼接算法
下载PDF
结合实体共现信息与句子语义特征的关系抽取方法 被引量:4
12
作者 马语丹 赵义 +1 位作者 金婧 万怀宇 《中国科学:信息科学》 CSCD 北大核心 2018年第11期1533-1545,共13页
实体关系抽取是信息抽取领域的重要任务之一,也是知识图谱构建的一个关键环节.现有的关系抽取方法大多都是围绕实体对从句子中抽取上下文语义特征,然后进行关系分类,这忽略了实体在整个语料集中的全局上下文特征.本文提出了一种新颖的... 实体关系抽取是信息抽取领域的重要任务之一,也是知识图谱构建的一个关键环节.现有的关系抽取方法大多都是围绕实体对从句子中抽取上下文语义特征,然后进行关系分类,这忽略了实体在整个语料集中的全局上下文特征.本文提出了一种新颖的结合实体共现信息与句子语义信息的神经网络(CNSSNN)模型,用于实体关系抽取.该模型首先构造整个语料集蕴含的实体共现关系网络,并通过引入注意力机制有侧重地提取实体的网络环境信息,从而为各个实体生成语料级全局上下文特征,同时利用双向门控循环单元网络(bi-GRU)为实体对提取句子级上下文语义特征,最后将语料级特征和句子级特征结合起来,进行实体关系抽取.在公开数据集和人工标注的数据集上的实验结果表明,本文提出的方法其准确率和召回率要明显优于其他现有方法. 展开更多
关键词 信息抽取 实体关系抽取 实体共现网络 注意力机制 门控循环单元
原文传递
结合事件链与事理图谱的脚本事件预测模型 被引量:3
13
作者 孙盼 王琪 万怀宇 《计算机工程》 CAS CSCD 北大核心 2022年第4期119-125,共7页
现有脚本事件预测模型在事件表示时未充分考虑各个元素之间的相关性,且不能同时利用事件链和事理图谱中的信息进行事件预测。针对事件表示不全面和信息融合不充分的问题,提出一种结合事件链和事理图谱的脚本事件预测模型ECGNet。将每个... 现有脚本事件预测模型在事件表示时未充分考虑各个元素之间的相关性,且不能同时利用事件链和事理图谱中的信息进行事件预测。针对事件表示不全面和信息融合不充分的问题,提出一种结合事件链和事理图谱的脚本事件预测模型ECGNet。将每个事件的各个元素构造成一个短句,使用Transformer编码器捕获元素之间的序列信息,从而获得更准确的事件表示。在此基础上,构建一个长程时序模块(LRTO)学习事件链中的时序信息,同时构建一个全局事件演化模块(GEEP)捕获隐藏在事理图谱中的演化模式,通过门控注意力机制动态融合时序信息和演化模式进行脚本事件预测。基于纽约时报和新浪新闻两个数据集的实验结果表明,ECGNet能够有效融合事件链和事理图谱的信息进行脚本事件预测,与PMI、Bigram、SAM-Net、SGNN等模型相比,其准确率较最优值取得了3%以上的提升。 展开更多
关键词 脚本事件预测 事件表示 事件链 事理图谱 注意力机制
下载PDF
基于Seq2Seq模型的港口进出口货物量预测 被引量:3
14
作者 王涛 张伟 +2 位作者 贾宇欣 林友芳 万怀宇 《计算机系统应用》 2020年第3期132-139,共8页
港口进出口货物吞吐量是反映港口业务状况的重要指标,其准确预测将给港口经营管理人员进行决策提供重要的依据.利用机器翻译领域的Seq2Seq模型,对影响港口进出货物量的多种因素进行建模.Seq2Seq模型可以反映进出口货物量在时间维度上的... 港口进出口货物吞吐量是反映港口业务状况的重要指标,其准确预测将给港口经营管理人员进行决策提供重要的依据.利用机器翻译领域的Seq2Seq模型,对影响港口进出货物量的多种因素进行建模.Seq2Seq模型可以反映进出口货物量在时间维度上的变化规律,并且可以刻画天气、节假日等外部因素的影响,从而进行精准预测.Seq2Seq模型包含两个由循环神经网络(LSTM)组成的编码器和解码器,能够捕捉长短期时间范围内集装箱变化趋势,可以根据历史进出口货物量预测未来一段时间的货物量信息.在真实的天津港进出口集装箱数据集上进行了实验,结果表明Seq2Seq模型的深度学习预测方法效果优于传统的时间序列模型以及其他现有的机器学习预测模型. 展开更多
关键词 进出口货物量 Seq2Seq 深度学习 时间序列
下载PDF
基于图像语义分割的半监督裂纹检测方法 被引量:3
15
作者 刘培 黄雅平 《激光与光电子学进展》 CSCD 北大核心 2021年第6期309-320,共12页
基于深度学习的裂纹检测方法严重依赖大量的像素级标注信息,为此提出一种基于半监督学习的裂纹检测方法。该方法将多尺度模块引入到裂纹检测的网络模型中,仅利用小部分的像素级标注数据进行全监督训练。对于无标签数据,融合多种显著性... 基于深度学习的裂纹检测方法严重依赖大量的像素级标注信息,为此提出一种基于半监督学习的裂纹检测方法。该方法将多尺度模块引入到裂纹检测的网络模型中,仅利用小部分的像素级标注数据进行全监督训练。对于无标签数据,融合多种显著性区域检测方法生成伪标签,可以减少对像素级标注信息的依赖。在裂纹数据集上对改进网络进行实验验证,并与常用语义分割网络和弱监督实验基准从主观评价、精度、召回率和F1-score的角度进行比较。实验结果表明,改进网络可以有效提升裂纹的识别准确率,提出的半监督训练策略在仅需6.25%像素级标注信息的情况下,能够取得与全监督方法相当的识别精度和召回率。 展开更多
关键词 机器视觉 裂纹检测 语义分割 多尺度模块 半监督
原文传递
基于帕累托效应视角下的推荐系统多角度公平性 被引量:2
16
作者 杜清月 黄晓雯 桑基韬 《太原理工大学学报》 CAS 北大核心 2022年第1期89-97,共9页
提出了一种从帕累托视角解决推荐系统多角度公平性的方法,通过对抗正则化器消除用户嵌入中的敏感属性信息,采用基于曝光的负采样策略提高推荐系统的准确率,从而达到帕累托最优。并且,基于曝光的负采样策略在一定程度上解决物品曝光偏差... 提出了一种从帕累托视角解决推荐系统多角度公平性的方法,通过对抗正则化器消除用户嵌入中的敏感属性信息,采用基于曝光的负采样策略提高推荐系统的准确率,从而达到帕累托最优。并且,基于曝光的负采样策略在一定程度上解决物品曝光偏差的问题,保证了物品角度公平性,实现了用户、物品的多角度公平性。实验结果表明,该方法在保证推荐准确率的同时有效提高了用户和物品角度的公平性。 展开更多
关键词 推荐系统公平性 多角度公平性 帕累托效应 对抗学习 负采样
下载PDF
基于手机大数据的动态人口感知 被引量:3
17
作者 杨皓斐 曹仲 李付琛 《计算机系统应用》 2018年第5期73-79,共7页
随着通信市场迅速发展和手机的高普及率,利用手机数据研究人类活动和城市规划发展成为可能.本文主要工作是构建了大数据实时处理分析平台,并基于此平台提出了一种利用手机数据感知城市人口分布的方法.通过实验表明,基于手机数据的动态... 随着通信市场迅速发展和手机的高普及率,利用手机数据研究人类活动和城市规划发展成为可能.本文主要工作是构建了大数据实时处理分析平台,并基于此平台提出了一种利用手机数据感知城市人口分布的方法.通过实验表明,基于手机数据的动态人口感知能够反映实际城市人口分布,对于城市交通监管、公共资源配置优化等方面具有重要意义. 展开更多
关键词 手机数据 大数据 人口感知 城市规划 位置服务
下载PDF
基于RFID的分布式工具监管系统设计与实现 被引量:2
18
作者 张天壮 刘铭 程慈航 《物联网技术》 2022年第11期4-8,共5页
随着工业化进程的不断推进,大量的基础设施、生产环境、高端装备需要越来越精细化的维护。在日常维护作业中,需要对现场中涉及的设备或工具进行实时监管,以提高工作效率、保证作业安全。利用RFID技术可以实现对一定空间范围内的电子标... 随着工业化进程的不断推进,大量的基础设施、生产环境、高端装备需要越来越精细化的维护。在日常维护作业中,需要对现场中涉及的设备或工具进行实时监管,以提高工作效率、保证作业安全。利用RFID技术可以实现对一定空间范围内的电子标签进行自动清点。以高铁检修的实际需求为背景,设计并实现了一种基于RFID技术的作业现场工具智能监管系统。通过在移动终端上开发了一套监管程序,使得移动终端连接多个RFID阅读器,实现一个分布式的RFID电子标签清点环境,具有很高的部署自由度。利用RFID射频读写器周期性地清点与被监管设备或工具绑定的电子标签,当一定时间内查询不到电子标签时则发出警报,提示作业人员注意查找遗失的工具。使用该监管系统能够在检修作业中实时监管工具的状态,及时发现工具遗失情况,有效提升作业安全和效率。 展开更多
关键词 RFID ANDROID 智能监管 遗失告警 分布式部署 检修工具 高铁检修
下载PDF
利用颜色进行层次模式挖掘的图像分类方法 被引量:2
19
作者 朱杰 超木日力格 +1 位作者 谢博鋆 于剑 《计算机科学与探索》 CSCD 北大核心 2017年第3期396-405,共10页
图像的中间层特征挖掘能够发现不同视觉词之间的关系,然后可以利用挖掘得到的模式代替原有的视觉词进行图像表示。目前大部分的中层特征挖掘都是针对所有图像块进行的,而没有考虑到可以在局部进行模式挖掘。在局部进行模式挖掘有利于发... 图像的中间层特征挖掘能够发现不同视觉词之间的关系,然后可以利用挖掘得到的模式代替原有的视觉词进行图像表示。目前大部分的中层特征挖掘都是针对所有图像块进行的,而没有考虑到可以在局部进行模式挖掘。在局部进行模式挖掘有利于发现不同对象区域的模式,并且最终提高图像分类的准确率。提出了一种有效的基于颜色的层次模式挖掘方法。该方法把对有判别力的颜色的判断作为划分层次的标准,然后在每一层中对拥有这些颜色的图像块进行挖掘,最后用挖掘到的模式进行图像表示,并用于图像分类。实验结果表明,所提方法能够在Soccer、Flower 17和Flower 102上取得良好的分类效果。 展开更多
关键词 有判别力的颜色选择 中间层特征挖掘 模式 分类
下载PDF
深度生成式模型在临床术语标准化中的应用 被引量:2
20
作者 闫璟辉 向露 +3 位作者 周玉 孙建 陈思 薛晨 《中文信息学报》 CSCD 北大核心 2021年第5期77-85,共9页
临床术语标准化任务是医学统计中不可或缺的一部分。在实际应用中,一个标准的临床术语可能有数种口语化和非标准化的描述,而对于一些应用例如临床知识库的构建而言,如何将这些描述进行标准化是必须要面对的问题。该文主要关注中文临床... 临床术语标准化任务是医学统计中不可或缺的一部分。在实际应用中,一个标准的临床术语可能有数种口语化和非标准化的描述,而对于一些应用例如临床知识库的构建而言,如何将这些描述进行标准化是必须要面对的问题。该文主要关注中文临床术语的标准化任务,即将非标准的中文临床术语的描述文本和给定的临床术语库中的标准词进行对应。尽管一些深度判别式模型在简单文本结构的医疗术语,例如,疾病、药品名等的标准化任务上取得了一定成效,但对于中文临床术语标准化任务而言,其带标准化的描述文本中经常包含的信息缺失、"一对多"等情况,仅依靠判别式模型无法得到完整的语义信息,因而导致模型效果欠佳。该文将临床术语标准化任务类比为翻译任务,引入深度生成式模型对描述文本的核心语义进行生成并得到标准词候选集,再利用基于BERT的语义相似度算法对候选集进行重排序得到最终标准词。该方法在第五届中国健康信息处理会议(CHIP2019)评测数据中进行了实验并取得了很好的效果。 展开更多
关键词 术语标准化 核心语义 生成式模型
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部