期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于大数据平台的企业画像研究综述 被引量:33
1
作者 田娟 朱定局 杨文翰 《计算机科学》 CSCD 北大核心 2018年第B11期58-62,共5页
随着国民经济的发展,企业的数量不断增加。基于企业运营时产生的海量数据,可以利用大数据技术结合企业画像的理论来对企业进行全面分析,为企业成长、行业发展、政府监管等各方面提供可靠的数据分析。文中首先对当前国内外企业画像构建... 随着国民经济的发展,企业的数量不断增加。基于企业运营时产生的海量数据,可以利用大数据技术结合企业画像的理论来对企业进行全面分析,为企业成长、行业发展、政府监管等各方面提供可靠的数据分析。文中首先对当前国内外企业画像构建及其技术进行总结和分析,构建了基于大数据平台的企业画像标签体系模型和建模框架;然后根据企业数据的特点,结合比较热门的用户画像技术,提出了几种处理企业的数据方法;最后提出使用大数据技术处理企业数据时值得讨论的几个问题。 展开更多
关键词 企业画像 大数据技术 特征分析 标签提取
下载PDF
基于聚类的电网低压台区用电画像方法研究 被引量:19
2
作者 时珊珊 田英杰 +4 位作者 金瑞杨 张灏宇 袁志昌 宋洁 苏运 《电工电能新技术》 CSCD 北大核心 2020年第8期66-74,共9页
对用电对象进行用电特征分析在电力系统的电力调度、负荷预测、安全性评估等方面具有重要意义。目前的用电特征分析多集中在对用户用电画像方法的研究。低压台区是电网用电中的重要维度,对低压台区进行用电特征分析同样不可或缺。台区... 对用电对象进行用电特征分析在电力系统的电力调度、负荷预测、安全性评估等方面具有重要意义。目前的用电特征分析多集中在对用户用电画像方法的研究。低压台区是电网用电中的重要维度,对低压台区进行用电特征分析同样不可或缺。台区用电画像可以帮助电网快速准确地把握台区的负荷特性和用电模式,对挖掘台区用电数据信息并对不同的业务场景进行指导具有重要意义。本文针对台区日冻结量和96点功率数据,提出了台区用电特征标签提取方法并形成标签系统,然后基于聚类技术对获得的台区标签进行聚类分析得到台区画像。最后,本文基于上海市181个台区的用电数据进行案例分析,得到台区用电标签和画像。 展开更多
关键词 台区画像 标签提取 用电特征 聚类分析
下载PDF
基于特征分析和标签提取的医生画像构建研究 被引量:13
3
作者 唐晓波 高和璇 《情报科学》 CSSCI 北大核心 2020年第5期3-10,共8页
【目的/意义】医生同时兼具提供医疗服务的社会工作者和从事科学研究的科研工作者双重身份,因而需要从更全面、立体的角度组织管理和利用互联网中多源的医生数据用来构建医生画像,对于患者寻求医疗救助、提高健康服务质量具有重要作用... 【目的/意义】医生同时兼具提供医疗服务的社会工作者和从事科学研究的科研工作者双重身份,因而需要从更全面、立体的角度组织管理和利用互联网中多源的医生数据用来构建医生画像,对于患者寻求医疗救助、提高健康服务质量具有重要作用。【方法/过程】在提出医生画像概念的基础上,以医院官网、百科类网站、文献数据库、在线健康社区等数据源为基础,提出基于特征分析和标签提取的医生画像构建模型,分别从医生的人口统计属性、简介特长、科研成果、科研合作、患者在线评价五个方面构建医生画像,最后在此基础上进行实证研究,以可视化的方式展示医生画像。【结果/结论】基于特征分析和标签提取的医生画像构建模型能够全面描述医生信息并将其以更加直观的形式展示出来,从而推动为患者提供个性化的健康服务和精准的医生推荐等研究的发展。 展开更多
关键词 医生画像 在线健康社区 特征分析 标签提取
原文传递
基于自然语言处理的医学实体识别与标签提取 被引量:10
4
作者 赵君珂 张振宇 蔡开裕 《计算机技术与发展》 2019年第9期18-23,共6页
随着信息化建设的快速发展,数据产生了爆炸式的增长,医院每天也同样产生大量的医疗记录与数据。其中大部分内容是非结构化数据,具有真实性、主观性和不规范性,不利于解读和处理。由于医疗数据是以非结构化的文本形式存储的,因此无法直... 随着信息化建设的快速发展,数据产生了爆炸式的增长,医院每天也同样产生大量的医疗记录与数据。其中大部分内容是非结构化数据,具有真实性、主观性和不规范性,不利于解读和处理。由于医疗数据是以非结构化的文本形式存储的,因此无法直接通过计算机直接处理和分析,不仅效率低下,分析质量也无法保证。目前的信息抽取研究中使用的方法的可扩展性都较差,具有一些局限性,故自动化程度不高。文中通过自然语言处理中的规则描述语言方法,对数据中非结构化的医学命名实体进行识别,并通过语义分析进行标签提取,使非结构化的数据结构化,让数据中的描述更为准确、统一。优化了目前信息抽取方法中存在的可扩展性差的缺点,能够根据情况适应不同的情景。 展开更多
关键词 自然语言处理 医学数据 非结构化 实体识别 标签提取
下载PDF
用户画像技术与其在农业领域应用研究进展 被引量:6
5
作者 冯建英 王博 +2 位作者 吴丹丹 穆维松 田东 《农业机械学报》 EI CAS CSCD 北大核心 2021年第S01期385-395,共11页
作为一种能够精准分析用户特征、描绘用户行为的数据分析工具,用户画像技术近年来受到广泛关注。本文首先阐述了用户画像的基本概念和特征,综述了用户画像构建关键技术的国内外研究进展,并分析比较了不同技术的特性和优缺点。然后对用... 作为一种能够精准分析用户特征、描绘用户行为的数据分析工具,用户画像技术近年来受到广泛关注。本文首先阐述了用户画像的基本概念和特征,综述了用户画像构建关键技术的国内外研究进展,并分析比较了不同技术的特性和优缺点。然后对用户画像技术在农业领域中的应用研究进行了系统分析,包括农户特征描述、农业服务的个性化推荐、农产品精准营销和农业经营管理决策支持等多方面。最后,总结了当前用户画像技术存在的问题,并对未来研究的趋势及用户画像技术在农业领域的应用前景进行了展望。 展开更多
关键词 用户画像 农业大数据 标签提取 画像构建 画像应用
下载PDF
基于融合LSTM的电力工程标签提取与识别算法设计
6
作者 张艳 《电子设计工程》 2024年第16期125-129,共5页
为提升电力工程的项目管控效率,文中对工程的业务特性进行了梳理,并采用机器学习领域中有监督算法建立了一套多维度、多层级的标签体系。在对长短期记忆网络(LSTM)和条件概率随机场模型(CRF)进行分析的基础上将二者相结合,利用LSTM在信... 为提升电力工程的项目管控效率,文中对工程的业务特性进行了梳理,并采用机器学习领域中有监督算法建立了一套多维度、多层级的标签体系。在对长短期记忆网络(LSTM)和条件概率随机场模型(CRF)进行分析的基础上将二者相结合,利用LSTM在信息流控制上的优势,使用CRF进行句子信息标注,进而得到了LSTM-CRF网络。同时,为进一步提升网络对于上下文语句环境的特征挖掘力度,还引入了一种双向Bi-LSTM结构。通过在Bi-LSTM的CRF与特征矩阵层之间加入注意力转移机制,以获得融合的Bi-LSTM模型,从而保证了网络在局部信息提取时的效率。对现有的电力工程数据进行人工分词及标注,得到了标签提取的数据集。对模型进行训练测试的结果表明,所提算法较现有的Bi-LSTM-CRF网络性能有了显著改善,且准确率、召回率以及F1值分别提升了3.82%、3.72%和3.74%。 展开更多
关键词 自然语言处理 标签提取 项目管理 LSTM NER
下载PDF
改进的TFIDF标签提取算法 被引量:4
7
作者 王杰 李旭健 《软件工程》 2018年第2期4-6,共3页
TFIDF算法作为一种加权算法,在信息检索和数据挖掘等自然语言处理领域发挥了巨大的作用。它的计算模型相对简单,适合大数据并行计算,适用领域广泛,且拥有很好的解释性。基于以上这些特点,本文在TFIDF算法基础之上,利用监督的学习,并通... TFIDF算法作为一种加权算法,在信息检索和数据挖掘等自然语言处理领域发挥了巨大的作用。它的计算模型相对简单,适合大数据并行计算,适用领域广泛,且拥有很好的解释性。基于以上这些特点,本文在TFIDF算法基础之上,利用监督的学习,并通过引入加权因子和词贡献度,来修正TFIDF算法结果权值。利用这个算法可以在自然语言处理中有效地提取特征标签,并且改进后的算法在这一细分领域具有极高准确度。 展开更多
关键词 自然语言处理 TFIDF 词加权算法 标签提取 监督学习
下载PDF
融合领域知识的药店用户画像建模及应用
8
作者 杨雨晨 李涛 +1 位作者 谢君臣 常远 《计算机系统应用》 2023年第6期99-106,共8页
用户画像是对用户形象的勾勒与描述,现已广泛应用于睡眠会员唤醒,用户到店预测,个性化推荐等典型零售场景,药品不同于普通商品,包含较强的语义知识,现有用户画像主要从消费属性和静态属性出发,不能完全适用于药店销售和预测领域.本文提... 用户画像是对用户形象的勾勒与描述,现已广泛应用于睡眠会员唤醒,用户到店预测,个性化推荐等典型零售场景,药品不同于普通商品,包含较强的语义知识,现有用户画像主要从消费属性和静态属性出发,不能完全适用于药店销售和预测领域.本文提出了一种针对药品领域的用户画像模型UPP (persona of pharmacy user),在现有画像的基础上嵌入医药知识,利用规则,聚类,统计,实体识别等方法提取慢病、疾病、特殊病类、活动敏感度、用户价值、价格偏好等新标签.将所有标签融入一种基于聚类的群体划分方法,形成用户画像.实验表明,该模型相较于现有的用户画像模型,在消费行为预测场景下精准率提高了13%,更加适用于药店营销场景. 展开更多
关键词 用户画像 群体划分 聚类 标签提取 语义树
下载PDF
基于深层标签和K-Means++算法的电力用户画像研究 被引量:1
9
作者 汪波 刘沙 郑稳 《鞍山师范学院学报》 2022年第6期43-48,共6页
以电力用户的基础属性、电力公司业务办理系统数据以及95598工单数据为基础数据源,经过数据预处理后,采用自然语言处理的方法对用户咨询内容进行标签提取,建立用户画像标签库,进而提出基于深层标签和K-Means++算法的电力用户画像方法.... 以电力用户的基础属性、电力公司业务办理系统数据以及95598工单数据为基础数据源,经过数据预处理后,采用自然语言处理的方法对用户咨询内容进行标签提取,建立用户画像标签库,进而提出基于深层标签和K-Means++算法的电力用户画像方法.实验结果表明,相比现有相关研究方法,构建的用户标签覆盖率较高、用户画像细粒度较高,F1值高达95.7%,更适合电力营业厅差异化服务客户. 展开更多
关键词 用户画像 标签提取 聚类算法 电力用户
下载PDF
一种有效的标签抽取和匹配方法
10
作者 邹显春 吴春明 李盛瑜 《计算机科学》 CSCD 北大核心 2012年第5期208-212,共5页
标签抽取和匹配是查询接口理解的重要组成部分。提出了一种基于视觉的标签抽取和匹配方法,深入分析了相关匹配因子,给出了一种对查询接口表单进行重构的方法,它能依据接口HTML源代码自动还原出该表单的视觉布局特征。在最终的匹配算法中... 标签抽取和匹配是查询接口理解的重要组成部分。提出了一种基于视觉的标签抽取和匹配方法,深入分析了相关匹配因子,给出了一种对查询接口表单进行重构的方法,它能依据接口HTML源代码自动还原出该表单的视觉布局特征。在最终的匹配算法中,综合考虑了基于label标记的匹配、基于文本语义的匹配以及基于位置特征的匹配。在8个领域共计277个查询接口上的实验证明了所提方法能取得较高的匹配精度。 展开更多
关键词 标签抽取 位置特征 表单布局 元素-标签匹配
下载PDF
中文专利术语层次关系解析研究 被引量:7
11
作者 吴志祥 王昊 王密平 《情报学报》 CSSCI CSCD 北大核心 2017年第4期401-410,共10页
对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体... 对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体。着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法。本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础。 展开更多
关键词 中文专利术语 位置加权 PCA降维 类目标签抽取 术语层次关系 本体学习
下载PDF
光交换中标签提取技术的研究
12
作者 王玉宝 苗英辉 《光通信技术》 CSCD 北大核心 2011年第11期44-47,共4页
随着光交换技术的快速发展,在核心节点如何有效快速地提取标签一直是研究的热点。分别对SCM技术分离标签、FP-SOA技术分离标签和利用特定光码控制光开关分离标签进行了研究,分析了各种方法的优缺点,介绍了光极性法分离标签与净荷的原理... 随着光交换技术的快速发展,在核心节点如何有效快速地提取标签一直是研究的热点。分别对SCM技术分离标签、FP-SOA技术分离标签和利用特定光码控制光开关分离标签进行了研究,分析了各种方法的优缺点,介绍了光极性法分离标签与净荷的原理,提出了利用光不同模式分别调制标签与净荷的结构模型。 展开更多
关键词 光极性 SCM(副载波复用)技术 FP-SOA技术 光码提取标签
下载PDF
改进的分水岭算法在牛乳体细胞上的分割及其应用
13
作者 郭帅 孙竞丹 +2 位作者 赵一鸣 付宗平 李宗晟 《数码设计》 2018年第9期86-86,共1页
研究牛乳体细胞出现重叠和粘连问题时有效可行的分割方法。对原图像二值化处理,后对灰度梯度图像进行形态学平滑滤波处理,然后提取图像的前景标记和背景标记同时对梯度图进行修正,最后采取分水岭进行分割。仿真结果显示,分水岭算法可有... 研究牛乳体细胞出现重叠和粘连问题时有效可行的分割方法。对原图像二值化处理,后对灰度梯度图像进行形态学平滑滤波处理,然后提取图像的前景标记和背景标记同时对梯度图进行修正,最后采取分水岭进行分割。仿真结果显示,分水岭算法可有效的抑制图像过分割的情况,且能准确、快速的分割牛乳体细胞,同时可为后续步骤牛乳体细胞的计数和诊断提供可靠的依据。 展开更多
关键词 分水岭算法 图像分割 过分割 标记提取
下载PDF
特征标记依赖自编码器的多标记特征提取方法 被引量:4
14
作者 程玉胜 李志伟 庞淑芳 《计算机科学与探索》 CSCD 北大核心 2020年第3期470-481,共12页
在多标记学习中,如何处理高维特征一直是研究难点之一,而特征提取算法可以有效解决数据特征高维性导致的分类性能降低问题。但目前已有的多标记特征提取算法很少充分利用特征信息并充分提取"特征-标记"独立信息及融合信息。... 在多标记学习中,如何处理高维特征一直是研究难点之一,而特征提取算法可以有效解决数据特征高维性导致的分类性能降低问题。但目前已有的多标记特征提取算法很少充分利用特征信息并充分提取"特征-标记"独立信息及融合信息。基于此,提出一种基于特征标记依赖自编码器的多标记特征提取方法。使用核极限学习机自编码器将原标记空间与原特征空间融合并产生重构后的新特征空间。一方面最大化希尔伯特-施密特范数以充分利用标记信息;另一方面通过主成分分析来降低特征提取过程中的信息损失,结合二者并分别提取"特征-特征"和"特征-标记"信息。通过在Yahoo多组高维多标记数据集上的对比实验表明,该算法的性能优于当前五种主要的多标记特征提取方法,验证了所提算法的有效性。 展开更多
关键词 多标记特征提取 特征标记依赖度 核极限学习机 主成分分析 自编码器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部