期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
以笔画为研究对象的笔迹伪动态特征提取方法 被引量:4
1
作者 王民 孙向南 +2 位作者 刘利 朱晓娟 曾宝莹 《计算机工程与应用》 CSCD 北大核心 2016年第18期179-182,207,共5页
针对以往的以文字结体为研究对象的离线笔迹特征提取方法在文本相关度较低时无法获取稳定特征的问题,提出了一种以笔画为研究对象的笔迹伪动态特征提取方法,摆脱了结体依存性的束缚。引入概率统计思想,采用网格窗口提取笔画的运笔走势... 针对以往的以文字结体为研究对象的离线笔迹特征提取方法在文本相关度较低时无法获取稳定特征的问题,提出了一种以笔画为研究对象的笔迹伪动态特征提取方法,摆脱了结体依存性的束缚。引入概率统计思想,采用网格窗口提取笔画的运笔走势和宽度变化等伪动态特征。分别采用加权欧式距离、加权卡方距离和加权Manhattan距离计算笔迹相似度。在HIT-MW和HIT-SW库上进行实验,文本相关度较高时首选和前10选鉴别正确率分别为95.9%和99.5%;文本相关度较低时首选和前10选鉴别正确率分别为91.9%和99.0%。实验表明,以笔画为研究对象的笔迹伪动态特征提取方法在低文本相关度下仍能取得较好效果。 展开更多
关键词 笔画 伪动态特征 概率统计 网格窗口 文本相关度
下载PDF
基于潜在语义与图结构的微博语义检索 被引量:4
2
作者 肖宝 李璞 +1 位作者 胡娇娇 蒋运承 《计算机工程》 CAS CSCD 北大核心 2017年第6期182-188,194,共8页
微博文本短小、特征稀疏、与用户查询之间存在语义鸿沟的特点会降低语义检索效率。针对该问题,结合文本特征和知识库语义,构建基于潜在语义与图结构的语义检索模型。通过Tversky算法计算基于Hashtag的特征相关度;利用隐含狄利克雷分布... 微博文本短小、特征稀疏、与用户查询之间存在语义鸿沟的特点会降低语义检索效率。针对该问题,结合文本特征和知识库语义,构建基于潜在语义与图结构的语义检索模型。通过Tversky算法计算基于Hashtag的特征相关度;利用隐含狄利克雷分布算法对Wikipedia语料库训练主题模型,基于JSD距离计算映射到该模型的文本主题相关度;抽取DBpedia中实体及其网络关系连接图,使用SimRank算法计算图中实体间的相关度。综合以上3个结果得到最终相关度。通过短文本和长文本检索对Twitter子集进行实验,结果表明,与基于开放关联数据和图论的方法相比,该模型在评估指标MAP,P@30,R-Prec上分别提高了2.98%,6.40%,5.16%,具有较好的检索性能。 展开更多
关键词 微博 文本相关度 图结构 隐含狄利克雷分布 语义检索
下载PDF
交易所网络平台互动与分析师盈余预测质量——基于管理层回复文本相关度的调节作用
3
作者 孙汉 陈华 沈胤鸿 《华东经济管理》 北大核心 2023年第11期99-107,共9页
文章基于中国资本市场特有的政策背景,从分析师盈余预测误差和盈余预测分歧度两个角度,检验交易所网络平台互动对分析师盈余预测质量的影响。研究发现,网络平台的海量互动信息存在信息过载效应而非信息增量效应。具体表现为:网络平台互... 文章基于中国资本市场特有的政策背景,从分析师盈余预测误差和盈余预测分歧度两个角度,检验交易所网络平台互动对分析师盈余预测质量的影响。研究发现,网络平台的海量互动信息存在信息过载效应而非信息增量效应。具体表现为:网络平台互动提高了分析师盈余预测误差和分歧度;管理层回复文本相关度能够弱化网络平台互动对分析师预测质量的负向影响;拓展性研究表明,当管理层披露更少的风险信息和竞争文化信息时,越能弱化网络平台互动对分析师盈余预测质量的不利影响。研究结论为管理层与投资者信息交互过程所引致的信息过载效应方面的研究和分析师盈余预测质量影响因素方面的研究提供了有益补充。 展开更多
关键词 网络平台互动 分析师盈余预测质量 文本相关度 信息过载效应
下载PDF
基于TF-IDF算法的公文用户画像全文替换 被引量:1
4
作者 卓佳怡 于劲松 +4 位作者 张力文 王浩然 吴聪 张舒 宋悦 《办公自动化》 2020年第17期61-64,共4页
政府公文是一种重要的知识资源。本文基于用户画像,实现了用户待办公文的有效排序及推荐。参考历史公文信息,利用TF-IDF算法获取用户画像中的公文关键词,与历史公文的文本相关性,实现待办理公文的推荐。基于结构熵权法和模糊分析,对影... 政府公文是一种重要的知识资源。本文基于用户画像,实现了用户待办公文的有效排序及推荐。参考历史公文信息,利用TF-IDF算法获取用户画像中的公文关键词,与历史公文的文本相关性,实现待办理公文的推荐。基于结构熵权法和模糊分析,对影响公文处理效率的主客观因素提取权重。最终将用户画像与待办公文的主客观因素结合评估分数,实现待办公文合理排序。 展开更多
关键词 公文 TF-IDF 文本相关度 排序 模糊数学
下载PDF
基于深度学习技术的词语相关性计算在电商广告关键词选词中的应用
5
作者 张函 《科学技术创新》 2021年第11期107-110,共4页
电商广告是电商网店运营推广的重要手段。而在电商广告推广流程中,选取关键词又是其中最重要的环节。关键词选取的好环,往往决定着电商广告的效果。在电商运营实战中,关键词选取往往需要通过自动化的方式进行,以满足和应对市场和用户需... 电商广告是电商网店运营推广的重要手段。而在电商广告推广流程中,选取关键词又是其中最重要的环节。关键词选取的好环,往往决定着电商广告的效果。在电商运营实战中,关键词选取往往需要通过自动化的方式进行,以满足和应对市场和用户需求的变化。随着互联网技术的发展,传统智能化选词平台中基于传统技术进行的关键词选取越来越不满足现代电子商务运营的需要。本文基于对于电商广告选词业务流程的调研以及对智能化选词能力过程的调研分析,基于某提供电商广告企业服务平台的深入调研,设计并验证了基于深度学习中doc2vec技术对于智能化选词的增益和作用。同时,在本文实验和技术方案的基础上,也对基于深度学习的智能化选词算法的后续改造和优化的方向进行了探讨。 展开更多
关键词 电商广告 关键词 文本相关度 学习
下载PDF
一种改进的网络突发话题检测算法
6
作者 哈艳 杜瑞忠 +2 位作者 钟莲 张东琦 李森 《河北大学学报(自然科学版)》 CAS 北大核心 2015年第5期526-531,共6页
引进文本相关度这一影响因子,提出了一种基于蚁群聚类算法的突发话题检测算法,该算法结合蚁群聚类算法的优势,综合考虑文本聚类和文本相关度的影响,得到对网络突发话题检测的最优聚类效果,并对近年来网络突发话题进行实验,达到了很好的... 引进文本相关度这一影响因子,提出了一种基于蚁群聚类算法的突发话题检测算法,该算法结合蚁群聚类算法的优势,综合考虑文本聚类和文本相关度的影响,得到对网络突发话题检测的最优聚类效果,并对近年来网络突发话题进行实验,达到了很好的聚类速度和聚类效果,验证了算法对突发话题检测的准确性和即时性. 展开更多
关键词 网络舆情 突发话题检测 文本相关度 蚁群聚类算法
下载PDF
基于改进微结构特征的笔迹鉴别 被引量:20
7
作者 李昕 丁晓青 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第4期595-600,共6页
该文作者已提出的基于网格微结构特征的笔迹鉴别方法,是一种能适用于多文种笔迹的文本无关方法。为了对笔画轨迹进行更加细致的描述,该文对微结构特征提取方法予以改进,修改了局部微结构的生成条件,并引入了加权Manhattan距离的相似度... 该文作者已提出的基于网格微结构特征的笔迹鉴别方法,是一种能适用于多文种笔迹的文本无关方法。为了对笔画轨迹进行更加细致的描述,该文对微结构特征提取方法予以改进,修改了局部微结构的生成条件,并引入了加权Manhattan距离的相似度度量方法。改进方法在中文笔迹库上有效提高了鉴别正确率。在包含240人的HIT-MW笔迹库上,首选鉴别正确率为95.4%,前20选正确率达到100%。通过实验,进一步研究了实际应用中笔迹样本的文本内容相关度对鉴别性能的影响程度。 展开更多
关键词 模式识别 文本无关笔迹鉴别 改进微结构特征 文本内容相关度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部