期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于查询表达式特征的时态意图识别研究 被引量:11
1
作者 桂思思 陆伟 张晓娟 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第3期66-75,共10页
【目的】针对时态意图识别问题,探讨可抽取查询表达式特征的有效性及采用不同类别分类算法的识别准确度,为后续相关研究提供一定的借鉴。【方法】按查询表达式特征与时间的关联性,将其归类为时间无关特征、潜在时间特征、显式时间特征... 【目的】针对时态意图识别问题,探讨可抽取查询表达式特征的有效性及采用不同类别分类算法的识别准确度,为后续相关研究提供一定的借鉴。【方法】按查询表达式特征与时间的关联性,将其归类为时间无关特征、潜在时间特征、显式时间特征。在此基础上,分别采用有监督分类算法及半监督分类算法,探讨采用不同特征组合的有效性及不同分类算法的识别准确度。【结果】在抽取的三类查询表达式特征中,仅使用显式时间特征的平均分类准确率最高,且"查询是否包含年份"这一特征为强特征;使用不同分类算法的识别准确度相差不大;时态意图识别结果优于已有参与时态意图分类子任务(TQIC)测评的成果,平均分类准确率为81.14%。【局限】限于数据集的获取途径,仅对300条查询的时态意图识别效果进行验证;仅考虑已有的查询表达式特征,未提出用于时态意图识别的新特征。【结论】查询表达式特征中与时间关联性高的特征能提高时态意图识别准确度,而基于统计的特征(如查询词长度)对时态意图识别分类准确度的提升效果不明显。 展开更多
关键词 时态意图 有监督分类 半监督分类 特征抽取
原文传递
基于深度学习算法的学术查询意图分类器构建 被引量:9
2
作者 王瑞雪 方婧 +2 位作者 桂思思 陆伟 张显 《图书情报工作》 CSSCI 北大核心 2021年第3期93-99,共7页
[目的/意义]实现学术查询意图的自动识别,提高学术搜索引擎的效率。[方法/过程]结合已有查询意图特征和学术搜索特点,从基本信息、特定关键词、实体和出现频率4个层面对查询表达式进行特征构造,运用Naive Bayes、Logistic回归、SVM、Ran... [目的/意义]实现学术查询意图的自动识别,提高学术搜索引擎的效率。[方法/过程]结合已有查询意图特征和学术搜索特点,从基本信息、特定关键词、实体和出现频率4个层面对查询表达式进行特征构造,运用Naive Bayes、Logistic回归、SVM、Random Forest四种分类算法进行查询意图自动识别的预实验,计算不同方法的准确率、召回率和F值。提出了一种将Logistic回归算法所预测的识别结果扩展到大规模数据集、提取"关键词类"特征的方法构建学术查询意图识别的深度学习两层分类器。[结果/结论]两层分类器的宏平均F1值为0.651,优于其他算法,能够有效平衡不同学术查询意图的类别准确率与召回率效果。两层分类器在学术探索类的效果最好,F1值为0.783。 展开更多
关键词 学术查询意图 自动识别 两层分类器
原文传递
基于ARIMA与线性回归组合模型的汽车销量预测分析 被引量:6
3
作者 桂思思 孙伟 徐晓锋 《计算机与数字工程》 2021年第8期1719-1723,共5页
现有的汽车销量预测模型大都脱离汽车企业的实际情况,侧重于中国汽车市场的整体销量预测,且预测数据来源难以获取,在各品牌的汽车主机厂并未得到广泛应用。论文根据主机厂数据现状,结合现有汽车销售流程,分析面向品牌的汽车销量预测的... 现有的汽车销量预测模型大都脱离汽车企业的实际情况,侧重于中国汽车市场的整体销量预测,且预测数据来源难以获取,在各品牌的汽车主机厂并未得到广泛应用。论文根据主机厂数据现状,结合现有汽车销售流程,分析面向品牌的汽车销量预测的主要因素,提出一种基于ARIMA与线性回归组合模型的单品牌汽车销量预测模型,为单品牌的汽车销量预测提供建模参考。 展开更多
关键词 汽车销量预测 ARIMA模型 线性回归模型 组合模型
下载PDF
基于采莓模型启示的探索式与查找式意图自动识别研究
4
作者 刘杰 桂思思 张晓娟 《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第4期152-166,共15页
【目的】通过选取新分类特征,提高探索式与查找式意图自动识别的准确度。【方法】在AOL查询日志中,选取1805个查询并对其进行人工标注;在采莓模型的启示下,分别从查询性质、搜索过程与信息来源三个层面提出分类特征;进一步比较所提出特... 【目的】通过选取新分类特征,提高探索式与查找式意图自动识别的准确度。【方法】在AOL查询日志中,选取1805个查询并对其进行人工标注;在采莓模型的启示下,分别从查询性质、搜索过程与信息来源三个层面提出分类特征;进一步比较所提出特征在朴素贝叶斯、SVM、决策树、随机森林与神经网络5种分类模型中的分类效果;最后分析不同特征集合以及每个特征的分类效果。【结果】三种分类特征均能对探索式与查找式意图进行有效区分,其中查询性质相关特征的识别效果最佳;在5种分类模型中,采用神经网络算法的分类模型性能最佳(Accuracy=0.8172,Precision=0.8494,Recall=0.7747,F1=0.8103)。【局限】未在多个数据集中验证新提出的分类特征的性能;未充分挖掘用户搜索行为以此形成更多有效的分类特征;由于人工标注存在高耗时、高人力成本等问题,使得最终应用于探索式/查找式意图识别的数据集有限。【结论】基于采莓模型启示提出的特征能对探索式与查找式意图进行有效区分。 展开更多
关键词 查询意图识别 探索式意图 查找式意图 采莓模型
原文传递
微服务架构在商务领域信息系统集中化建设中的应用研究 被引量:2
5
作者 桂思思 陈幺华 秦伟 《科技创业月刊》 2020年第2期87-90,共4页
随着移动互联新型业务增长,汽车厂商商业模式逐步进行转变,商务领域信息系统的集中化架构演进将对传统模式及新型模式的支撑起到至关重要的作用。通过对系统建设的模式及架构演进进行比对分析,着重对商务领域系统集中化的微服务架构搭... 随着移动互联新型业务增长,汽车厂商商业模式逐步进行转变,商务领域信息系统的集中化架构演进将对传统模式及新型模式的支撑起到至关重要的作用。通过对系统建设的模式及架构演进进行比对分析,着重对商务领域系统集中化的微服务架构搭建、技术实现、微服务切分进行阐述,并对历史数据迁移及特殊业务在微服务架构展开分析。 展开更多
关键词 集中化 微服务 架构迁移
下载PDF
智能、智慧、智库:新时代的情报学发展与实践——第九届全国情报学博士生学术论坛纪要 被引量:1
6
作者 何琳 桂思思 杨波 《图书情报知识》 CSSCI 北大核心 2019年第6期120-124,共5页
1论坛简介全国情报学博士生学术论坛2012年由北京大学信息管理系发起,至今已经连续举办八届[1-9],历届全国情报学博士生论坛主题如表1所示。该论坛为全国情报学专家学者和博士研究生搭建了一个高水平的学术交流平台,推进了全国情报学博... 1论坛简介全国情报学博士生学术论坛2012年由北京大学信息管理系发起,至今已经连续举办八届[1-9],历届全国情报学博士生论坛主题如表1所示。该论坛为全国情报学专家学者和博士研究生搭建了一个高水平的学术交流平台,推进了全国情报学博士生在情报学理论与实践方面的学习、思考与创新,促进了情报学博士生学术研究和实践能力的提升。 展开更多
关键词 情报学 博士研究生 博士生 发展与实践
下载PDF
数字人文视域下中国古代农耕图像知识组织研究 被引量:1
7
作者 高丹 徐健 +1 位作者 何琳 桂思思 《图书馆杂志》 CSSCI 北大核心 2024年第1期109-117,共9页
基于农耕图像历史及文化价值深度挖掘的目标,文章探讨了数字时代农耕图像知识组织的建设现状、特征、原型系统、存在问题与应用前景,为提出数字人文视角下农耕图像研究的新范式提供参考。通过文献调研法和案例分析法,本文梳理了国内外... 基于农耕图像历史及文化价值深度挖掘的目标,文章探讨了数字时代农耕图像知识组织的建设现状、特征、原型系统、存在问题与应用前景,为提出数字人文视角下农耕图像研究的新范式提供参考。通过文献调研法和案例分析法,本文梳理了国内外典型的图像资源组织案例,结合农耕图像特征,提出一种面向农耕图像资源知识组织的4层架构原型系统。该框架揭示了中国古代农耕图像的资源加工层、图像标注层、数据关联层、应用服务层的实现路径。同时,本文还提出农耕图像资源知识组织待解决的关键问题,并对其应用价值进行展望,以期为相关文化遗产和数字人文项目提供参考与借鉴。 展开更多
关键词 农耕图像 数字人文 知识组织 原型系统
下载PDF
数字技术赋能史学研究:历史脉络、应用现状与发展进路
8
作者 喻雪寒 何琳 桂思思 《图书情报工作》 CSSCI 北大核心 2024年第19期140-148,共9页
[目的 /意义]数字技术赋能史学研究旨在引入数据库、自然语言处理、GIS、VR/AR等方法开辟一条知识呈现的新道路,而探索数字技术与历史学的结合方式,则有利于明晰其发展路径与现有困境,为促进数字人文的跨学科合作提供更多启示。[方法 /... [目的 /意义]数字技术赋能史学研究旨在引入数据库、自然语言处理、GIS、VR/AR等方法开辟一条知识呈现的新道路,而探索数字技术与历史学的结合方式,则有利于明晰其发展路径与现有困境,为促进数字人文的跨学科合作提供更多启示。[方法 /过程]从数字技术在历史学中的发展脉络开始梳理,分析其一般路径与应用现状,提出技术赋能史学的潜在问题与前景展望。[结果 /结论 ]数字技术的引用,使传统史学研究里的海量史料得到有效处理和合理运用,提升遍历史料的研究效率,挖掘社会现象的关联与规律,但依然不免受限于历史文本的主观性和多样性,古代地理信息数据缺乏量化和跨学科合作的难题。 展开更多
关键词 计量史学 数字史学 GIS VR AR
原文传递
国内数字人文开放数据的进展、痛点与发展思考 被引量:1
9
作者 吴金华 徐健 桂思思 《图书馆杂志》 CSSCI 北大核心 2023年第11期99-107,共9页
开放数据是数字人文创新发展的重要内容,系统认知和思考数字人文开放数据的进展、痛点与发展,对于数字人文知识生产范式创新具有重要意义。本文通过文献分析、案例分析等,梳理我国数字人文开放数据的基本进展情况,凝炼数字人文开放数据... 开放数据是数字人文创新发展的重要内容,系统认知和思考数字人文开放数据的进展、痛点与发展,对于数字人文知识生产范式创新具有重要意义。本文通过文献分析、案例分析等,梳理我国数字人文开放数据的基本进展情况,凝炼数字人文开放数据的核心痛点,在此基础上提出我国数字人文开放数据可持续发展的对策和路径。目前,我国数字人文开放数据在开放意愿度、开放服务度、开放合作度和开放使用度等方面还存在一定的不足,未来需要从强化资金和政策保障、契合服务场景和用户需求、打造合作共赢和价值共创机制、促进开放数据的“知”与“用”等方面持续推进。 展开更多
关键词 数字人文 开放数据 发展现状 对策 数据资源
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部