-
题名基于增量聚类的电子政务短文本信息挖掘算法研究
- 1
-
-
作者
冷泳林
郭颖
孙晓红
曲珮漪
-
机构
渤海大学信息科学与技术学院
渤海大学管理学院
-
出处
《渤海大学学报(自然科学版)》
CAS
2023年第3期262-269,共8页
-
基金
辽宁省社会科学基金项目(No:L14AGL002,No:L13AGL002).
-
文摘
电子政务平台每天都会产生大量短文本数据,挖掘短文本数据对政府掌握民意有十分重要的作用.针对短文本信息量少,单一短文本向量表示模型产生的特征信息丢失问题,提出一种融合权重及主题特征的混合向量表示模型.该模型利用Word2vec和TF-IDF算法挖掘短文本的局部特征,利用BTM主题模型挖掘短文本全局特征,然后将两种特征向量进行连接构成短文本向量.针对短文本数据增量变化特征,通过增加限定阈值改进传统Single-Pass聚类算法,实现短文本的增量聚类.实验结果表明,该模型能够有效的提高短文本聚类效果.
-
关键词
电子政务
短文本
向量表示模型
增量聚类
-
Keywords
E-government
short text
vector representation model
incremental clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于LLM和RAG的中邮网院智能客服系统研究
被引量:1
- 2
-
-
作者
张丽静
杜冬梅
刘庆芳
刘海云
-
机构
石家庄邮电职业技术学院
-
出处
《邮政研究》
2024年第4期66-72,共7页
-
基金
邮政应用技术协同创新中心资助项目(项目名称:基于开源的大语言模型的企业知识服务研究,项目编号:YB2023002)。
-
文摘
中邮网院客服为百万邮政员工提供培训、学习、考试等全方位服务支持的同时,存在着在学习高峰期回复不及时、全天候接待能力不足等问题。为解决这些问题,文章设计并实现了基于大语言模型、LangChain框架、pgVector向量数据库以及表示学习等技术的智能客服系统原型,旨在利用大模型理解用户复杂的自然语言输入,随时随地以更高效、准确的方式回答用户所遇到的问题,在降低中邮网院客服人工成本的同时,提升用户体验感和满意度。经测试验证了基于检索增强生成和大语言模型实现智能客服的可行性,为中邮网院后续进行智能客服系统建设和选型提供了参考。
-
关键词
大语言模型
RAG
LangChain
句向量表示学习模型
向量数据库
-
分类号
F61
[经济管理—产业经济]
-