-
题名基于文献计量学的管理学学科半衰期研究
被引量:17
- 1
-
-
作者
卓可秋
-
机构
南京大学信息管理学院
-
出处
《图书与情报》
CSSCI
北大核心
2014年第4期55-60,共6页
-
文摘
文章以CNKI收录管理学发文、引用和被引信息作为数据来源,从学科引用半衰期、学科被引半衰期指标及被引时序变化,分析了我国管理学学科知识老化现状。分析结果表明,管理学引用半衰期为5.80年,被引半衰期为3.45年,由此反映出目前管理学的文献老化速度偏快现象。同时发现,理论型子学科文献老化较慢,而应用型子学科文献老化速度较快。
-
关键词
学科半衰期
管理学
被引半衰期
引用半衰期
文献计量学
引文分析
-
Keywords
discipline half-life
management science
citing half-life
cited half-life
bibliometrics
citation analysis
-
分类号
G250.252
[文化科学—图书馆学]
-
-
题名突发事件检测的MapReduce并行化实现
被引量:3
- 2
-
-
作者
卓可秋
虞为
苏新宁
-
机构
南京大学信息管理学院
-
出处
《现代图书情报技术》
CSSCI
2015年第2期46-54,共9页
-
基金
国家社会科学基金项目"基于关联数据的图书馆语义云服务研究"(项目编号:12CTQ009)
国家社会科学基金重大项目"面向突发事件应急决策的快速响应情报体系研究"(项目编号:13&ZD174)
+1 种基金
国家自然科学基金面上项目"面向知识服务的知识组织模式与应用研究"(项目编号:71273126)
江苏省社会科学基金青年项目"基于语义云服务的数字阅读推广研究"(项目编号:14TQC003)的研究成果之一
-
文摘
【目的】在大数据环境下,从文本流中准确且快速地检测出特定领域的突发事件。【方法】利用Kleinberg突发检测方法和LDA主题模型方法,将其扩展到Map Reduce并行框架中,实现并行语料预处理、并行突发词检测、并行突发文档过滤和并行主题提取。【结果】对新闻文本流进行模拟仿真实验,结果表明,该并行方法在特定领域突发事件检测中准确率P、召回率R和调和平均值F分别最高可达87.50%、77.78%和82.35%。【局限】基于Map Reduce的并行方法难以实现大规模动态文本流在线(Online)实时(Real-time)突发事件检测。【结论】与传统串行突发事件检测方法相比,所构建的分布式并行化方法在保证检测结果正确性的同时,具有良好的可扩展性,性能得到较大提升。
-
关键词
突发事件检测
MAPREDUCE
分布式处理
LDA
主题模型
-
Keywords
Bursty event detection
MapReduce
Distributed process
LDA topic model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名IPTV中基于使用体验的用户流失预测和挽留方法
被引量:2
- 3
-
-
作者
舒文丽
卓可秋
-
机构
中国电信股份有限公司湖南分公司
中兴通讯股份有限公司
-
出处
《信息通信》
2020年第8期244-246,共3页
-
文摘
目前各大电信运营商的业务形态越来越呈现同质化的趋势,如何有效地控制用户离网、增加客户粘度是运营商非常关注的领域,前提是需要提前甄别出高风险流失用户,进而通过运营或客服策略进行干预,才能有效减低用户流失率。由此,通过在用户体验和用户行为中,引入二次特征提取的方法,从多个维度描述用户体验和行为,并针对多个维度分别建模,以提高流失与非流失用户体验的可分性;然后再使用强化学习方法,以可挽留的、高价值用户为参考基准,调整流失预测模型,使得预测出的高风险流失用户更具商业价值。此外,还从运营策略和视频网络服务质量两个层面进行优化,从而提高挽留高风险流失用户的可能性。
-
关键词
二次特征
强化学习
分类器
预测模型
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于Spark的论文相似性快速检测方法
被引量:2
- 4
-
-
作者
卓可秋
童国平
虞为
-
机构
南京大学信息管理学院
江苏省数据工程与知识服务重点实验室(南京大学)
-
出处
《图书情报工作》
CSSCI
北大核心
2015年第11期134-142,共9页
-
基金
国家社会科学基金重大项目"面向突发事件应急决策的快速响应情报体系研究"(项目编号:13&ZD174)
国家社会科学基金项目"基于关联数据的图书馆语义云服务研究"(项目编号:12CTQ009)
+2 种基金
江苏省社会科学项目青年项目"基于语义云服务的数字阅读推广研究"(项目编号:14TQC003)
中央高校基本科研业务费专项资金资助项目"基于用户的标语用分析的社会化标签知识组织研究"(项目编号:1435003)
江苏省高校自然科学研究面上资助项目"基于语义消歧技术的社会化标签知识组织研究"(项目编号:15KJB520013)研究成果之一
-
文摘
[目的/意义]从大规模已知文本集中检测出与待检测论文的相似文本并计算相似度大小,用于满足在线论文相似性检测秒级响应需求。[方法/过程]采用分治法策略,对已知文本句集进行基于正交基的软聚类预处理,并对软聚类后的每个簇建立倒排索引。接着在快数据处理平台Spark上执行相似性检测,采用字符结合词组形式计算出待检测论文与已知文本的相似度大小。[结果/结论]通过200万规模的已知文本集实验结果显示,综合4种类型的待检测论文,所提出的倒排索引结合软聚类算法准确率P为100.0%,召回率R为93.6%,调和平均值F为96.7%。调和平均值F比相似性检测算法LCS高10%左右,比Simhash算法高约23%。在检测速度上,对于一篇字数为5 000左右的待检测论文,检测时间约为6.5秒,比Simhash算法快近300倍,比LCS算法快约4 000倍,此外,实验结果还表明基于Spark的分布式并行相似性检测算法具有较好的可扩展性。
-
关键词
论文相似性检测
Spark快数据处理
正交基软聚类
倒排索引
-
Keywords
paper similarity detection Spark fast data processing orthogonal soft clustering inverted index
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名自有知识增强下的学术全文本关系抽取研究
被引量:1
- 5
-
-
作者
卓可秋
沈思
王东波
-
机构
南京农业大学信息管理学院
南京理工大学经济管理学院
-
出处
《图书情报工作》
CSSCI
北大核心
2022年第7期120-131,共12页
-
基金
江苏省自然科学基金青年项目"基于深度学习的学术全文本时态语义知识标识及检索模型构建研究"(项目编号:BK20190450)
国家自然科学基金面上项目"基于深度学习的学术全文本知识图谱构建及检索研究"(项目编号:71974094)研究成果之一。
-
文摘
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现。[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外部知识。研究发现,全文本中自有的高置信度的知识也可以用来辅助全文本关系抽取。受认知过程双系统理论(系统1为直觉认知,系统2为推理认知)启发,设计一个句子级模型来获取知识,并通过远程监督方式获取高置信度知识,然后将高置信度知识融入到全文本级深度学习模型最后分类的一层上。[结果/结论]在生物医学学术全文本数据集(CDR-revised)上,比当前最先进的模型在F1上提高11.13%。
-
关键词
学术全文本
关系抽取
自有知识增强
知识图谱
-
Keywords
academic full-text
relation extraction
self-owned knowledge enhancement
knowledge graph
-
分类号
G250
[文化科学—图书馆学]
-