期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于K-prototype聚类的学生教育画像分析 被引量:10
1
作者 翟鸣宇 程建 +1 位作者 王苏桐 王延章 《大连理工大学学报(社会科学版)》 CSSCI 北大核心 2021年第6期22-31,共10页
针对包含类别数据与数值数据的高校教育大数据,采用基于汉明距离与欧式距离混合度量的K-prototype进行聚类,并通过轮廓系数对聚类效果进行评价,与常用的k-means、DBSCAN进行对比,实验结果表明:基于K-prototype的聚类在教育大数据的处理... 针对包含类别数据与数值数据的高校教育大数据,采用基于汉明距离与欧式距离混合度量的K-prototype进行聚类,并通过轮廓系数对聚类效果进行评价,与常用的k-means、DBSCAN进行对比,实验结果表明:基于K-prototype的聚类在教育大数据的处理上更具优势。基于聚类结果,采用词云图构建了4类学生教育画像。画像从基本属性、生活消费、生活规律等维度将学生群体划分为“思想积极型学生”“夜猫子游戏型学生”“规律作息型学生”“节俭好学型学生”4类,为学生教育管理人员提供相应的决策支持。 展开更多
关键词 学生教育画像 K-prototype聚类 词云图
下载PDF
基于LDA的煤矿安全隐患主题发现研究 被引量:17
2
作者 谭章禄 王泽 陈晓 《中国安全科学学报》 CAS CSCD 北大核心 2016年第6期123-128,共6页
为提高安全管理者对安全隐患数据的理解和认知水平,增强其隐患排查和治理能力,以潞安集团司马煤业有限公司2014年安全隐患记录为数据源,基于潜在狄利克雷分配模型(LDA)挖掘煤矿安全隐患主题。利用R软件进行主题模型参数估计、模型计算,... 为提高安全管理者对安全隐患数据的理解和认知水平,增强其隐患排查和治理能力,以潞安集团司马煤业有限公司2014年安全隐患记录为数据源,基于潜在狄利克雷分配模型(LDA)挖掘煤矿安全隐患主题。利用R软件进行主题模型参数估计、模型计算,最终优选出14个安全隐患主题;采用桑基图揭示隐患主题与责任主体、隐患致因之间的关系。结果表明:LDA主题模型能较好揭示煤矿安全隐患数据中的潜在规律,为煤矿隐患排查、隐患治理以及安全管理决策提供重要信息。 展开更多
关键词 煤矿隐患 潜在狄利克雷分配模型(LDA) Gibbs抽样算法 词云 桑基图
下载PDF
我国院前医疗急救标准研究
3
作者 向珍君 巴依尔策策克 +3 位作者 陈辉 计玉容 赵婵 刘红梅 《中国卫生质量管理》 2024年第1期1-6,共6页
目的了解我国院前医疗急救标准现状,为推进院前医疗急救标准化、同质化建设提供参考。方法从各标准信息公共服务平台检索我国院前医疗急救相关标准,进行描述性统计分析和词云图分析。结果1975年-2022年我国发布院前医疗急救相关标准57项... 目的了解我国院前医疗急救标准现状,为推进院前医疗急救标准化、同质化建设提供参考。方法从各标准信息公共服务平台检索我国院前医疗急救相关标准,进行描述性统计分析和词云图分析。结果1975年-2022年我国发布院前医疗急救相关标准57项,标准牵头起草单位40家,参与起草单位307家。院前医疗急救相关标准的重点逐渐由急救车辆、急救设备等转为对伤病员的服务规范、信息化、急救机构建设等。结论我国院前医疗急救相关标准总量较少,内容覆盖面窄,且未形成标准体系。需抓住院前医疗急救发展新机遇,优化院前医疗急救标准框架体系,及时进行标准制修订工作,并持续做好培训、宣贯等。 展开更多
关键词 中国 院前医疗急救 标准 词云图
下载PDF
基于网络点评数据的茶饮空间设计提升策略 被引量:1
4
作者 都伟 滕小涵 《设计》 2023年第9期130-133,共4页
为顺应体验经济时代的新型消费模式,挖掘茶饮空间特质,依据消费群体的体验需求改善茶饮空间现状。文章分析了茶饮空间的构成与空间特征,利用python采集线上评论数据,形成词云图并进行可视化分析。构建了包括场地条件、环境感受、服务运... 为顺应体验经济时代的新型消费模式,挖掘茶饮空间特质,依据消费群体的体验需求改善茶饮空间现状。文章分析了茶饮空间的构成与空间特征,利用python采集线上评论数据,形成词云图并进行可视化分析。构建了包括场地条件、环境感受、服务运营、文化体验与行为交互体验五大维度及其16小项的茶饮空间体验影响要素体系,并结合案例提出了茶饮空间设计策略。利用网络文本分析技术,从消费者评价角度为茶饮空间的革新与优化提供新的方法。 展开更多
关键词 茶饮空间 评论采集 体验影响要素 词云图 设计策略
下载PDF
基于奇异值分解的新闻标题聚类研究 被引量:3
5
作者 文晓艺 郝程程 《计算机技术与发展》 2020年第2期42-46,共5页
和导航中应用广泛。文本聚类作为一种无监督学习算法,其依据是聚类假设:同类的文档相似程度大,不同类的文档相似程度小。文中主要研究汉语文本聚类算法在新闻标题类文本中的应用。首先对采集到的若干条新闻标题进行分词和特征提取,将分... 和导航中应用广泛。文本聚类作为一种无监督学习算法,其依据是聚类假设:同类的文档相似程度大,不同类的文档相似程度小。文中主要研究汉语文本聚类算法在新闻标题类文本中的应用。首先对采集到的若干条新闻标题进行分词和特征提取,将分词后的文本转化为词条矩阵;然后使用TF-IDF技术处理词条矩阵,得到基于分词权重的新的词条矩阵,对新的词条矩阵进行奇异值分解,得到主成分得分矩阵,提取主成分分析文本特征并根据主成分得分矩阵进行K-均值和分层聚类分析;最后将聚类结果用词云图的形式展示出来并评价聚类效果的好坏。实证显示,对词条矩阵的奇异值分解能降低向量空间的维数,提高聚类的精度和运算速度。 展开更多
关键词 汉语分词 词云图 奇异值分解 潜在语义分析 K-MEANS聚类
下载PDF
视频网站评论数据处理及分析--以B站为例
6
作者 刘渝妍 洪孙焱 曹嘉晨 《计算机时代》 2022年第2期76-79,共4页
视频网站的用户评论、弹幕逐渐成为视频内容之外的一个引起热议的话题。视频评论作为新的文化产品和文化形式,引起了社会的关注。文章以B站为例,通过网络爬虫收集数据,利用大数据相关技术,对评论数据进行处理分析,并以词云图及散点图的... 视频网站的用户评论、弹幕逐渐成为视频内容之外的一个引起热议的话题。视频评论作为新的文化产品和文化形式,引起了社会的关注。文章以B站为例,通过网络爬虫收集数据,利用大数据相关技术,对评论数据进行处理分析,并以词云图及散点图的方式呈现用户的关注点及语言表达的差异性,直观地为相关研究提供参考。 展开更多
关键词 网络爬虫 大数据 评论数据 词云图 散点图
下载PDF
国内互联网可得吸烟相关信息调查分析 被引量:1
7
作者 陶倩文 沈兴蓉 +1 位作者 冯瑞 王德斌 《泰山医学院学报》 CAS 2018年第11期1201-1205,共5页
目的分析国内中文网页吸烟相关信息的特征与规律,为更好了解虚拟环境下个体的吸烟认识、更好地开展吸烟相关干预(特别是网络+干预)提供有益的线索。方法先以"吸烟"为检索词,通过百度搜索2005—2017年全部可得网页;再人工逐条... 目的分析国内中文网页吸烟相关信息的特征与规律,为更好了解虚拟环境下个体的吸烟认识、更好地开展吸烟相关干预(特别是网络+干预)提供有益的线索。方法先以"吸烟"为检索词,通过百度搜索2005—2017年全部可得网页;再人工逐条阅读网页内容并按照事先设定好的过录表格提取数据;最后运用频数统计、词云图、主题网络关系图分析所得吸烟相关数据。结果主要来源网站是百度,栏目是问答;可得相关网页随年份总体呈上升趋势,但2015年有所下降;围绕吸烟好处、吸烟坏处、戒烟方法和危害防护四个领域中提及最多的主题词分别是:利于社交、致癌、多活动、补充维生素;四个领域主题词网络图均可见明显的"分类聚集"的特征。结论虚拟空间吸烟相关信息呈现时限性强及良莠不齐的特点,且具有明显的认知导向性;基于网页的控烟咨询教育需注意运用这些特性。 展开更多
关键词 吸烟 互联网 词云图 主题词网络图
下载PDF
边界约束下的词云拓扑保持算法
8
作者 路强 唐靓 柴秉捷 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第11期1916-1923,共8页
词云是一种典型的用于文本分析的可视化形式,更美观的可视化效果和更佳的实用性是研究者们研究的主题.针对边界约束下语义聚集的词云在单词发生改变时的紧凑布局和单词间拓扑结构保持的问题,提出一种适用于元组确定式文本的词云布局方式... 词云是一种典型的用于文本分析的可视化形式,更美观的可视化效果和更佳的实用性是研究者们研究的主题.针对边界约束下语义聚集的词云在单词发生改变时的紧凑布局和单词间拓扑结构保持的问题,提出一种适用于元组确定式文本的词云布局方式,在确定元组数目的基础上,用Power图剖分显示界面,利用单词间的属性依赖实现词云的初始布局;然后提出边界约束词云的拓扑保持算法,定义了5种约束规则、单词间相对约束力以及边界约束力,规定了词云在布局过程中的约束条件,以保证词云拓扑保持的同时实现单词在确定边界下的无重叠布局.针对词云的不同边界形状详细定义边界约束力,并分别对不同形状的词云进行局部单词放大、删除、缩小实验,结果显示,文中的拓扑保持算法在词云内单词发生变化时较好地保证视觉效果,同时有效地保持了原有的拓扑结构. 展开更多
关键词 词云布局 边界约束 Power图 单词变化 拓扑保持
下载PDF
辽宁省公立医院章程编写中非结构化数据的处理方式和方法
9
作者 李欣宏 张策 单诗洋 《辽宁医学杂志》 2021年第4期5-7,共3页
目的探索辽宁省在公立医院章程编写过程中,编写质量调查路径,提出非结构化数据的处理方式和方法。方法通过分词、计算词频和绘制词云图对非结构化数据进行结构化,然后针对结构化数据进行问卷信度、效度分析,计算不同医院级别、医院属地... 目的探索辽宁省在公立医院章程编写过程中,编写质量调查路径,提出非结构化数据的处理方式和方法。方法通过分词、计算词频和绘制词云图对非结构化数据进行结构化,然后针对结构化数据进行问卷信度、效度分析,计算不同医院级别、医院属地和医院性质在各个指标上的表现差异,从而了解辽宁省各级医院章程编写质量。结果通过分词操作,很好的对数据进行了结构化处理,经计算,问卷的信度和结构效度均较高,可以应用。现代医院章程编写中,党委领导,院长办公会制度、后勤管理等都是章程要求的重要内容,但经过统计分析,在基层医院这些方面与高层次医院还有一定差距,是章程和制度落实过程中需要解决的一项重要问题。结论非结构化数据处理方法为开放性质量问卷提供有效处理路径,基层医院在章程编写方面还要有很长一段路要走。 展开更多
关键词 现代医院管理制度 医院章程 分词操作 词云图
原文传递
自然语言处理在中华优秀传统文化挖掘中的应用
10
作者 陈宇轩 沈鹏 《数码设计》 2019年第10期41-44,共4页
自然语言处理技术(NLP)能够识别一段文字的主题、关键词、人物共现等,将这一技术应用在古籍文本大数据中,对弘扬中华优秀传统文化具有重要意义。基于python爬虫技术进行文本采集,进行一系列数据处理操作。通过TF-IDF算法计算词频统计,... 自然语言处理技术(NLP)能够识别一段文字的主题、关键词、人物共现等,将这一技术应用在古籍文本大数据中,对弘扬中华优秀传统文化具有重要意义。基于python爬虫技术进行文本采集,进行一系列数据处理操作。通过TF-IDF算法计算词频统计,从而确定文本主题内容,并借助matplotlib生成关键词云图进行可视化分析。创建人物节点并计算各个结点之间的权值生成人物关系网状图;进一步探索网络的重要节点排序方法,寻找更大程度上影响网络的架构层次以及功能的部分特殊节点,节点可以是人亦是物。通过人们对古籍文本的评论内容进行分词处理,在此基础之上使用词性标注以便于情感分析,达到分析文化认可度的目的。知识图谱可以对知识层次间关系的多组不一样的图片做出展览,从而可以将技术可视化。 展开更多
关键词 自然语言处理技术 词云图 情感分析 人物关系网络图 知识图谱构建
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部