-
题名数据挖掘课程教学模式改革与探索
被引量:4
- 1
-
-
作者
朱毅
李云
强继朋
袁运浩
-
机构
扬州大学信息工程学院
-
出处
《科教文汇》
2021年第18期108-109,共2页
-
文摘
数据挖掘课程内容复杂抽象,各个章节之间独立性较强,传统的课堂教学方法无法指导实际问题的解决,且验证性实验较难开展。针对这些问题,该文提出以实际案例为导向,通过案例讲解辅助教学,从课堂讲授和实际数据集实验两个方向开展教学活动,并结合具体的项目实践,介绍数据挖掘方法的应用局限性,旨在培养学生独立思考和解决问题的能力,以此改进数据挖掘课程的教学模式。
-
关键词
数据挖掘
实际案例
教学改革
-
Keywords
data mining
actual cases
teaching reform
-
分类号
G642.4
[文化科学—高等教育学]
-
-
题名基于prompt的文本可读性评估
- 2
-
-
作者
冯宇涛
强继朋
李云
袁运浩
朱毅
-
机构
扬州大学信息工程学院
-
出处
《扬州大学学报(自然科学版)》
CAS
北大核心
2023年第3期56-60,共5页
-
基金
国家自然科学基金资助项目(62076217,61906060)
扬州大学“青蓝工程”资助项目。
-
文摘
为了提高预训练模型在文本可读性分类中的表现,提出基于预训练模型BERT(bidirectional encoder representations from transformers)和GPT2(generative pre-training 2)的prompt文本可读性分类方法,通过手工模板和映射器将文本可读性分类转换为与模型预训练任务一致的文本填空形式,以此提高预训练模型的分类性能.实验表明,prompt方法在实验数据集上与传统机器学习和有监督的神经网络相比具有更好的分类性能.
-
关键词
文本可读性分类
预训练模型
手工模板
-
Keywords
text readability classification
pre-trained models
manual prompts
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名基于提示学习的中文短文本分类方法
被引量:3
- 3
-
-
作者
穆建媛
朱毅
周鑫柯
李云
强继朋
袁运浩
-
机构
扬州大学计算机科学与技术系
-
出处
《中文信息学报》
CSCD
北大核心
2023年第7期82-90,共9页
-
基金
国家自然科学基金(61906060,62076217)。
-
文摘
伴随着互联网的飞速发展,产生了海量以微博、推特等为代表的少于100字的短文本数据,这些文本长度极短、特征稀疏、语义不足,因此给短文本分类问题带来了巨大挑战。现有的中文短文本分类方法往往需要大量的有标签或无标签的数据,但在实际应用中,大量的训练数据往往难以获取,且成本很高。为此,该文提出了一种基于提示学习的中文短文本分类方法,适用于少样本状况下的短文本分类。实验结果表明,该方法在仅使用少样本训练数据的情况下比使用大量训练数据的其他模型表现更好。具体来说,该文手工设计了模板,将使用了模板的原始数据替换为含有mask的文本作为新的输入,最终取得了较好的分类效果。通过对4个基准数据集进行验证,基于提示学习的分类方法在仅有40个训练样本的情况下比BERT预训练语言模型使用740个样本的准确率高出近6%。
-
关键词
短文本分类
提示学习
少样本
-
Keywords
short text classification
prompt learning
few shot
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征分布校准的小样本分类改进算法
- 4
-
-
作者
张涛
王波
赵宇
袁运浩
-
机构
扬州大学信息工程学院
-
出处
《扬州大学学报(自然科学版)》
CAS
2024年第1期56-61,共6页
-
基金
江苏省自然科学基金资助项目(BK20200921)
江苏省高等学校自然科学基金资助项目(20KJB520007,20KJB510024)。
-
文摘
针对基于特征分布校准的小样本分类算法无法准确揭示新类特征分布的问题,提出一种融合隐空间变换和密度聚类的改进算法,以解决N way-K shot任务模式下的小样本图像分类问题.首先,通过广度残差神经网络提取基类和新类图像的深度特征;其次,采用隐空间变换方法约束新类特征分布,使其更接近正态分布;再次,利用密度聚类方法为新类选取合适基类,将基类统计信息迁移到新类,并通过多元正态分布矩阵实现样本扩充;最后,构建基于集成学习的分类器,完成小样本图像分类任务.实验结果表明,相比于传统特征分布校准方法,该算法的分类准确率更高.
-
关键词
小样本学习
图像分类
特征分布校准
隐空间变换
密度聚类
-
Keywords
few-shot learning
image classification
feature distribution calibration
latent space transform
density-based spatial clustering
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-