期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
基于样本权重的不平衡数据欠抽样方法 被引量:43
1
作者 熊冰妍 王国胤 邓维斌 《计算机研究与发展》 EI CSCD 北大核心 2016年第11期2613-2622,共10页
现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此... 现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此提出了一种基于样本权重的欠抽样方法KAcBag(K-means AdaCost bagging),该方法引入了样本权重来反映样本所处的区域,首先根据各类样本的数量初始化各样本权重,并通过多次聚类对各个样本的权重进行修改,权重小的多数类样本即处于多数类的中心区域;然后按权重大小对多数类样本进行欠抽样,使位于中心区域的样本较容易被抽中,并与所有少数类样本组成bagging成员分类器的训练数据,得到若干个决策树子分类器;最后根据各子分类器的正确率进行加权投票生成预测模型.对19组UCI数据集和某电信运营商客户换机数据进行了测试实验,实验结果表明:KAcBag方法使抽样所得的样本具有较强的代表性,能有效提高少数类的分类性能并缩小问题规模. 展开更多
关键词 不平衡数据 欠抽样 样本权重 聚类 集成学习
下载PDF
基于PSO-PLS的组合预测方法在GDP预测中的应用 被引量:21
2
作者 肖智 吴慰 《管理科学》 CSSCI 2008年第3期115-120,F0003,共7页
GDP预测是经济预测中一个非常重要的问题,随着经济的发展,对其预测精度的要求也越来越高。在考虑样本权重的基础上,提出一种微粒群算法与部分最小二乘回归方法相结合的组合预测方法,即采用微粒群方法对样本最优权重进行求解,在所得样本... GDP预测是经济预测中一个非常重要的问题,随着经济的发展,对其预测精度的要求也越来越高。在考虑样本权重的基础上,提出一种微粒群算法与部分最小二乘回归方法相结合的组合预测方法,即采用微粒群方法对样本最优权重进行求解,在所得样本权重系数的基础上,用部分最小二乘回归方法确定组合预测的权重系数。将该方法用于中国GDP预测取得了较好的结果,与其他几种传统方法相比,预测精度有一定程度的提高,说明算法的有效性和可行性。 展开更多
关键词 微粒群算法 部分最小二乘回归 组合预测 样本权重 GDP
原文传递
复杂抽样数据的logistic回归分析方法及其应用 被引量:19
3
作者 缪凡 童峰 《中国卫生统计》 CSCD 北大核心 2008年第6期577-579,共3页
目的探讨抽样权重在复杂抽样数据logistic回归分析中的重要性。方法采用SAS中PROC LOGIS-TIC和PROC SURVEYLOGISTIC语句对数据进行统计分析,并对结果进行比较。结果在未考虑和考虑抽样权重的lo-gistic回归模型拟合结果中,自变量的偏回... 目的探讨抽样权重在复杂抽样数据logistic回归分析中的重要性。方法采用SAS中PROC LOGIS-TIC和PROC SURVEYLOGISTIC语句对数据进行统计分析,并对结果进行比较。结果在未考虑和考虑抽样权重的lo-gistic回归模型拟合结果中,自变量的偏回归系数和OR值大小及其可信区间都有所不同。结论在logistic模型拟合中,纳入调查数据的抽样权重进行统计分析,从而能更加准确地进行统计推断。 展开更多
关键词 LOGISTIC回归分析 抽样权重 复杂抽样
下载PDF
全自动凯氏定氮仪测定大米蛋白质 被引量:17
4
作者 郭应时 曹小彦 +2 位作者 邹杭君 郭明义 张威 《食品与机械》 CSCD 北大核心 2017年第11期67-71,共5页
研究全自动凯氏定氮仪测定大米蛋白质的方法,通过考查样品质量、硫酸添加量、消化温度、消化时间等关键因素,确定最佳试验条件。结果表明:当样品质量为0.40g,硫酸添加量为12 mL,消化温度为420℃,消化时间为50 min时,5种大米蛋白质测定值... 研究全自动凯氏定氮仪测定大米蛋白质的方法,通过考查样品质量、硫酸添加量、消化温度、消化时间等关键因素,确定最佳试验条件。结果表明:当样品质量为0.40g,硫酸添加量为12 mL,消化温度为420℃,消化时间为50 min时,5种大米蛋白质测定值(n=6)的标准偏差为0.050 2~0.101 1,尿素的氮回收率为99.9%~100.5%,该法与微量蒸馏法测定蛋白质结果的比值为1.023 4~1.079 4,测定时间缩短到1h。说明该方法稳定、准确、快速。 展开更多
关键词 蛋白质 全自动凯氏定氮仪 样品质量 硫酸添加量 消化温度 消化时间
下载PDF
一种基于SVM的非均衡数据集过采样方法 被引量:15
5
作者 张忠林 冯宜邦 赵中恺 《计算机工程与应用》 CSCD 北大核心 2020年第23期220-228,共9页
针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on... 针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法易剔除重要样本信息。基于此提出一种基于SVM的不平衡数据过采样方法SVMOM(Oversampling Method Based on SVM)。SVMOM通过迭代合成样本。在迭代过程中,通过SVM得到分类超平面;根据每个少数类样本到分类超平面的距离赋予样本距离权重;同时考虑少数类样本的类内平衡,根据样本的分布计算样本的密度,赋予样本密度权重;依据样本的距离权重和密度权重计算每个少数类样本的选择权重,根据样本的选择权重选择样本运用SMOTE合成新样本,达到平衡数据集的目的。实验结果表明,提出的算法在一定程度上解决了分类结果偏向多数类的问题,验证了算法的有效性。 展开更多
关键词 不平衡数据 支持向量机(SVM) 过采样 样本权重 合成少数类过采样技术(SMOTE)
下载PDF
基于轮廓波变换和改进模糊c均值聚类的红外图像分割 被引量:13
6
作者 刘刚 梁晓庚 张京国 《系统工程与电子技术》 EI CSCD 北大核心 2011年第2期443-448,共6页
针对红外图像分辨率低、对比度弱、易受噪声污染等特点,给出了轮廓波变换与模糊c均值聚类相结合的红外图像分割方法。该方法首先在假定图像轮廓波变换系数的先验为高斯分布的基础上,将基于最大后验概率准则的比例萎缩法应用于红外图像降... 针对红外图像分辨率低、对比度弱、易受噪声污染等特点,给出了轮廓波变换与模糊c均值聚类相结合的红外图像分割方法。该方法首先在假定图像轮廓波变换系数的先验为高斯分布的基础上,将基于最大后验概率准则的比例萎缩法应用于红外图像降噪,以完成分割前的预处理过程,然后利用改进的模糊c均值算法对降噪后的红外图像进行分割。针对标准模糊c均值分割存在的问题,本文提出的方法从基于样本直方图的最小最大距离法的初始聚类中心确定、考虑邻域像素相关性的样本点聚类权值和邻域隶属度修正三个方面加以改进,在保证分割精度的基础上,进一步滤除降噪阶段遗留下的图像噪声。对一系列红外图像进行实验的结果表明,相对于标准模糊c均值算法,本文提出的改进算法划分熵平均降低约10%,区域对比度提高约27%,能够实现对受到噪声污染红外图像的有效分割。 展开更多
关键词 红外图像分割 轮廓波降噪 最大后验概率 模糊C均值聚类 聚类中心 样本权值
下载PDF
动态数据约简的神经网络分类器训练方法研究 被引量:6
7
作者 刘威 刘尚 +2 位作者 白润才 周璇 周定宁 《智能系统学报》 CSCD 北大核心 2017年第2期258-265,共8页
针对神经网络分类器训练时间长、泛化能力差的问题,提出了一种基于动态数据约简的神经网络分类器训练方法(DDR)。该训练方法在训练过程中赋给每个训练样本一个权重值作为样本的重要性度量,依据每次网络迭代训练样本的分类错误率动态更... 针对神经网络分类器训练时间长、泛化能力差的问题,提出了一种基于动态数据约简的神经网络分类器训练方法(DDR)。该训练方法在训练过程中赋给每个训练样本一个权重值作为样本的重要性度量,依据每次网络迭代训练样本的分类错误率动态更新每个训练样本的权重值,之后依据样本的权重值来约简训练样本,从而增加易错分类的边界样本比重,减少冗余核样本的作用。数值实验表明,基于权重的动态数据约简神经网络训练方法不仅大幅缩短了网络的训练时间,而且还能够显著提升网络的分类泛化能力。 展开更多
关键词 神经网络 数据约简 分类边界 样本权重 边界样本 核样本
下载PDF
基于样本密度峰值的不平衡数据欠抽样方法 被引量:7
8
作者 苏俊宁 叶东毅 《计算机应用》 CSCD 北大核心 2020年第1期83-89,共7页
不平衡数据分类是数据挖掘和机器学习领域的一个重要问题,其中数据重抽样方法是影响分类准确率的一个重要因素。针对现有不平衡数据欠抽样方法不能很好地保持抽样样本与原有样本的分布一致的问题,提出一种基于样本密度峰值的不平衡数据... 不平衡数据分类是数据挖掘和机器学习领域的一个重要问题,其中数据重抽样方法是影响分类准确率的一个重要因素。针对现有不平衡数据欠抽样方法不能很好地保持抽样样本与原有样本的分布一致的问题,提出一种基于样本密度峰值的不平衡数据欠抽样方法。首先,应用密度峰值聚类算法估计多数类样本聚成的不同类簇的中心区域和边界区域,进而根据样本所处类簇区域的局部密度和不同密度峰值的分布信息计算样本权重;然后,按照权重大小对多数类样本点进行欠抽样,使所抽取的多数类样本尽可能由类簇中心区域向边界区域逐步减少,在较好地反映原始数据分布的同时又可抑制噪声;最后,将抽取到的多数类样本与所有的少数类样本构成平衡数据集用于分类器的训练。多个数据集上的实验结果表明,与现有的RBBag、uNBBag和KAcBag等欠抽样方法相比,所提方法在F1-measure和G-mean指标上均取得一定的提升,是有效、可行的样本抽样方法。 展开更多
关键词 不平衡数据 密度峰值 样本权重 欠抽样 集成学习
下载PDF
烘箱温度和干燥时间对烟丝水分检测结果的影响 被引量:7
9
作者 郑松锦 段海涛 +3 位作者 任志强 张晓静 刘玉斌 刘柏松 《食品工业》 CAS 北大核心 2016年第5期104-109,共6页
为了考察烘箱温度和烘箱干燥时间对烟丝水分结果的影响及与卡尔费休法水分的关系,采用烘箱法对不同的样品量、烘箱温度及烘箱干燥时间对烟丝水分结果的影响进行测定,结果表明:1在试验范围内,随着样品量的增加,烟丝水分检测结果标准偏差... 为了考察烘箱温度和烘箱干燥时间对烟丝水分结果的影响及与卡尔费休法水分的关系,采用烘箱法对不同的样品量、烘箱温度及烘箱干燥时间对烟丝水分结果的影响进行测定,结果表明:1在试验范围内,随着样品量的增加,烟丝水分检测结果标准偏差逐减小;2烟丝水分检测结果与烘箱温度、烘箱干燥时间的自然对数及卡尔费休法水分成线性关系;3当样品表观水分与卡尔费休法水分相等时,烘箱温度及其对应烘箱干燥时间存在一定的关系;利用该关系可以快捷准确检测烟丝水分,极大减少检测时间。 展开更多
关键词 烘箱温度 烘箱干燥时间 烟丝 水分检测 样品量
原文传递
一种测定土壤反硝化酶的改进方法 被引量:3
10
作者 韩建刚 白红英 +2 位作者 朱咏莉 李世清 曲东 《农业环境保护》 CSCD 北大核心 2002年第4期349-351,共3页
介绍了一种新的测定土壤反硝化酶的装置,使土壤反硝化酶(硝酸还原酶、亚硝酸还原酶)的测定更加简便、灵敏、准确。对3种不同质地的土壤从影响土壤反硝化酶活性的3种关键因素:培养时间、称样量和真空度方面进行了研究。结果表明,土壤反... 介绍了一种新的测定土壤反硝化酶的装置,使土壤反硝化酶(硝酸还原酶、亚硝酸还原酶)的测定更加简便、灵敏、准确。对3种不同质地的土壤从影响土壤反硝化酶活性的3种关键因素:培养时间、称样量和真空度方面进行了研究。结果表明,土壤反硝化酶的最佳培养时间为24—27h,称样量与真空度因酶而异。 展开更多
关键词 土壤 反硝化酶 改进方法 硝酸还原酶 亚硝酸还原酶 培养时间 称样量 真空度 测定
下载PDF
基于PGNAA技术的煤炭成分在线检测中样品重量的影响及修正 被引量:6
11
作者 贾文宝 黑大千 +2 位作者 徐爱国 陈晓文 李安民 《原子能科学技术》 EI CAS CSCD 北大核心 2011年第8期1011-1014,共4页
利用瞬发γ中子活化分析(PGNAA)技术的煤炭成分在线检测系统(MJA),对不同的煤炭样品进行实验测试,通过对不同重量煤样的实验谱进行分析研究,提出了容重补偿模型,利用修正函数校正了样品重量变化对测量结果的影响。经实验验证,模型切实可... 利用瞬发γ中子活化分析(PGNAA)技术的煤炭成分在线检测系统(MJA),对不同的煤炭样品进行实验测试,通过对不同重量煤样的实验谱进行分析研究,提出了容重补偿模型,利用修正函数校正了样品重量变化对测量结果的影响。经实验验证,模型切实可行,能满足生产现场要求。 展开更多
关键词 PGNAA 在线检测 样品重量 修正函数
下载PDF
AdaBoost的样本权重与组合系数的分析及改进 被引量:5
12
作者 朱亮 徐华 +1 位作者 成金海 朱深 《计算机应用》 CSCD 北大核心 2022年第7期2022-2029,共8页
针对自适应增强(AdaBoost)算法的基分类器线性组合效率低以及过度关注难分样本的问题,提出了基于间隔理论的两种改进算法WPIAda与WPIAda.M。首先,WPIAda与WPIAda.M算法都将样本权值的更新分为四种情形,从而增加间隔从正到负变化的样本... 针对自适应增强(AdaBoost)算法的基分类器线性组合效率低以及过度关注难分样本的问题,提出了基于间隔理论的两种改进算法WPIAda与WPIAda.M。首先,WPIAda与WPIAda.M算法都将样本权值的更新分为四种情形,从而增加间隔从正到负变化的样本权值来抑制间隔的负向移动,并减少间隔处于零点的样本数量;其次,WPIAda.M算法根据基分类器的错误率与样本权重的分布状态,给出新的基分类器系数求解方法,从而提高基分类器的组合效率。在10个UCI数据集上,与dfAda、skAda、swaAda等算法相比,WPIAda和WPIAda.M算法的测试误差分别平均降低了7.46个百分点和7.64个百分点;AUC分别提高了11.65个百分点和11.92个百分点。实验结果表明,WPIAda和WPIAda.M算法可以有效降低对难分样本的关注,并且WPIAda.M算法能够更高效地集成基分类器,因此两种算法均可进一步提高分类性能。 展开更多
关键词 自适应增强 间隔理论 样本权重 基分类器 组合效率
下载PDF
基于合群度-隶属度噪声检测及动态特征选择的改进AdaBoost算法 被引量:5
13
作者 王友卫 凤丽洲 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2021年第2期367-376,共10页
为了提高AdaBoost集成学习算法的数据分类性能,提出基于合群度-隶属度噪声检测及动态特征选择的改进AdaBoost算法.综合考虑待检测样本与邻居样本的相似度及与不同类别样本集的隶属关系,引入合群度和隶属度的概念,提出新的噪声检测方法.... 为了提高AdaBoost集成学习算法的数据分类性能,提出基于合群度-隶属度噪声检测及动态特征选择的改进AdaBoost算法.综合考虑待检测样本与邻居样本的相似度及与不同类别样本集的隶属关系,引入合群度和隶属度的概念,提出新的噪声检测方法.在此基础上,为了更好地选择那些能够有效区分错分样本的特征,在传统过滤器特征选择方法的基础上提出通用的结合样本权重的动态特征选择方法,以提高AdaBoost算法针对错分样本的分类能力.以支持向量机作为弱分类器,在8个典型数据集上分别从噪声检测、特征选择及现有方法比较3个方面进行实验.结果表明,所提算法充分考虑了噪声样本和样本权重对AdaBoost分类结果的影响,相对于传统算法在分类性能上获得显著提升. 展开更多
关键词 集成学习 数据分类 噪声检测 特征选择 样本权重
下载PDF
元素分析仪法在石油焦中碳氢氮检测的应用 被引量:5
14
作者 王霞 相湛昌 +1 位作者 姜涛 田发亮 《煤质技术》 2017年第1期35-38,共4页
基于元素分析仪红外热导法对石油焦的检测并未广泛应用,介绍了仪器原理及相应的分析方法,并从仪器参数、校准参数、通氧参数、试样量等方面对其测定准确性与精密度进行验证。试验结果表明,元素分析仪法可以测定石油焦中碳、氢、氮元素含... 基于元素分析仪红外热导法对石油焦的检测并未广泛应用,介绍了仪器原理及相应的分析方法,并从仪器参数、校准参数、通氧参数、试样量等方面对其测定准确性与精密度进行验证。试验结果表明,元素分析仪法可以测定石油焦中碳、氢、氮元素含量,分析时试样量80mg,依次按30s×30mL/min、300s×150 mL/min的方式通氧,精确值可达0.1 mg,该分析方法简单、快速、准确。 展开更多
关键词 石油焦 元素分析仪法 仪器参数 校准参数 通氧参数 试样量
下载PDF
用电量-重量法测定固体生物质燃料中碳氢的研究 被引量:4
15
作者 任祥军 金红 +2 位作者 戴昭斌 王剑 康宁 《煤质技术》 2017年第3期29-37,共9页
通过选取麦秸、棉秆、稻秆、竹粉、锯末、花生壳、稻壳、玉米秆、油菜秆和树皮等10种有代表性的固体生物质燃料样品,通过正交试验和不同实验室的协同试验,选取不同的试验条件,对电量-重量法测定固体生物质燃料中碳氢测定的精密度和准确... 通过选取麦秸、棉秆、稻秆、竹粉、锯末、花生壳、稻壳、玉米秆、油菜秆和树皮等10种有代表性的固体生物质燃料样品,通过正交试验和不同实验室的协同试验,选取不同的试验条件,对电量-重量法测定固体生物质燃料中碳氢测定的精密度和准确度进行了试验研究,并与现行国标GB/T 28734—2012测定结果进行比较。研究结果表明,选用80mL/min氧气流量、6min进样时间、0.065g试样质量、三氧化钨为催化剂等适宜的试验条件,采用电量-重量法可准确测得固体生物质燃料中稳定可靠的碳氢结果。 展开更多
关键词 电量-重量法 固体生物质燃料 正交试验 精密度 准确度 氧气流量 进样时间 试样质量 三氧化钨 均匀性检验
下载PDF
Fault Diagnosis Model Based on Fuzzy Support Vector Machine Combined with Weighted Fuzzy Clustering 被引量:3
16
作者 张俊红 马文朋 +1 位作者 马梁 何振鹏 《Transactions of Tianjin University》 EI CAS 2013年第3期174-181,共8页
A fault diagnosis model is proposed based on fuzzy support vector machine (FSVM) combined with fuzzy clustering (FC).Considering the relationship between the sample point and non-self class,FC algorithm is applied to ... A fault diagnosis model is proposed based on fuzzy support vector machine (FSVM) combined with fuzzy clustering (FC).Considering the relationship between the sample point and non-self class,FC algorithm is applied to generate fuzzy memberships.In the algorithm,sample weights based on a distribution density function of data point and genetic algorithm (GA) are introduced to enhance the performance of FC.Then a multi-class FSVM with radial basis function kernel is established according to directed acyclic graph algorithm,the penalty factor and kernel parameter of which are optimized by GA.Finally,the model is executed for multi-class fault diagnosis of rolling element bearings.The results show that the presented model achieves high performances both in identifying fault types and fault degrees.The performance comparisons of the presented model with SVM and distance-based FSVM for noisy case demonstrate the capacity of dealing with noise and generalization. 展开更多
关键词 FUZZY support VECTOR machine FUZZY clustering sample weight GENETIC algorithm parameter optimization FAULT diagnosis
下载PDF
苎麻回潮率和含水率试验方法中烘燥时间的优化研究
17
作者 甘丹 罗凤香 +2 位作者 胡小蓉 陈雯 刘芳 《中国纤检》 2024年第8期70-75,共6页
GB/T 5883—1986《苎麻回潮率、含水率试验方法》已无法满足苎麻公证检验需求,大大阻碍了苎麻产业发展。本文通过试验研究苎麻低湿样品、高湿样品的失重与烘燥时间关系,确定苎麻低湿样品、高湿样品的回潮率、含水率试验的烘燥时间、参... GB/T 5883—1986《苎麻回潮率、含水率试验方法》已无法满足苎麻公证检验需求,大大阻碍了苎麻产业发展。本文通过试验研究苎麻低湿样品、高湿样品的失重与烘燥时间关系,确定苎麻低湿样品、高湿样品的回潮率、含水率试验的烘燥时间、参考始称时间,从而为标准修订提供建议参考。 展开更多
关键词 苎麻 试样质量 烘燥温度 烘燥时间 回潮率 含水率
下载PDF
页岩油气勘探中热解分析与总有机碳预测 被引量:4
18
作者 徐学敏 杨佳佳 +7 位作者 孙玮琳 沈斌 张小涛 秦婧 栗敏 许智超 胡才志 郭望 《中国石油大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第4期22-29,共8页
岩石热解可快速提供总有机碳含量(TOC)等表征有机质丰度的指标,是页岩气评价的重要技术手段之一,但页岩岩石热解测定中发现有TOC数据存疑的问题。本次通过不同岩性样品,研究称样量对热解测定TOC的影响,并确定合理的称样量范围。结果表明... 岩石热解可快速提供总有机碳含量(TOC)等表征有机质丰度的指标,是页岩气评价的重要技术手段之一,但页岩岩石热解测定中发现有TOC数据存疑的问题。本次通过不同岩性样品,研究称样量对热解测定TOC的影响,并确定合理的称样量范围。结果表明:对于TOC含量较高的样品(w(TOC_(QC34))=16.82%),称样量需小于92.1 mg,否则热解测定TOC会低于真实值;对于TOC含量较低的样品(w(TOC_(QC03))=0.33%;w(TOC_(QC05))=0.54%),若称样量低于54.2 mg,将无法获得稳定的TOC数据;对于中等有机质丰度的样品(w(TOC_(QC30))=1.42%;w(TOC_(IFP160000))=3.28%),在14.4~94.7 mg的称样范围内,均能获得满意的测试结果。 展开更多
关键词 岩石热解 页岩 总有机碳 称样量
下载PDF
基于预训练模型的多音字消歧方法
19
作者 高贝贝 张仰森 《计算机科学》 CSCD 北大核心 2024年第11期273-279,共7页
字音转换是中文语音合成系统(Text-To-Speech,TTS)的重要组成部分,其核心问题是多音字消歧,即在若干候选读音中为多音字选择一个正确的发音。现有的方法通常无法充分理解多音字所在词语的语义,且多音字数据集存在分布不均衡的问题。针... 字音转换是中文语音合成系统(Text-To-Speech,TTS)的重要组成部分,其核心问题是多音字消歧,即在若干候选读音中为多音字选择一个正确的发音。现有的方法通常无法充分理解多音字所在词语的语义,且多音字数据集存在分布不均衡的问题。针对以上问题,提出了一种基于预训练模型RoBERTa的多音字消歧方法CLTRoBERTa(Cross-lingual Translation RoBERTa)。首先联合跨语言互译模块获得多音字所在词语的另一种语言翻译,并将其作为额外特征输入模型以提升对词语的语义理解,然后使用判别微调中的层级学习率优化策略来适应神经网络不同层之间的学习特性,最后结合样本权重模块以解决多音字数据集的分布不均衡问题。CTLRoBERTa平衡了数据集的不均衡分布带来的性能差异,并且在CPP(Chinese Polyphone with Pinyin)基准数据集上取得了99.08%的正确率,性能优于其他基线模型。 展开更多
关键词 多音字消歧 预训练模型 字音转换 跨语言互译 层级学习率 样本权重
下载PDF
钾盐矿床中含石膏盐样品测定的质量控制方法改进 被引量:3
20
作者 王洋 张露露 +1 位作者 王艳超 张晶 《中国无机分析化学》 CAS 2019年第6期35-40,共6页
由于现行标准中没有直接针对含石膏钾盐样品分析的方法,同时没有国家一级有证标准物质进行质量监控,因此在测定含石膏钾盐样品时较为困难。为提高含石膏盐样品分析结果的准确度、精密度,采用不同的溶矿温度、称样量、以及放置时间对含... 由于现行标准中没有直接针对含石膏钾盐样品分析的方法,同时没有国家一级有证标准物质进行质量监控,因此在测定含石膏钾盐样品时较为困难。为提高含石膏盐样品分析结果的准确度、精密度,采用不同的溶矿温度、称样量、以及放置时间对含石膏钾盐样品溶解方法进行实验。得出在称样量为0.5000 g、水温80℃、放置时间为24 h时,用电感耦合等离子体发射光谱法测定,通过样品中各组分百分数加和、溶液中元素阴阳离子平衡以及加标回收实验进行数据质量监控。实验结果满足《地质矿产实验室测试质量管理规范》对钾盐样品分析质量的要求。为钾盐勘查提供准确的数据支撑。 展开更多
关键词 含石膏盐 溶矿温度 称样量 放置时间 质量监控
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部