期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于逻辑回归算法的异常用电辨识方法研究 被引量:16
1
作者 袁翔宇 张蓬鹤 +2 位作者 熊素琴 赵波 成达 《电测与仪表》 北大核心 2021年第12期81-87,共7页
检测异常用电的目的是打击异常用电,并减少电能的非技术性损失。文中提出了一种基于逻辑回归算法的异常用电辨识方法,主要包括特征提取、算法构建以及检验模型等模块。提取电网用电量等相关数据,并从数据集中提取出电量下降趋势指标、... 检测异常用电的目的是打击异常用电,并减少电能的非技术性损失。文中提出了一种基于逻辑回归算法的异常用电辨识方法,主要包括特征提取、算法构建以及检验模型等模块。提取电网用电量等相关数据,并从数据集中提取出电量下降趋势指标、线损指标和告警类指标用作异常用电评判体系。进行电量下降趋势指标、线损指标和告警类指标的归一化处理,再进行离群邻近度的计算,初步筛选异常用电用户。对初步筛选的结果进行逻辑回归算法的再次筛选,进一步提高识别准确率。经过电网部分用电数据的检验后,该算法相较于逻辑回归算法,识别率更高,识别效果更好。 展开更多
关键词 异常用电 离群算法 离群邻近度 逻辑回归 学习速率
下载PDF
稳健改进的AO型异常点检测法在金融时序中的应用 被引量:12
2
作者 王志坚 王斌会 《数理统计与管理》 CSSCI 北大核心 2016年第2期369-380,共12页
针对金融时间序列数据易受外界突发事件干扰而产生连续性异常点的特点,本文首先分析了Chang,Tiao和Chen(1988)^([11])提出的金融时间序列AO型异常点检测法的不稳健性,并对其进行稳健改进得到稳健检测统计量,而且在理论上证明了改进检测... 针对金融时间序列数据易受外界突发事件干扰而产生连续性异常点的特点,本文首先分析了Chang,Tiao和Chen(1988)^([11])提出的金融时间序列AO型异常点检测法的不稳健性,并对其进行稳健改进得到稳健检测统计量,而且在理论上证明了改进检测统计量的优良性;随后模拟了五种污染率下的时序数据,分别用三种检测法对其中的异常点进行检测,发现稳健检测法准确率最高;最后用R语言对上海黄金交易所2008年1月2日至2013年3月29日含金量为99.99%的黄金交易收益率的异常现象进行稳健检测,结果显示本文提出的稳健检测法比传统的检测法对异常点检测能力显著提高,并且能更好的捕捉到我国金融市场的异常特点。该方法不仅对于金融风险的研究具有理论上的意义而且对金融时间序列的稳健建模具有一定的参考价值。 展开更多
关键词 金融时序 AO型异常点 稳健检测 收益率
原文传递
超敏肌钙蛋白Ⅰ在心肌炎诊断中的临床意义 被引量:8
3
作者 杨益梅 孙长江 《检验医学与临床》 CAS 2011年第24期2964-2965,共2页
目的旨在通过超敏肌钙蛋白Ⅰ(TropI)和传统肌钙蛋白I(cTnI)检测方法的比较,探讨其在心肌炎诊断中的临床意义。方法收集2009~2010年30例门诊和住院患者血液标本,检测血清肌钙蛋白值,比较两种方法的精密性、相关性、阳性率以及离散率。结... 目的旨在通过超敏肌钙蛋白Ⅰ(TropI)和传统肌钙蛋白I(cTnI)检测方法的比较,探讨其在心肌炎诊断中的临床意义。方法收集2009~2010年30例门诊和住院患者血液标本,检测血清肌钙蛋白值,比较两种方法的精密性、相关性、阳性率以及离散率。结果 TropI的变异系数(CV)(6.948%)明显低于cTnI(18.190%),两种方法检测肌钙蛋白的均值与相应的质控靶值比较差异无统计学意义(P>0.05)。对这两种方法检测的结果进行回归分析显示相关性良好(r2=0.981 2);两种方法检测患者血清cTnI组平均CV值(7.655%)高于TropI组平均CV值(2.116%),差异有统计学意义(P<0.01)。结论两种方法在检测血清肌钙蛋白的作用上基本一致,但是Tropi在重复性方面优于传统的cTnI检测,可能更有利于心肌炎的诊断。 展开更多
关键词 肌钙蛋白Ⅰ 精密度 相关性 离散率 心肌炎
下载PDF
基于时间序列分析的在线离群点校正方法
4
作者 王春鹏 《氮肥技术》 CAS 2024年第2期37-40,共4页
随着合成氨项目的大型化和自动化,现场远传仪表数量越来越多,部分仪表因自身的故障导致测量数据失常,这部分检测的数据称之为离群点。在软测量模型仿真过程中,离群点对建模精度产生较大影响。本文通过引用时间序列校正算法来对检测出来... 随着合成氨项目的大型化和自动化,现场远传仪表数量越来越多,部分仪表因自身的故障导致测量数据失常,这部分检测的数据称之为离群点。在软测量模型仿真过程中,离群点对建模精度产生较大影响。本文通过引用时间序列校正算法来对检测出来的离群点进行校正,以氨合成项目中氨净值作为数据进行仿真研究,表明时间序列分析能很好的对离群点进行校正且能有效的提高模型的预测精度。 展开更多
关键词 离群点 贡献率 校正 氨净值 仿真
原文传递
无线传感网中一种基于支持向量机的异常事件检测方案 被引量:4
5
作者 李力 《计算机应用与软件》 CSCD 2015年第2期272-277,共6页
异常事件检测问题是无线传感器网络中的研究热点之一。针对现有检测方案的不足,设计一种新的时间-空间-属性单类超球面支持向量机来建模异常事件检测问题,然后提出无线传感器网络在线和部分在线离群点检测算法。该算法根据节点间的时间... 异常事件检测问题是无线传感器网络中的研究热点之一。针对现有检测方案的不足,设计一种新的时间-空间-属性单类超球面支持向量机来建模异常事件检测问题,然后提出无线传感器网络在线和部分在线离群点检测算法。该算法根据节点间的时间-空间和属性关联度确定超球面的半径,最后以在线方式鉴别到达节点的每一个新的测量值是正常数据还是异常数据。仿真实验结果表明,与基于时空关联度的超球面支持向量机相比,新算法的检测率大大上升,虚警率明显下降。同时,部分在线算法与在线算法的效率相当,大大降低了计算和通信复杂度。 展开更多
关键词 无线传感器网络 异常事件 支持向量机 在线检测 离群点 检测率
下载PDF
两参数Weibull分布基于BLUE的异常数据检验 被引量:4
6
作者 王蓉华 徐晓岭 顾蓓青 《统计与决策》 CSSCI 北大核心 2017年第24期5-9,共5页
文章针对样本数据服从两参数Weibull分布,定数截尾样本中出现异常数据的检验问题,定义了次序统计量的贡献率,利用参数σ的最佳线性无偏估计(BLUE)构造了检验统计量,并通过Monte-Carlo模拟得到了检验统计量分布的分位数,给出了异常数据... 文章针对样本数据服从两参数Weibull分布,定数截尾样本中出现异常数据的检验问题,定义了次序统计量的贡献率,利用参数σ的最佳线性无偏估计(BLUE)构造了检验统计量,并通过Monte-Carlo模拟得到了检验统计量分布的分位数,给出了异常数据的疑似个数,最后通过两个实例说明所给出的方法是可行的。 展开更多
关键词 异常数据检验 两参数WEIBULL分布 最佳线性无偏估计 贡献率
下载PDF
基于IF-CM-LOF的尾矿坝位移监测数据离群值诊断 被引量:2
7
作者 易思成 康喜明 +1 位作者 吴浩 胡少华 《金属矿山》 CAS 北大核心 2022年第11期208-215,共8页
为解决孤立森林(IF)算法在离群值识别过程中对于边界位置数据处理结果的模糊性和不确定性问题,提高监测数据中异常值的检出率,在使用IF算法进行离群值初步识别的基础上,将IF量化计算后的异常得分引作变量,导入云模型(CM)逆向云发生器,... 为解决孤立森林(IF)算法在离群值识别过程中对于边界位置数据处理结果的模糊性和不确定性问题,提高监测数据中异常值的检出率,在使用IF算法进行离群值初步识别的基础上,将IF量化计算后的异常得分引作变量,导入云模型(CM)逆向云发生器,根据逆向云变换所得的云数字特征值实现边界数据定位,进一步引入局部异常因子(LOF)算法对所定位的边界数据进行二次精确诊断,以某尾矿坝地表位移监测数据为例进行了模型验证。研究结果表明:对于监测数据中真实异常值和边界部分随机误差,IF模型检出率为16.5%和22.2%,而IF-CM-LOF模型的检出率分别达到90%和61.1%,离群值诊断性能明显优于IF模型。 展开更多
关键词 尾矿坝 离群值 监测数据 检出率 IF-CM-LOF
下载PDF
Outlier detection by means of robust regression estimators for use in engineering science 被引量:2
8
作者 Serif HEKIMOGLU R. Cuneyt ERENOGLU Jan KALINA 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2009年第6期909-921,共13页
This study compares the ability of different robust regression estimators to detect and classify outliers. Well-known estimators with high breakdown points were compared using simulated data. Mean success rates (MSR) ... This study compares the ability of different robust regression estimators to detect and classify outliers. Well-known estimators with high breakdown points were compared using simulated data. Mean success rates (MSR) were computed and used as comparison criteria. The results showed that the least median of squares (LMS) and least trimmed squares (LTS) were the most successful methods for data that included leverage points, masking and swamping effects or critical and concentrated outliers. We recommend using LMS and LTS as diagnostic tools to classify outliers, because they remain robust even when applied to models that are heavily contaminated or that have a complicated structure of outliers. 展开更多
关键词 Linear regression outlier Mean success rate (MSR) Leverage point Least median of squares (LMS) Least trimmedsquares (LTS)
原文传递
某院血常规标本周转时间回顾性分析 被引量:1
9
作者 刘文 费中海 +1 位作者 张金花 李君安 《现代医药卫生》 2018年第17期2616-2618,共3页
目的监控该院临床血常规检验流程的全过程,探讨标本周转时间(TAT)的影响因素,并提出改进方案。方法利用该院信息系统的TAT统计功能,统计2016年检验科临检血常规平诊(门诊和住院)和急诊标本的TAT,对统计结果进行分析处理并设定新的TAT,... 目的监控该院临床血常规检验流程的全过程,探讨标本周转时间(TAT)的影响因素,并提出改进方案。方法利用该院信息系统的TAT统计功能,统计2016年检验科临检血常规平诊(门诊和住院)和急诊标本的TAT,对统计结果进行分析处理并设定新的TAT,分析设定前后TAT合格率,帮助实验室改进TAT。结果该院血常规标本TAT合格率较低,TAT延长的原因包括:(1)标本接收前运送耗时较多;(2)短时间内标本量剧增;(3)存在试剂消耗,仪器、系统故障等偶发因素。结论优化标本的运输流程和标本接收高峰期的人力、物力配置,加强与临床的沟通,提升人员TAT意识,能进一步缩短TAT。 展开更多
关键词 血常规 标本周转时间 离群率 实验室 医院
下载PDF
极值分布基于最佳线性无偏估计的异常数据检验 被引量:1
10
作者 邱小蓝 李云飞 《统计与决策》 CSSCI 北大核心 2021年第16期43-47,共5页
文章针对样本数据服从极值分布、样本中出现异常数据的检验问题进行了研究。首先基于尺度参数σ的最佳线性无偏估计(BLUE),并利用次序统计量的贡献率,构造了检验统计量,然后通过Monte-Carlo模拟得到了检验统计量的分位数,给出了异常数... 文章针对样本数据服从极值分布、样本中出现异常数据的检验问题进行了研究。首先基于尺度参数σ的最佳线性无偏估计(BLUE),并利用次序统计量的贡献率,构造了检验统计量,然后通过Monte-Carlo模拟得到了检验统计量的分位数,给出了异常数据的疑似个数和具体检验方法,最后通过实例说明所给出的检验方法是可行的。 展开更多
关键词 异常数据检验 极值分布 最佳线性无偏估计 贡献率
下载PDF
採用量化指標改善急診檢驗服務質量
11
作者 倪金良 趙崇亮 陳倩碧 《镜湖医学》 2010年第1期32-34,共3页
目的調查設立急診檢驗TAT監控指標,對提高急診檢驗效率的作用。方法利用實驗室資訊系統收集2010年2月至4月間急診科送檢血鉀的TAT,對資料中的不符合項,按時間段(每小時為一時間段)統計每天不同時間段的TAT不符合項數目分佈及分析產生原... 目的調查設立急診檢驗TAT監控指標,對提高急診檢驗效率的作用。方法利用實驗室資訊系統收集2010年2月至4月間急診科送檢血鉀的TAT,對資料中的不符合項,按時間段(每小時為一時間段)統計每天不同時間段的TAT不符合項數目分佈及分析產生原因,從而不斷優化工作流程,並按月份(2~8月)進行統計並比較設立TAT監控指標(5月開始)前後每月的TAT平均值和不符合率的變化。結果2~4月資料中的不符合項按每天的時段(每小時)進行統計,6:00~7:00、9:00~12:00以及14:00三個時段的TAT不符合項數量較多;按月份對比,2~4月急診血鉀的TAT平均值較大,TAT不符合率較高,5~8月的TAT平均值及TAT不符合率有明顯的降低。結論對檢驗TAT不符合項數量影響最大的因素是工作流程的交接點和樣本量,設立檢驗TAT監控指標,持續優化工作流程對提高急診檢驗效率是一個相當有效的方法。 展开更多
关键词 樣本周轉時間 TAT 工作流程
下载PDF
基于云模型的异常挖掘算法
12
作者 李磊 彭勇 《微电子学与计算机》 CSCD 北大核心 2013年第8期82-85,共4页
针对基于距离的异常挖掘算法对混合属性数据进行异常挖掘时检测率低的问题,引入概率的思想提出基于云模型的差异度计算公式,并设计了基于云模型的异常挖掘算法,实验结果表明该算法检测率高,误报率低.
关键词 云模型 异常挖掘 入侵检测 检测率 差异度度量
下载PDF
基于神经网络的无线传感器网络异常数据检测方法 被引量:28
13
作者 胡石 李光辉 +1 位作者 卢文伟 冯海林 《计算机科学》 CSCD 北大核心 2014年第B11期208-211,共4页
传感器网络的异常数据检测对于环境监测具有十分重要的意义。基于BP神经网络模型和线性神经网络模型,分别提出了两种无线传感器网络异常数据检测方法。提出的方法在每个当前时刻通过最近的固定长度的历史数据集训练神经网络,来完成下一... 传感器网络的异常数据检测对于环境监测具有十分重要的意义。基于BP神经网络模型和线性神经网络模型,分别提出了两种无线传感器网络异常数据检测方法。提出的方法在每个当前时刻通过最近的固定长度的历史数据集训练神经网络,来完成下一时刻的预报。通过神经网络的模型残差,确定概率为P的置信区间。当下一时刻数据落入置信区间内,则该数据被判为正常;反之,则为异常。为了比较和验证两种检测方法的性能,在Matlab环境下完成了仿真实验。实验结果表明,基于线性神经网络的异常数据检测方法的检测率(detection rate)达到了97.9%,误报率(false positive rate)不超过0.76%;基于BP神经网络的异常数据检测方法的检测率为96.7%,误报率不超过0.84%。 展开更多
关键词 BP神经网络 线性神经网络 异常数据检测 检测率 误报率
下载PDF
基于多源数据的供电台区线损率异常点快速定位方法 被引量:5
14
作者 王树涛 朴哲勇 +2 位作者 王斌 孟凡燕 田金艳 《吉林电力》 2022年第6期43-45,51,共4页
针对台区统计线损影响因素较多、台区实时运行数据应用不足、台区线损原因分析较难等问题,通过用电量离群偏差点分析算法,构建了基于多源数据的台区线损率异常点快速定位方法及应用,提高了台区线损异常分析及问题原因查找速度,有效提升... 针对台区统计线损影响因素较多、台区实时运行数据应用不足、台区线损原因分析较难等问题,通过用电量离群偏差点分析算法,构建了基于多源数据的台区线损率异常点快速定位方法及应用,提高了台区线损异常分析及问题原因查找速度,有效提升了台区精益化管理水平,助力台区节能增效工作,实现供电所台区指标提升管理目标。 展开更多
关键词 配电台区 离群偏差分析 线损率 线损管理
下载PDF
联合多代卫星测高数据构建中国近海及邻域海平面异常序列 被引量:5
15
作者 孙文 王庆宾 朱志大 《测绘学报》 EI CSCD 北大核心 2013年第4期493-500,共8页
首先给出海面高的计算方法,并引入基于高斯滤波的粗差探测方法,有效地剔除了各弧段测高数据存在的粗差。通过对3颗卫星同步运行段测高数据的分析,得到3组数据在中国近海及邻域的平均偏差分别为:Jason-1相对T/P需改正-8.77 cm;Jason-2相... 首先给出海面高的计算方法,并引入基于高斯滤波的粗差探测方法,有效地剔除了各弧段测高数据存在的粗差。通过对3颗卫星同步运行段测高数据的分析,得到3组数据在中国近海及邻域的平均偏差分别为:Jason-1相对T/P需改正-8.77 cm;Jason-2相对Jason-1需改正-7.33 cm,两者均小于其在全球海域的改正值。以T/P测高数据所得平均海平面为基础,利用改正后的Jason-1、Jason-2数据,得到该海域18年海平面异常时间序列,海平面平均上升速率约为4.9 mm/a。分别对中国近海各海域海平面异常时间序列进行分析,得到渤海、黄海、东海及南海的海平面平均上升速率分别为:2.5 mm/a、3.2 mm/a、3.6 mm/a和6.2 mm/a。将所得每周期离散正常点的观测数据格网化,然后逐格网计算海平面异常时间序列,得到研究海域18年来海平面异常平均上升速率的分布情况。结果表明,研究海域海平面上升速率高于全球平均水平。 展开更多
关键词 多代卫星测高数据 粗差探测 平均偏差 海平面异常 中国近海及邻域 上升速率
下载PDF
基于PCA及属性距离和的孤立点检测算法 被引量:3
16
作者 张忠平 宋少英 宋晓辉 《计算机工程与应用》 CSCD 北大核心 2009年第17期139-141,243,共4页
提出了一种基于主分量分析和属性距离和的孤立点检测算法。该方法首先通过主分量分析方法从众多属性中提取出满足累计贡献率的主分量,同时利用PCA变换矩阵把原始数据集转换到由主分量组成的新的特征空间上,之后对转换后的数据集用属性... 提出了一种基于主分量分析和属性距离和的孤立点检测算法。该方法首先通过主分量分析方法从众多属性中提取出满足累计贡献率的主分量,同时利用PCA变换矩阵把原始数据集转换到由主分量组成的新的特征空间上,之后对转换后的数据集用属性距离和的方法对孤立点进行检测。实验结果证明了基于主分量分析和属性距离和的孤立点检测算法的有效性。 展开更多
关键词 孤立点 主分量分析 累计贡献率 属性距离和
下载PDF
基于数据挖掘技术的北方寒冷地区居民用水、用气数据处理方法探讨 被引量:4
17
作者 周浩 林波荣 +3 位作者 张仲宸 戚建强 郑立红 常晨晨 《暖通空调》 2019年第2期58-66,共9页
对于一个城市尺度的居民用气、用水数据系统,其数据量之大通常是人力无法或难以处理与分析的,往往需要借助于数据挖掘技术。基于天津市某城区3个小区用户2 a的用水、用气数据,采用数据标准化、基于临近性检测、箱线图等数据挖掘方法,对... 对于一个城市尺度的居民用气、用水数据系统,其数据量之大通常是人力无法或难以处理与分析的,往往需要借助于数据挖掘技术。基于天津市某城区3个小区用户2 a的用水、用气数据,采用数据标准化、基于临近性检测、箱线图等数据挖掘方法,对用户数据进行了用能异常、邻月用能数据变化异常等检测,并横向比较了3个小区的总体用能水平。结合问卷调研数据,提出了通过信息增益理论及C4.5决策树等数据挖掘算法建立用户用能水平与用户特征及用户行为间的关联关系的方法。本文的研究工作展示了从建筑用能数据中提取有效信息的过程,可为建筑能耗数据管理平台构建和应用提供新思路。 展开更多
关键词 数据挖掘 异常点检测 箱线图 信息增益率 C4.5决策树
下载PDF
基于贝叶斯优化的支持向量回归模型对电能表在线率的预测
18
作者 余俊泽 夏显威 +3 位作者 雷春俊 赵冬立 马群 陈百龄 《广东电力》 2023年第9期72-79,共8页
为预测电能表的在线状态,保障塔里木油田生产用电,将迪那地区电能表在线数等24个变量作为研究对象,运用反向特征消除方法进行数据降维,得到影响在线率的5个主要变量。进一步通过贝叶斯优化的支持向量回归方法完成对电能表在线率的预测,... 为预测电能表的在线状态,保障塔里木油田生产用电,将迪那地区电能表在线数等24个变量作为研究对象,运用反向特征消除方法进行数据降维,得到影响在线率的5个主要变量。进一步通过贝叶斯优化的支持向量回归方法完成对电能表在线率的预测,并与随机森林算法、梯度提升算法等预测方法进行比较。计算结果表明,该模型在预测电能表在线率的任务中表现出色,预测值加权平均误差低至0.408%,明显优于其他各算法。以塔里木油田为例,该模型可提升电网运维效率,为实现高效的电能分配提出了一条切实可行的途径。 展开更多
关键词 异常值剔除 非线性问题 反向特征消除 贝叶斯优化 支持向量回归 电能表在线率
下载PDF
离群点检测算法的评价指标 被引量:2
19
作者 宁进 陈雷霆 +2 位作者 罗子娟 周川 曾慧茹 《计算机应用》 CSCD 北大核心 2020年第9期2622-2627,共6页
随着离群点检测技术的深入研究和广泛应用,越来越多的优秀算法被提出来,然而,现有的离群点检测技术的评价仍然沿用传统分类算法的测量指标,存在着评价指标单一、适应性差的问题。针对这些问题,提出了一类高真正率指标(HT_AUC)和二类低... 随着离群点检测技术的深入研究和广泛应用,越来越多的优秀算法被提出来,然而,现有的离群点检测技术的评价仍然沿用传统分类算法的测量指标,存在着评价指标单一、适应性差的问题。针对这些问题,提出了一类高真正率指标(HT_AUC)和二类低假正率指标(LF_AUC)。首先,整理常用的离群点检测评价指标,分析其优缺点和适用场景;然后,在已有的曲线下面积(AUC)方法的基础上,分别针对高真正率(TPR)要求和低假正率(FPR)要求,提出了一类高真正率指标和二类低假正率指标,为离群点检测算法的效果评价和量化集成提供了更合适的指标。在真实数据集上的实验结果表明,与传统评价指标的相比,所提出的方法更能满足一类高真正率和二类低假正率要求。 展开更多
关键词 离群点检测 评价指标 曲线下面积 真正率 假正率
下载PDF
来自于Multiple-Outlier模型的最小次序统计量序性质(英文)
20
作者 程美芳 方龙祥 杨芳 《应用概率统计》 CSCD 北大核心 2017年第3期317-330,共14页
本文中,我们研究来自于两个multiple-outlier模型的最小次序统计量的随机比较,其中两个模型中独立同分布的随机变量个数不同.令X_(1:n)(p,q)和X_(1:n~*)(p~*,q~*)分别表示来自于X_1,…,X_p,X_(p+1),…,X_n和X_1,…,X_(p),X_(p~*+1),…,X... 本文中,我们研究来自于两个multiple-outlier模型的最小次序统计量的随机比较,其中两个模型中独立同分布的随机变量个数不同.令X_(1:n)(p,q)和X_(1:n~*)(p~*,q~*)分别表示来自于X_1,…,X_p,X_(p+1),…,X_n和X_1,…,X_(p),X_(p~*+1),…,X_(n)的最小次序统计量,这里q=n-p,q~*=n~*-p~*.在参数(p,q)和(p~*,q~*)满足某些优化序条件下,我们根据普通随机序,失效率序和似然比序给出了X_(1:n)(p,q)和X_(1:n~*)(p~*,q~*)的序比较. 展开更多
关键词 multiple-outlier模型 普通随机序 失效率序 似然比序 最小次序统计量 比例失效率模型
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部