分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合...分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合等问题.SS-EIM主要由文本匹配模型、语义分析模型和分组统计模型组成,采用文本粗略匹配、表象关联关系获取以及分组统计分析的三段式逐步求精策略,基于文本特征、语义信息及约束规则来不断精化识别结果;根据可获取的有限的实例信息,采用静态分析、动态协调相结合的自适应知识维护策略,构建和完善表象关联知识库,以适应Web数据的动态性并保证表象关联知识的完备性.通过实验验证了SS-EIM中所采用的关键技术的可行性和有效性.展开更多
Web Services是在现有的异构平台基础上构筑一个通用的、与平台、语言无关的技术层,使各种不同平台之上的应用依靠这个技术层来实施相互的连接和集成。论文在分析传统的软件开发模式和系统集成方法给电力企业应用集成带来的诸多问题的...Web Services是在现有的异构平台基础上构筑一个通用的、与平台、语言无关的技术层,使各种不同平台之上的应用依靠这个技术层来实施相互的连接和集成。论文在分析传统的软件开发模式和系统集成方法给电力企业应用集成带来的诸多问题的基础上,提出了利用Web Services技术来实现电力企业应用集成(PEAI)的解决方案,并针对企业间数据集成的实际情况,给出了一个简化的数据集成系统实例和实现方法。展开更多
基金Supported by the National Natural Science Foundation of China under Grant No.60673139 (国家自然科学基金)
文摘分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合等问题.SS-EIM主要由文本匹配模型、语义分析模型和分组统计模型组成,采用文本粗略匹配、表象关联关系获取以及分组统计分析的三段式逐步求精策略,基于文本特征、语义信息及约束规则来不断精化识别结果;根据可获取的有限的实例信息,采用静态分析、动态协调相结合的自适应知识维护策略,构建和完善表象关联知识库,以适应Web数据的动态性并保证表象关联知识的完备性.通过实验验证了SS-EIM中所采用的关键技术的可行性和有效性.