期刊文献+
共找到340篇文章
< 1 2 17 >
每页显示 20 50 100
一种基于拓扑势的网络社区发现方法 被引量:94
1
作者 淦文燕 赫南 +1 位作者 李德毅 王建民 《软件学报》 EI CSCD 北大核心 2009年第8期2241-2254,共14页
从数据场思想出发,提出了一种基于拓扑势的社区发现算法.该方法引入拓扑势描述网络节点间的相互作用,将每个社区视为拓扑势场的局部高势区,通过寻找被低势区域所分割的连通高势区域实现网络的社区划分.理论分析与实验结果表明,该... 从数据场思想出发,提出了一种基于拓扑势的社区发现算法.该方法引入拓扑势描述网络节点间的相互作用,将每个社区视为拓扑势场的局部高势区,通过寻找被低势区域所分割的连通高势区域实现网络的社区划分.理论分析与实验结果表明,该方法无须用户指定社区个数等算法参数,能够揭示网络内在的社区结构及社区间具有不确定性的重叠节点现象.算法的时间复杂度为O(m+n^3/r)~O(n^2),n为网络节点数,m为边数,2〈γ〈3为一个常数. 展开更多
关键词 拓扑势 数据场 社区发现 复杂网络
下载PDF
大数据时代我国体育发展面临的机遇与挑战 被引量:61
2
作者 王奇 颜小燕 《体育与科学》 CSSCI 北大核心 2016年第1期75-80,86,共7页
大数据时代的到来已经深刻影响人类社会文化的变革。大数据技术的运用促使竞技体育的训练方法与竞赛实践得到了拓展;推动了体育科学研究方法上的革新,使研究范式由"计量范式"向"计算范式"转变;推动了体育传播方式... 大数据时代的到来已经深刻影响人类社会文化的变革。大数据技术的运用促使竞技体育的训练方法与竞赛实践得到了拓展;推动了体育科学研究方法上的革新,使研究范式由"计量范式"向"计算范式"转变;推动了体育传播方式的变革,传播形式和传播方式呈现多元化发展的趋势,实现了受众群体精准预测,开创体育传播的"自媒体"时代;大数据时代催生了完整"模块"营销策略的诞生,最大限度提升体育产业的价值,提升了体育产业的科技化程度。传统的竞技体育选材、训练、竞赛等思维方式,数据的安全性及体育信息情报系统,传统的体育科学研究方法以及体育产业的创新思维和体育科技发展水平是大数据时代我国体育面临的新的主要挑战。倡导大数据在竞技体育选材、训练、竞赛中的应用,构建具有前瞻性的理论依据;建立适应大数据时代发展的体育信息情报收集系统并应用于体育实践;突破传统体育科学研究的"路径依赖",适应从"计量范式"向"计算范式"的演进;加强创新驱动,提高信息安全意识,增进大数据协同创新研究是大数据时代我国体育发展的路径选择。 展开更多
关键词 数据分析 竞技体育选材预测 体育研究方法 体育传播 体育营销 体育社会 计算范式 计量范式
下载PDF
生物医学大数据的现状与展望 被引量:59
3
作者 宁康 陈挺 《科学通报》 EI CAS CSCD 北大核心 2015年第5期534-546,共13页
生物医学是一门新兴的前沿交叉学科,它综合了医学、生命科学和生物学的理论和方法而发展起来.近年来随着先进仪器装备与信息技术等越来越广泛和深入的整合到生物技术中来,生物医学研究中越来越频繁的涉及到大数据存储和分析等信息技术.... 生物医学是一门新兴的前沿交叉学科,它综合了医学、生命科学和生物学的理论和方法而发展起来.近年来随着先进仪器装备与信息技术等越来越广泛和深入的整合到生物技术中来,生物医学研究中越来越频繁的涉及到大数据存储和分析等信息技术.大数据时代的来临对生物医学研究产生了重大影响.其中,一个重要发展趋势就是由假设驱动向数据驱动的转变.数十年来分子生物学水平上的实验目的是获得结论或者是提出一种新的假设,而现在基于海量生物医学大数据,可以对海量数据的研究来探索其中的规律,直接提出假设或得出可靠的结论.随着先进的生物分析技术的不断推出和更新,生物医学数据迅速积累.基于此类大数据一些以往不能解决的问题将有望解决,同时相关生物医学研究的新问题也层出不穷.生物医学相关的大数据技术和相关应用主要包括:基于高通量测序的个性化基因组、转录组和蛋白组研究,单细胞水平基因型和表型研究,人类健康相关微生物群落研究,生物医学图像研究等.相关生物医学大数据分析任务均具有着数据密集和计算密集的双密集性特点.要充分地利用这些大数据解决一系列生物医学问题,迫切需要高通量、高效率、高准确性的生物信息存储和分析策略.本文总结和回顾生物医学大数据的生成、管理和分析相关的一系列问题,其中重点讨论人体微生物群落、单细胞表型和基因型、生物医学图像等新近出现的生物医学大数据形式,以及相关数据分析和应用前景等.基于目前生物医学大数据的现状我们可以发现,生物医学大数据的研究正处于蓄势待发状态:适应于生物医学大数据的软硬件平台、大数据存储、大数据分析挖掘等方法等还不成熟,制约着生物大数据的研究.然而一旦相关研究获得突破并有所优化和应用,将会全方位地支撑� 展开更多
关键词 生物医学 大数据 微生物群落 单细胞 医学图像 数据挖掘
原文传递
大数据时代科学数据共享伦理问题研究 被引量:43
4
作者 温亮明 张丽丽 黎建辉 《情报资料工作》 CSSCI 北大核心 2019年第2期38-44,共7页
文章对国内外相关的文献进行了定量统计,解析了当前的研究热点,分析了大数据时代科学数据共享面临的新问题并预测了未来可能的研究方向。研究发现:科学数据共享伦理的研究热点主要集中在伦理理论、伦理困境、问题成因、治理措施等方面... 文章对国内外相关的文献进行了定量统计,解析了当前的研究热点,分析了大数据时代科学数据共享面临的新问题并预测了未来可能的研究方向。研究发现:科学数据共享伦理的研究热点主要集中在伦理理论、伦理困境、问题成因、治理措施等方面。在大数据时代,科学数据共享面临着数据边界扩张、数据结构多样、数据权益模糊等新的伦理问题,未来研究可以关注数据鸿沟、数据污染、数据隐私、数据异化等问题。 展开更多
关键词 大数据 科学数据 数据共享 伦理 科学共同体
原文传递
科学数据共享FAIR原则:背景、内容及实践 被引量:41
5
作者 宋佳 温亮明 李洋 《情报资料工作》 CSSCI 北大核心 2021年第1期57-68,共12页
[目的/意义]FAIR原则已经成为科学数据管理的国际准则,研究该原则的理念内涵将有助于我国科学数据管理工作的布局与实践。[方法/过程]基于文献调研和网络调研,首先从时代特性角度分析了FAIR原则的产生背景;然后透过关键语词详细解析了... [目的/意义]FAIR原则已经成为科学数据管理的国际准则,研究该原则的理念内涵将有助于我国科学数据管理工作的布局与实践。[方法/过程]基于文献调研和网络调研,首先从时代特性角度分析了FAIR原则的产生背景;然后透过关键语词详细解析了可发现、可访问、可互操作、可重用4项子原则的具体内容;最后从学术会议、研究成果、科学计划、数据出版四个方面介绍了FAIR原则的研究与实践进展。[结果/结论]文章认为,数据资源持续积累、科学研究范式变革、数据共享全球行动为FAIR原则产生奠定了背景,4项子原则及其15条具体原则层层递进,共同描绘了FAIR体系。未来的科学数据共享系统将朝着融合化、智能化、生态化方向发展。 展开更多
关键词 科学数据 开放共享 FAIR原则 科学共同体 数据管理
原文传递
社区45岁以上人群退行性膝关节病流行病学调查 被引量:32
6
作者 林锦洪 李敏健 +6 位作者 许智源 程宇星 刘秋菊 蓝鹏 陈薇 黄启新 高崇荣 《中华风湿病学杂志》 CAS CSCD 2005年第12期718-720,共3页
目的了解广州社区45岁以上人群退行性膝关节病发生率及相关因素。方法采用流行病学中的典型调查和横断面调查研究方法,对广州市人民街18个居委3010名45岁以上成人进行了膝关节炎的流行病学调查。全部采取调查提问,现场调查由经过培训的... 目的了解广州社区45岁以上人群退行性膝关节病发生率及相关因素。方法采用流行病学中的典型调查和横断面调查研究方法,对广州市人民街18个居委3010名45岁以上成人进行了膝关节炎的流行病学调查。全部采取调查提问,现场调查由经过培训的医生执行,随机抽取膝关节病史阳性者及阴性者各300名X线检查,由专家统一质量控制和回收表格,统计分析,最后由疼痛科及骨科专家进行专业分析。结果回答膝关节病史阳性者650例(占21.5%),男性发病率为13.2%,女性发病率为28.3%,女性发病率明显高于同年龄组男性(!2=100.26,P<0.01)。300例膝关节病史阳性者X线改变289例(占96.3%),300名膝关节病史阴性者X线改变172例(占57.3%),膝关节病史阳性者X线改变率较阴性者高(!2=128.18,P<0.01),接受系统治疗者119例(占18.2%)。结论广州社区退行性膝关节炎发病率低于国内外其他地区,女性发病率高于同年龄组男性,膝关节病史阳性者X光片改变率较阴性者高,超过80%的患者未接受系统治疗。 展开更多
关键词 骨关节炎 数据收集 流行病学 社区
原文传递
社区护士社区护理相关技能实践现状及培训需求调查 被引量:31
7
作者 孙晓 田梅梅 施雁 《中华现代护理杂志》 2012年第33期3974-3979,共6页
目的了解社区护士对社区护理相关技能的实践现状及培训需求。方法由参与医院一社区联动模式的成员通过文献回顾、质性访谈等方式设计问卷,以我院所在区域的11家社区卫生服务中心的社区护士作为研究对象展开调查。结果194名社区护士中... 目的了解社区护士对社区护理相关技能的实践现状及培训需求。方法由参与医院一社区联动模式的成员通过文献回顾、质性访谈等方式设计问卷,以我院所在区域的11家社区卫生服务中心的社区护士作为研究对象展开调查。结果194名社区护士中认为接受相关社区护理知识和技能培训非常必要和必要的社区护士人数分别占41.8%,47.9%;非常愿意与愿意接受培训的社区护士人数分别占34.5%,53.6%;76.8%的社区护士因工作繁忙而不能参加培训;社区护士所希望采取的培训方式有理论授课(66.0%)、随时电话指导(35.1%)等。社区护理中较常见的护理问题得分3分以上的包括慢性疾病用药知识、有效沟通技巧、康复护理、居家护理知识、慢性病规范化护理、社区紧急救护知识和技能、临终关怀、母婴护理。社区护士对相关护理技能培训的需求总分平均为(3.40±1.60)分,得分处于3分以上的包括慢性病用药知识、康复护理、居家护理知识、与患者的有效沟通技巧、慢性病规范化培训、社区紧急救护知识和技能、临终关怀、母婴护理、儿童营养宣教、疑难伤口护理、难治性压疮护理、造口护理。结论一方面通过“输血机制”和“造血机制”,对社区护士所需求的相关护理技能进行培训,另一方面提高社区护士在造口护理、PICC维护等方面的护理技能,拓展社区护理服务项目,改善患者“看病难、看病贵”的现状。 展开更多
关键词 数据收集 社区护士 护理技能 培训需求
原文传递
基于复杂网络社区划分的网络拓扑结构可视化布局算法 被引量:25
8
作者 朱志良 林森 +1 位作者 崔坤 于海 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2011年第11期1808-1815,共8页
许多真实的网络都可以用复杂网络的思想进行研究和解释,而社区结构是复杂网络的一个重要特征.为此,提出一种基于社区结构的网络布局算法.首先利用复杂网络社区发现算法对网络中的节点进行社区划分,并将一个社区抽象为一个节点,以社区间... 许多真实的网络都可以用复杂网络的思想进行研究和解释,而社区结构是复杂网络的一个重要特征.为此,提出一种基于社区结构的网络布局算法.首先利用复杂网络社区发现算法对网络中的节点进行社区划分,并将一个社区抽象为一个节点,以社区间的关联为边构建新的网络;在此基础上,运用物理类比方法确定社区中心点的位置,并根据社区的规模确定社区的区域范围;最后运用条件择优的方式填充社区内部节点以完成网络拓扑的布局.仿真实验结果证明,该算法与传统的可视化布局算法相比,具有计算量更少、收敛速度快、结构清晰的特点,更具有实际应用的价值. 展开更多
关键词 数据可视化 复杂网络 社区发现 布局算法
下载PDF
大数据驱动下社区治理模式变革与路径建构 被引量:20
9
作者 许峰 李志强 《理论探讨》 CSSCI 北大核心 2019年第4期165-170,共6页
大数据时代的技术进步和社会变革推动了社区治理的新诉求,同时也为社区治理模式创新提供动力支持。在此背景下,从大数据与社区治理关系的内生逻辑的契合性,解释网络时代社区行动范式应由"挂钩式"共同体转向"共生型"... 大数据时代的技术进步和社会变革推动了社区治理的新诉求,同时也为社区治理模式创新提供动力支持。在此背景下,从大数据与社区治理关系的内生逻辑的契合性,解释网络时代社区行动范式应由"挂钩式"共同体转向"共生型"共同体的机制动因。并据此提出以"共生网络"模式的整合框架,通过推进大数据背景下社会治理整体范式的转变,完善大数据社区治理开放系统要素协同机制,建构大数据社区综合服务平台治理网络等方式,建构起兼具工具理性和价值理性的网络治理新路径。 展开更多
关键词 大数据 社区治理 共生网络 路径建构
下载PDF
基于大数据的虚拟社区知识共享模式及体系架构研究 被引量:15
10
作者 黄家良 谷斌 《情报理论与实践》 CSSCI 北大核心 2016年第2期93-96,107,共5页
[目的/意义]探讨如何应用大数据促进虚拟社区知识共享,为虚拟社区挖掘大数据价值、提高知识共享水平提供指导与借鉴。[方法/过程]首先阐述了虚拟社区中知识共享行为以及"社区大数据"的特征及应用价值。然后提出了基于大数据... [目的/意义]探讨如何应用大数据促进虚拟社区知识共享,为虚拟社区挖掘大数据价值、提高知识共享水平提供指导与借鉴。[方法/过程]首先阐述了虚拟社区中知识共享行为以及"社区大数据"的特征及应用价值。然后提出了基于大数据的虚拟社区知识共享模式。最后给出了基于大数据的虚拟社区知识共享体系构架,包括数据采集层、数据存储层、数据分析层、知识发现层以及知识应用层。[结果/结论]构建基于大数据的虚拟社区模式以及体系架构具有较高的价值意义和可行性。 展开更多
关键词 大数据 虚拟社区 知识共享 知识发现 体系架构
原文传递
区域教研中教育数据应用协同创新共同体模式探索 被引量:14
11
作者 白洁 于泽元 明旒 《电化教育研究》 CSSCI 北大核心 2020年第10期114-121,共8页
大数据时代,区域教研中有效应用教育数据对于区域教育质量提升具有重要意义。文章针对区域教研中开展教育数据应用亟待解决的数据获取难、帮助支持少、成果转化弱三大问题,构建了区域教研中教育数据应用协同创新共同体,分析了共同体的... 大数据时代,区域教研中有效应用教育数据对于区域教育质量提升具有重要意义。文章针对区域教研中开展教育数据应用亟待解决的数据获取难、帮助支持少、成果转化弱三大问题,构建了区域教研中教育数据应用协同创新共同体,分析了共同体的内涵以及共同体中的参与主体及其主要工作。通过实践发现,教育数据应用协同创新共同体充分发挥了参与主体多元化的优势,为区域教研活动构建了信息技术支持下促进互动、协同、共享的虚实结合教研环境,形成了支持区域教研团队开展教育数据应用研修的有效模式,有效地提升了区域教研团队的创新评价水平与交互水平,实现了教育数据应用过程中深层次的协同创新。 展开更多
关键词 数据应用 区域教研 共同体 协同创新 网络学习空间
下载PDF
基于POI数据的城市15分钟社区生活圈便利度评价研究--以武汉三区为例 被引量:13
12
作者 庄晓平 陶楠 王江萍 《华中建筑》 2020年第6期76-79,共4页
根据2018年12月1日实施的《城市居住区规划设计标准》的规定,生活圈是城市居民日常出行范围对公共服务的基本需求,构建15分钟社区生活圈,将生活圈作为居住区公共资源配置和社会治理的基本单元,已经成为评价城市宜居程度的重要一环。其... 根据2018年12月1日实施的《城市居住区规划设计标准》的规定,生活圈是城市居民日常出行范围对公共服务的基本需求,构建15分钟社区生活圈,将生活圈作为居住区公共资源配置和社会治理的基本单元,已经成为评价城市宜居程度的重要一环。其中社区生活圈便利度是评价宜居城市的重要影响因素,居民社区生活圈便利度主要指居民日常利用公共服务设施的便利程度。本次研究,以武汉市武昌区、汉口区、汉阳区这三个中心城区主要区域为研究范围,以三区的小区生活圈便利度为研究对象。基于开放POI数据,统计分析三区的小区15分钟生活圈内的设施点类型和数量,评价各片区内的生活圈便利程度,为设施的配套完善、社区生活品质的提升提供一定的依据。 展开更多
关键词 宜居城市 15分钟生活圈 POI数据 社区生活圈便利度
下载PDF
国内外开放科研数据重用困境解决措施述评 被引量:11
13
作者 张潇月 顾立平 胡良霖 《图书馆》 CSSCI 北大核心 2021年第3期80-89,共10页
开放科研数据面临数据重用的困境,了解国内外相关学者或机构对该问题的解决方式可为利益相关方政策制定与服务实施提供参考。本研究通过文献综述,调研学术论文、专题报道、调查报告、政策、学者博客等,述评当前学者对数据重用困难的解... 开放科研数据面临数据重用的困境,了解国内外相关学者或机构对该问题的解决方式可为利益相关方政策制定与服务实施提供参考。本研究通过文献综述,调研学术论文、专题报道、调查报告、政策、学者博客等,述评当前学者对数据重用困难的解决方式,认为应关注科研人员的核心作用,提出科研数据重用生态系统模式,为支持科研数据重用活动提供服务新思路,并指出图书馆是科研数据重用活动的重要推动者。 展开更多
关键词 开放科学 开放科研数据 数据重用 数据政策 生态系统模式 数据社群
下载PDF
展示复杂网络社团结构的社团引力导引的布局算法 被引量:12
14
作者 吴渝 李藻旭 +1 位作者 李红波 温磊 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第8期1460-1467,共8页
由于传统的力导引布局方法大都无法展示复杂网络的社团结构,提出一种可有效展示复杂网络社团结构的布局算法——社团引力导引的布局算法.该算法在力导引布局算法的基础上对每个节点加入社团引力,并引入k-means算法,使同一社团的节点能... 由于传统的力导引布局方法大都无法展示复杂网络的社团结构,提出一种可有效展示复杂网络社团结构的布局算法——社团引力导引的布局算法.该算法在力导引布局算法的基础上对每个节点加入社团引力,并引入k-means算法,使同一社团的节点能够向社团的中心位置聚拢.不同于先网络聚类再可视化布局的传统做法,该算法不需要预先对节点分类,可以在布局的同时完成节点聚类.实验中使用模块度指标评估社团结构的强弱程度,结果表明,文中算法可以呈现明显的聚类效果,简单、易于实现,且收敛速度快. 展开更多
关键词 数据可视化 社团结构 复杂网络 力导引算法
下载PDF
金沙江上中段大型底栖无脊椎动物群落结构特征和多样性分析 被引量:11
15
作者 池仕运 王瑞 +5 位作者 魏秘 徐靖 戴逢斌 吕克强 李嗣新 胡菊香 《生态学报》 CAS CSCD 北大核心 2022年第21期8723-8738,共16页
研究将2010—2019年的大型底栖无脊椎动物观测资料进行了系统整理分析,旨在为金沙江上中段大型底栖无脊椎动物的多样性评估以及高海拔地区河流的生物多样性研究和保护提供较为全面的基础资料。研究结果显示,金沙江上中段大型底栖无脊椎... 研究将2010—2019年的大型底栖无脊椎动物观测资料进行了系统整理分析,旨在为金沙江上中段大型底栖无脊椎动物的多样性评估以及高海拔地区河流的生物多样性研究和保护提供较为全面的基础资料。研究结果显示,金沙江上中段大型底栖无脊椎动物种类组成上水生昆虫占据绝对优势地位,主要由双翅目、蜉蝣目、毛翅目和襀翅目组成,软体动物占比较低,且以基眼目为主。就科级水平而言,四节蜉科、摇蚊科、扁蜉科和石蝇科为整个研究区域的常见分类单元,其中摇蚊科和四节蜉科在干支流和丰枯期均较为常见。干流和支流大型底栖无脊椎动物的群落结构显著不同,不受丰水期和枯水期的影响。丰水期和枯水期大型底栖无脊椎动物的群落结构差异显著,不受干流和支流的局限。四节蜉(四节蜉属Baetis、二翼蜉Cloeon dipterum、花翅蜉属Baetiella和四节蜉科Baetidae)和石蝇(纯石蝇属Paragnetina和石蝇科Perlidae)以及纹石蛾(纹石蛾属Hydropsyche)是造成不同群组群落结构差异的关键分类单元。整个研究区域大型底栖无脊椎动物呈现较高的嵌套度,且嵌套度枯水期高于丰水期,支流高于干流。底栖物种丰富度和现存量枯水期高于丰水期,支流高于干流。β多样性干流高于支流,丰水期高于枯水期。基于近十年的观测资料,金沙江流域出现的大型底栖无脊椎动物种类较为丰富,观测物种数达148种,基于统计学的估计值也在200种左右变动,但就单次调查情况来看,干流丰水期和枯水期单站出现的物种数很少,群落结构十分简单,而支流单站出现的物种数相对较多,群落结构则相对复杂。 展开更多
关键词 大型底栖无脊椎动物 多样性评估 金沙江上中段 监测数据 群落结构
下载PDF
审计对象关系网络构建方法研究 被引量:11
16
作者 赵琛 《审计研究》 CSSCI 北大核心 2016年第6期36-41,共6页
本文论述了利用审计数据将审计对象的多种社会属性予以形式化表示、将特定的审计问题一般化为数学问题可能性和必要性,阐述了基于这种形式化表示再现审计对象的特定社会关系,以及在此基础之上查找多个审计对象关系集合中重要节点的应用... 本文论述了利用审计数据将审计对象的多种社会属性予以形式化表示、将特定的审计问题一般化为数学问题可能性和必要性,阐述了基于这种形式化表示再现审计对象的特定社会关系,以及在此基础之上查找多个审计对象关系集合中重要节点的应用方式。此外,还通过多个审计实例在方法层面上应用关系网络分析算法,对审计对象以及与之相关的人员、机构所形成的网络进行分析,从度中心性、介数中心性等角度描述网络中不同主体的特性。经过审计实践检验,本文所提出的基于审计数据的复杂关系网络构建,能够帮助审计人员查找网络中关键人物和团体,锁定关注对象,为下一步审计提供线索。 展开更多
关键词 审计数据 关系网络 社团发现
下载PDF
基于大数据的电商物流末端配送网点空间分布分析--以深圳市为例 被引量:10
17
作者 张智 肖作鹏 《城市观察》 2017年第1期73-81,共9页
随着末端配送对于网络购物的重要性越来越强,网络零售企业、物流快递企业等纷纷加大末端物流网络的建设,围绕社区来配备快递配送网点和相应的服务设施。国家相关规划也提出了将电商物流快递基础设施建设纳入土地利用规划与城市总体规划... 随着末端配送对于网络购物的重要性越来越强,网络零售企业、物流快递企业等纷纷加大末端物流网络的建设,围绕社区来配备快递配送网点和相应的服务设施。国家相关规划也提出了将电商物流快递基础设施建设纳入土地利用规划与城市总体规划,推动末端配送设施的网格化配置。虽然相关研究及政策已经开始推进,但是受制于数据限制,关于社区快递配送网点的规划布局研究仍然有待深化。以深圳市为例,通过兴趣点等大数据采集与空间分析方法,对邮政公司、快递公司和电商企业末端配送网点的空间分布进行探讨,分析上述公司末端配送网点的空间分布和服务能力,以期为末端物流设施的规划建设提供研究支撑与政策建议。 展开更多
关键词 电商物流 末端配送 大数据 社区尺度 深圳
下载PDF
社会科学研究中的“等价共同体”问题 被引量:5
18
作者 吕鹏 陈典涵 《中国行政管理》 北大核心 2023年第11期125-138,共14页
“等价共同体”是社会科学研究的重大关切问题。在长期的社会科学研究实践中,人们通常会忽略一个深层次的“等价共同体”问题。要么认为不存在“等价”问题,要么认为“等价”是理所当然的。“等价共同体”综合考察社会科学研究的样本代... “等价共同体”是社会科学研究的重大关切问题。在长期的社会科学研究实践中,人们通常会忽略一个深层次的“等价共同体”问题。要么认为不存在“等价”问题,要么认为“等价”是理所当然的。“等价共同体”综合考察社会科学研究的样本代表性、分布特征、行为机制、干预反馈、结论稳健性等多维度品质,应予以系统性梳理与研究。在各阶段,“等价共同体”理念存在不同的实践形式。在社会调查研究阶段,“等价共同体”形成雏形,表现为样本的集合,包括普查、抽样调查、互联网调查等。在计算社会科学阶段,“等价共同体”深入发展,表现为数据共同体,在样本数量、数据维度方面大为拓展,应用于互联网文本挖掘、自然语言处理、在线社交网络、机器学习、地理信息系统等领域。在智能体模拟时代,“等价共同体”问题无法回避,体现为智能体集合,并继承了社会调查(定量实证研究)、计算社会科学(大数据)基础。通过不断训练、锤炼,最终获得和真实社会在多个维度(调查数据、大数据等)高度匹配的“等价智能体”,开展社会分析与社会治理。一个总体性趋势是,“等价共同体”属性的被满足程度在逐渐增强。 展开更多
关键词 等价共同体 社会调查样本 数据共同体 等价智能体
原文传递
应用非负矩阵分解模型的社区发现方法综述 被引量:9
19
作者 李亚芳 贾彩燕 于剑 《计算机科学与探索》 CSCD 北大核心 2016年第1期1-13,共13页
非负矩阵分解(nonnegative matrix factorization,NMF)在提取高维数据中隐含模式和结构方面具有良好性能,已成为数据挖掘领域的热点研究之一。NMF作为无监督学习的有效工具,在模式识别、文本处理、多媒体数据分析以及生物信息学等研究... 非负矩阵分解(nonnegative matrix factorization,NMF)在提取高维数据中隐含模式和结构方面具有良好性能,已成为数据挖掘领域的热点研究之一。NMF作为无监督学习的有效工具,在模式识别、文本处理、多媒体数据分析以及生物信息学等研究领域得到了广泛应用。目前,已有工作将NMF模型应用于网络数据挖掘,发现网络中隐含的社区结构。对基于NMF的社区发现方法进行了总结,包括无监督的社区发现方法和半监督的社区发现方法,通过在实际网络和人工网络进行实验,比较分析了不同算法的性能,进一步研究了当前基于NMF发现社区结构所面临的挑战,并对下一步研究方向进行了展望。 展开更多
关键词 数据挖掘 非负矩阵分解 社区发现
下载PDF
基于MapReduce的分布式网络数据聚类算法 被引量:9
20
作者 陈东明 刘健 +1 位作者 王冬琦 徐晓伟 《计算机工程》 CAS CSCD 2013年第7期76-82,共7页
时空复杂度较高以及物理机器内存不足,会导致传统聚类算法不能有效地分析处理大规模数据网络。针对该问题,在MapReduce分布式模型的基础上,提出一种网络数据分布式聚类算法。根据MRC理论设计有限MapReduce轮数,控制混洗过程所需时间,利... 时空复杂度较高以及物理机器内存不足,会导致传统聚类算法不能有效地分析处理大规模数据网络。针对该问题,在MapReduce分布式模型的基础上,提出一种网络数据分布式聚类算法。根据MRC理论设计有限MapReduce轮数,控制混洗过程所需时间,利用Map内合并技术对网络流量进行控制,在进行中间结果合并时仅对社团合并,而不考虑社团内部节点,以控制内存开销。使用模拟生成的数据在集群中进行实验,结果表明,当数据规模和集群规模增大时,该算法具有较好的加速比和扩展性。 展开更多
关键词 聚类算法 分布式聚类 MapReduce编程模型 数据挖掘 社团结构
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部