设为首页 | 加入收藏
文献检索:
  • 应用非负矩阵分解模型的社区发现方法综述 免费阅读 下载全文
  • 非负矩阵分解(nonnegative matrix factorization,NMF)在提取高维数据中隐含模式和结构方面具有良好性能,已成为数据挖掘领域的热点研究之一。NMF作为无监督学习的有效工具,在模式识别、文本处理、多媒体数据分析以及生物信息学等研究领域得到了广泛应用。目前,已有工作将NMF模型应用于网络数据挖掘,发现网络中隐含的社区结构。对基于NMF的社区发现方法进行了总结,包括无监督的社区发现方法和半监督的社区发现方法,通过在实际网络和人工网络进行实验,比较分析了不同算法的性能,进一步研究了当前基于NMF发现社区结构所面临的挑战,并对下一步研究方向进行了展望。
  • 多策略相似度整合的XML模式匹配方法 免费阅读 下载全文
  • 模式匹配用于发现不同数据源中概念之间的语义对应关系,已成为数据集成、数据交换等领域的研究热点。研究者提出了大量的基于XML模式匹配方法,从而可以识别XML中数据的语义对应关系。XML模式匹配存在着一些挑战,例如如何将节点和结构匹配进行综合考虑,如何有效拟合多种相似度等。面对如上问题,针对XML节点和结构两方面进行相似度计算,得到相似度矩阵后整合这两个方面的相似度。随后通过多种策略组合和优化算法进行拟合,以得到优化的匹配结果。最后,通过基准测试平台对比,该方法相比于经典的模式匹配方法具有较高的精确率和召回率。
  • 基于用户信任值的HDFS访问控制模型研究 免费阅读 下载全文
  • 目前,越来越多的用户使用云存储来保存或备份数据,以增强数据的可移动性,但针对云存储的安全性问题,研究人员主要关注隐私泄露、数据容灾、副本消除等方面,对访问控制的研究较少。在前人研究的基础上,提出了一种基于用户信任值的HDFS(Hadoop distributed file system)访问控制模型。该模型结合可信赖第三方认证系统Kerberos实现对用户的认证,并为每个用户设定一个信任值,通过信任值与信任值阈值的比较动态控制用户对HDFS的访问。实验结果表明,该模型不仅可以克服HDFS访问控制上的缺陷,而且能够动态、有效地控制用户对HDFS中资源的访问。
  • 融合互近邻降噪的动态数据流分类研究 免费阅读 下载全文
  • 动态数据流分类挖掘应用场景逐渐增多,如何辨识出动态数据流中概念漂移和噪声信息成为数据流分类研究中的重点。因此提出一种具备噪声检测能力的动态数据流增量式分类挖掘模型解决此类问题。当动态数据流中出现样本信息与分类模型概念不相容时,采用互近邻思想检测样本是否为噪声,在此基础上用支持向量机作为学习器,通过增量式学习解决数据流中概念漂移。在两种不相容度量标准下,结合理论分析和实验,证明了所提的分类方案是有效可行的。
  • 基于实例迁移的跨项目软件缺陷预测 免费阅读 下载全文
  • 跨项目软件缺陷预测是解决项目初期缺陷预测缺乏数据集的有效途径,但是项目间的差异性降低了预测准确率。针对这一问题,研究提出了基于实例迁移的跨项目缺陷预测方法。该方法采用迁移学习和自适应增强技术,从其他项目数据集中提取并迁移转化出与目标数据集关联性高的训练数据集,训练出更有效的预测模型。使用PROMISE数据集进行了对比实验,结果表明所提出的新方法有效避免了单源单目标缺陷预测两极分化问题,获得了更高的预测准确率和查全率;在目标项目数据集不足的情况下,能达到甚至超过数据集充足时项目内缺陷预测的预测效果。
  • 基于复杂网络的网构软件信任模型研究 免费阅读 下载全文
  • 信任问题是网构软件实体交互与协作需要解决的首要问题。传统信任模型在解决大规模复杂网络环境的信任问题方面存在网络开销大,信任收敛慢等问题。为解决该问题,提出了基于复杂网络的网构软件信任模型,将复杂网络的小世界特征和无标度特性引入到网构软件的信任模型当中,并给出了模型的定义、构造、信任计算及模型的动力学演化证明。Peer Sim仿真实验表明,复杂网络思想的引入,减小了信任链长度,降低了网络消息量,加快了信任收敛速率,为解决大规模分布式环境下构件节点的信任问题提供了有价值的新思路。
  • 系统域网络基于消减策略网络断层扫描方法 免费阅读 下载全文
  • 系统域网络是高性能计算机、数据中心的重要组成部分,当前系统域网络存在网络规模庞大,内部链路繁多,网络流量行为复杂和各种应用对网络性能状况敏感度高等特点,致使采用传统网络断层扫描方法进行性能测量的计算复杂度呈指数级增长。针对上述问题提出了一种基于消减策略的网络断层扫描方法(network tomography based on reduction strategy,NTRS)。该方法提出了预处理原则对实际物理拓扑进行策略约束,充分利用内部链路已知的性能信息缩小性能测量网络区域和关键链路覆盖,依据测量结果计算链路性能协方差,筛除性能状况较好的链路集合,实现链路数量的有效约简,进而很大程度上提高了网络诊断的准确性。通过模拟实验验证了NTRS方法的有效性,实验结果表明该方法能缩小链路性能参数的测量规模,降低计算的复杂度。
  • 解决BGP路由策略冲突的振荡抑制机制 免费阅读 下载全文
  • 边界网关协议(border gateway protocol,BGP)允许网络中的每个自治系统(autonomous system,AS)设定自己的路由策略来选择和通告路由。尽管这种自治性会使BGP路由策略的配置更加灵活,但有可能引发路由策略冲突,即路由振荡和发散,导致网络性能下降。为此,提出了振荡抑制机制以解决BGP路由策略冲突问题。该机制通过分析路由通告报文发现振荡路径,根据振荡次数修正路径的本地优先属性值,使稳定路径的本地优先属性值比振荡路径的大,从而使得稳定路径在路由决策阶段比振荡路径被选中的优先级高,达到抑制振荡路径进而解决路由策略冲突。在原型系统上实现并部署了所提出的机制,并对其进行了性能评价。结果表明,该机制具有较好的性能。
  • 基于马尔可夫决策过程的机会网络转发策略 免费阅读 下载全文
  • 在机会网络节点随机移动的场景中,提高路由算法性能评价中的投递率,控制开销率,降低平均迟延是持续的研究方向。由于目前机会网络结构稀疏和拓扑多变,单副本路由转发策略效率较低。通过结合花粉布朗运动与机会网络节点的随机运动的相似性,并分析节点随机运动的规律,定义了一种基于马尔可夫决策过程的节点转发策略。该策略在平均延时适当增加的情况下,可以有效控制网络开销率,提高消息投递率。最后通过仿真实验验证了理论模型的正确性。
  • 区间灰色不确定语言多属性群决策方法 免费阅读 下载全文
  • 针对属性值为区间灰色不确定语言信息的多属性群决策问题,在定义区间灰色不确定语言变量及其运算规则的基础上,给出了3种几何加权集结算子,由区间灰色不确定语言几何加权算子集结各决策者给出的决策矩阵得到群体决策矩阵。在属性权重已知的情形下,基于该算子集结单个决策者给出的属性权重向量得到群体属性权重向量;在属性权重完全未知的情形下,采用信息熵法确定属性权重向量。采用区间灰色不确定语言混合几何加权算子集结各属性评价信息,得到各方案的综合评价值,基于区间灰色不确定语言变量大小比较的方法得到方案排序结果。算例分析表明了该方法的有效性与可行性。
  • 基于多示例多标记学习的手机游戏道具推荐 免费阅读 下载全文
  • 手机游戏提供商通过在游戏中销售虚拟道具来获得收益。将游戏玩家日志数据中每个事件描述为一个示例,玩家对多种游戏道具的购买状态表示为多个标记,从而将游戏道具推荐问题抽象为多示例多标记学习问题。在此基础上,将快速多示例多标记学习算法用于手机网络游戏道具推荐,并利用半监督学习提升推荐性能。离线数据集以及实际在线手机网络游戏实验结果表明,基于多示例多标记学习的游戏道具推荐技术带来了游戏营收的显著增长。
  • 不定核大间隔聚类算法 免费阅读 下载全文
  • 受限于传统统计学习理论,大多数核方法都要求核矩阵半正定,但是在很多实际问题中这样的要求常常很难满足,由此产生了不定核。近年来,研究者们提出了一系列基于不定核的分类方法,取得了很好的性能,但是关于不定核聚类方法的研究相对较少,而且现有的核聚类算法基本上都是基于正定核而设计的,无法或者很难处理核矩阵不定的情况。针对此问题,以大间隔聚类(maximum margin clustering,MMC)模型为基础,提出了一种新的不定核大间隔聚类(indefinite kernel maximum margin clustering,IKMMC)算法。IKMMC算法旨在寻求一个正定核以逼近不定核,并将度量两者差异性的F-范数作为一个正则化项嵌入到MMC框架中。首先给定样本初始标记,然后迭代优化目标函数,并将每步迭代得到的样本预测错误率作为迭代终止条件。在每步迭代时,IKMMC算法进一步将目标函数转化为半无限规划(semi-infinite program,SIP)形式,并动态调整约束集进行交替优化。实验验证了IKMMC算法的有效性。
  • 基于叙词表的林业信息语义检索模型 免费阅读 下载全文
  • 随着互联网的快速发展,基于关键词字面匹配的信息检索方式已不能满足人们的需求。叙词表中所包含的语义关系是提高查全率和查准率的重要途径,如果将叙词表控制机制引入当前网络信息检索工具中,必然能在一定程度上提高信息检索的效率。利用叙词表中的词间关系,提出了一种计算叙词间语义相似度的方法,借助查询扩展的思想,设计了一种基于叙词表的林业信息语义检索模型。最后,以林业汉英拉叙词表中两个类目范畴作为实验对象,分别同百度搜索引擎、农业叙词表中所使用的检索方法进行了比较,实验结果表明,提出的检索模型可以更好地利用叙词表来改进传统的基于关键字的检索方式,此外,所提模型是通用的,为叙词表在网络信息系统中的应用提供了一种新的思路。
  • 容量约束的自组织增量联想记忆模型 免费阅读 下载全文
  • 自组织联想记忆神经网络因其并行、容错及自我学习等优点而得到广泛应用,但现有主流模型在增量学习较大规模样本时,网络节点数可能无限增长,从而给实际应用带来不可承受的内存及计算开销。针对该问题,提出了一种容量约束的自组织增量联想记忆模型。以网络节点数为先决控制参数,结合设计新的节点间自竞争学习策略,新模型可满足大规模样本的增量式学习需求,并能以较低的计算容量取得较高的联想记忆性能。理论分析表明了新模型的正确性与有效性,实验分析同时显示了新模型可有效控制计算容量,提升增量样本学习效率,并获得较高的联想记忆性能,从而能更好地满足现实应用需求。
  • 基于ILS-CS优化算法的个性化旅游线路研究 免费阅读 下载全文
  • 针对迭代局部搜索(iterated local search,ILS)算法求解旅游线路时间花费较长的问题,提出了一种ILS结合布谷鸟搜索(cuckoo search,CS)的优化算法,来优化旅游线路的时间花费。该算法首先根据相关目标和约束采用ILS算法求解旅游景点及初始旅游线路,然后在满足旅游景点时间窗约束及景点总数不变的情况下采用CS算法进一步最小化旅游线路的时间花费。该研究获得的线路更符合旅游习惯,并且旅游时间花费更少。通过Daminaos数据集和桂林景点数据集进行验证,结果表明该优化算法相比于仅使用ILS算法所规划出的旅游线路,平均时间花费减少8%,更符合用户旅游选择习惯。
  • [综述·探索]
    应用非负矩阵分解模型的社区发现方法综述(李亚芳[1,2];贾彩燕[1,2];于剑[1,2])
    [数据库技术]
    多策略相似度整合的XML模式匹配方法(范红杰;柳军飞;周鲁东;麻志毅)
    基于用户信任值的HDFS访问控制模型研究(史文浩;江国华;秦小麟;王胜)
    融合互近邻降噪的动态数据流分类研究(刘三民;王忠群;刘涛;修宇)
    [系统软件与软件工程]
    基于实例迁移的跨项目软件缺陷预测(毛发贵;李碧雯;沈备军)
    基于复杂网络的网构软件信任模型研究(谢新强;周进刚;张德阳;谢秋菊)
    [网络与信息安全]
    系统域网络基于消减策略网络断层扫描方法(黄杰;陈琳;王斌锋)
    解决BGP路由策略冲突的振荡抑制机制(于超;王兴伟;黄敏)
    基于马尔可夫决策过程的机会网络转发策略(张杨[1,2];王小明[1,2];林亚光[1,2];张丹[1,2])
    [人工智能与模式识剐]
    区间灰色不确定语言多属性群决策方法(韩二东;郭鹏;赵静)
    基于多示例多标记学习的手机游戏道具推荐(唐俊[1,2];周志华[1,2])
    不定核大间隔聚类算法(李森[1,2];薛晖[1,2])
    基于叙词表的林业信息语义检索模型(韩其琛[1,2];李冬梅)
    容量约束的自组织增量联想记忆模型(孙桃;谢振平;王士同;刘渊)
    基于ILS-CS优化算法的个性化旅游线路研究(侯乐;杨辉华[1,2];樊永显;李灵巧[1,2];蒋淑洁)
    《计算机科学探索》封面

    主管单位:工业和信息化部

    主办单位:华北计算机技术研究所

    社  长:谭继红

    主  编:何新贵

    地  址:北京619信箱26分箱

    邮政编码:100083

    电  话:010-51616055

    电子邮件:yuanjing@nci.ac.cn

    国际标准刊号:issn 1673-9418

    国内统一刊号:cn 11-5602/tp

    邮发代号:82-560

    单  价:25.00

    定  价:300.00