设为首页 | 加入收藏
文献检索:
  • Preface
  • Technological Exploration of RRAM Crossbar Array for Matrix-Vector Multiplication
  • 矩阵向量增加是为许多计算地集中的算法的关键操作。抵抗切换的随机的存取存储器(RRAM ) 设备和 RRAM 闩穿的新兴的金属氧化物表明了模拟矩阵向量增加的一条有希望的硬件认识与超离频精力效率。在这篇论文,我们分析设备水平和电路水平的影响非理想的因素包括 RRAM 设备的非线性的当前电压的关系,设备制造的变化并且给操作,和 interconnect 抵抗以及另外的闩数组写参数。在那上,我们建议工艺的探索流动让设备参数配置克服非理想的因素的影响并且为各特定的申请在性能,精力,和可靠性之中完成一宗更好的交易。我们向量机器(SVM ) 和混合公民标准和技术(MNIST ) 模式识别数据集开创的支持的模拟结果证明那个 RRAM 闩数组基于 SVM 是柔韧的输入信号变化但是对通道差距偏差敏感。进一步的抵抗决定测试一台 6 位的 RRAM 设备对有能力的礼品在 90% 附近认识到识别精确性,显示 RRAM 闩数组的物理可行性基于 SVM。另外,建议工艺的探索流动能与以前的工作相比在 MNIST 数据集和 26.4% 精力积蓄上完成识别精确性的 10.98% 改进。试验性的结果也证明节省的超过 84.4% 力量能以很少精确性减小的成本被完成。
  • BACH: A Bandwidth-Aware Hybrid Cache Hierarchy Design with Nonvolatile Memories
  • 有限主要记忆带宽在 chipmultiprocessor (CMP ) 正在成为一个基本表演瓶颈设计。然而直接增加山峰记忆带宽能招致高费用和电源消费。在这份报纸,我们由建议记忆处理这个问题,一个带宽知道的可配置的缓存层次, BACH,与混合存储器技术。我们的 BACH 设计的部件包括一个混合缓存层次,重构机制,和一台统计预言引擎。我们的混合缓存层次与各种各样的带宽特征选择不同记忆技术,例如纺纱转移转矩记忆(STT-MRAM ) ,抵抗记忆(ReRAM ) ,和嵌入的 DRAM (eDRAM ) ,设置每水平以便全面缓存层次的山峰带宽被优化。我们的重构机制能动态地基于运用工作量的预言的带宽要求调整每水平的缓存能力。带宽预言被我们的预言引擎执行。我们评估 BACH 设计获得与的系统性能获得一套多线程并且有或没有系统的限制的 multiprogrammed 工作量驱动预算。与传统的基于静态存储器的缓存设计相比, BACH 在 58% 和 14% 改进系统产量与多线程并且 multiprogrammed 工作量分别地。
  • Performance-Centric Optimization for Racetrack Memory Based Register File on GPUs
  • 为 GPU 建筑学的高效的关键躺在它的巨大的穿能力驾驶很多核心并且启用在线程之中重叠的执行。事实上,然而,能同时执行的线程的数字被收款机文件的尺寸经常在 GPU 上限制。传统的基于静态存储器的寄存器文件那么收起它不能放大遇见 GPU 应用程序的增加的需求的大量芯片区域。跑道记忆(RM ) 是为由于它的高数据存储密度在 GPU 上设计大能力收款机文件的一种有希望的技术。没有基于 RM 的寄存器文件的小心的推广,然而, RM 的过长的移动操作可以伤害性能。在这份报纸,我们为为 GPU 建筑学设计高效的收款机文件探索 RM。在他们被存取以前,改进线程水平并行(TLP ) ,但是如果寄存器的位没被排列到端口,转移操作的高存储密度 RM 帮助被要求移动位到存取端口,并且因此,读 / 写的操作被推迟。我们在 GPU 上为基于 RM 的收款机文件开发一个优化框架,它分别地在应用程序,编译,和建筑学水平采用三种不同优化技术。更清楚地,我们在应用程序水平优化 TLP,设计在编译水平印射算法的一个寄存器,并且设计在体系结构水平的 preshifting 机制。一起,没有引起缓存和收款机文件资源竞争和还原剂移动操作开销,这些优化帮助决定 TLP。用许多代表性的工作量的试验性的结果证明我们的优化框架完成多达 29%(21% 平均) 表演改进。
  • Modelling Spiking Neural Network from the Architecture Evaluation Perspective
  • 启发大脑的刺的神经网络(SNN ) 计算范例为低力量、可伸缩的计算提供潜力,适合到常规计算系统发现困难的许多聪明的任务。在另一方面, NoC (network-on-chips ) 基于很大的规模集成(美国芯片组供应商) 系统广泛地被用来模仿 neurobiological 体系结构(包括的 SNN ) 。这份报纸从方面为 SNN 应用建议评估方法论微建筑学。首先,我们从神经系统的存在模拟器提取精确 SNN 模型。第二,一个周期精确的 NoC 模拟器被实现执行上述的 SNN 应用给预定并且 energyconsumption 信息。我们相信这个方法不仅有益于 NoC 设计空间的探索而且衔接在应用程序之间的差距(特别那些从 neuroscientists 社区) 并且 neuromorphic 硬件。基于方法,我们以预定和精力评估了一些典型 SNN。方法为 neuromorphic 硬件和应用的发展是珍贵的。
  • Optimization Strategies Oriented to Loop Characteristics in Software Thread Level Speculation Systems
  • 线程水平推测为线级的并行利用提供不仅一个简单平行编程模型,而且有效机制。思索的平行建模的软件的性能被环的不同类型引起的高全球的开销限制。这些环通常有相关性的不同特征和优化策略的不同要求。在这份报纸,我们建议三种全面优化技术减少全球开销的不同因素,瞄准从环的不同类型的要求。内部线的取能与经常的相关性减少环的高 mis 推测率,打乱次序的承诺能与很少发生的相关性减少环的控制开销,当缩放的提高的动态任务颗粒度能减少控制开销并且与改变相关性的特征优化环的全球开销时。所有这三种优化技术在 HEUSPEC 被实现了,一个软件 TLS 系统。试验性的结果显示他们能从基准的不同的组满足要求。这些技术的联合能改进所有基准的表演并且到达更高平均的加速。
  • Modular Timing Constraints for Delay-Insensitive Systems
  • 这份报纸介绍 ARCtimer,为当模特儿,产生,验证,并且强制预定为单个自我预定的握手部件的限制的一个框架。限制保证门级的电路实现服从的部件部件握手协议说明。因为握手协议是 delayinsensitive,用证实 ARCtimer 的部件造的自我预定的系统也是延期感觉迟钝的。由小心地局部地考虑时间,我们能全球性忽略时间。ARCtimer 作为为以后的系统使用造验证部件的一个图书馆的部分在设计进程早来。图书馆也存储预定在任何自我预定的系统验证并且强制部件限制的代码造了使用图书馆的分析(STA ) 的静电干扰。对部件电路,协议,预定限制,和 STA 编码的一只握手的图书馆描述对以后技术印射或布局工具在设计进程使用的电路修正柔韧。除了介绍新工作并且讨论相关工作,这份报纸识别批评选择并且解释模块化的预定确认什么必要并且它怎么工作。
  • Optimizations for High Performance Network Virtualization
  • 在分布式的节点之中的集中的 interoperaterbility 的增加的要求需求高效网络连接,由于云计算和 datacenters 的实质的生长。网络 I/O 虚拟化聚集网络资源并且为特别服务器或设备把它分开成可管理的部分,它象减少的费用一样向有效巩固和有弹性的管理提供高活泼,灵活性和可伸缩性并且打电报。然而,两个都联网 I/O 虚拟化聚集和增加的网络速度招致更高交通的密度,它为 I/O 数据移动和处理的 I/O 事件产生一个重系统压力。因而,许多研究人员奉献了给提高系统性能并且为高效联网虚拟化减轻系统开销。这份报纸首先详细描述 mainstreaming I/O 虚拟化方法论,包括帮助的模拟,裂口司机模型和硬件建模的设备。然后,纸在实际实用程序除了表演瓶颈讨论并且比较他们的特定的优点。这份报纸主要为网络 I/O 虚拟化象可移植性管理一样为性能优化和改进集中于 stateof-the-art 途径的全面调查。途径为动态网络状态包括各种各样的新奇数据交货计划,为中断处理的架空的缓解和足够的资源分配。最后,我们在网络虚拟化基础结构除性能改进以外加亮 I/O 虚拟化的差异。
  • Metcalfe's Law and Network Quality: An Extension of Zhang et al.
  • Techniques for Design and Implementation of an FPGA-Specific Physical Unclonable Function
  • 物理 unclonable 功能(PUF ) 在 IC 的生产期间使用控制不了的过程变化为每 IC 产生唯一的签名。它在象 FPGA 知识产权(IP ) 那样的安全有宽应用保护,关键产生和数字权利管理。戒指振荡器(RO ) PUF 和仲裁人 PUF 是最流行的 PUF,但是他们特殊没为 FPGA 被设计。当获得更少的挑战反应对时, RO PUF 招致高资源开销,并且要求“难宏”在 FPGA 上实现。仲裁人 PUF 带低资源开销,但是当它在 FPGA 上被印射时,它的结构有大偏爱。Anderson PUF 能探讨在 FPGA 上实现的当前的仲裁人和 RO PUF 的这些软弱。然而,它不能直接在新一代上被实现 28 nm FPGA。以便处理这些问题,这份报纸设计并且实现在 SLICEM 使用二 LUT 实现 PUF 的二个16位移动寄存器的基于延期的 PUF ,在carry 链到的 2-to-1 multiplexers 实现 PUF 的 multiplexers ,并且 8 个正反器到中的任何一个拴住1位的 PUF 签名。建议基于延期的 PUF 完全在 28 nm 广告 FPGA 上被认识到,并且试验性的结果显示出它的高唯一,可靠性和可配置性。而且,我们测试老化的影响上它,和建议 PUF 上的老化的效果是不足道的结果表演,与仅仅 6% 小点扭动。最后,在 FPGA 有约束力、不稳定的关键产生的建议 PUF 的前景被讨论。
  • A Unified Buffering Management with Set Divisible Cache for PCM Main Memory
  • 这研究建议阶段变化记忆(脉冲编码调制) 与基于超级块的适应缓冲结构和它的联系设置的可分的持续水平缓存(LLC ) 的有效联合基于主要存储器系统。为了完成类似于动态随机存取的记忆( DRAM )的高效,基于主要记忆,基于超级块的适应缓冲区( SABU )由双 DRAM 缓冲区组成,即,一个好攻击的基于超级块的预取缓冲区( SBPB )和再使用的适应亚块缓冲( SBRB ),并且设置的可分的 LLC 基于一个缓存空间优化计划。根据我们的实验,更长的脉冲编码调制存取潜伏能典型地用我们的建议 SABU 被隐藏,它能显著地减少数字在 26.44% 在脉冲编码调制主要记忆上写。SABU 途径能减少脉冲编码调制存取潜伏直到 0.43 次,与常规 DRAM 主要存储器相比。同时,平均记忆精力消费能被 19.7% 减少。
  • AS-Index: A Structure for String Search Using n-Grams and Algebraic Signatures
  • 我们在场当索引,为在磁盘居民数据库的准确字符串搜索的新索引结构。当索引依靠古典转换文件结构,其主要革新基于为 n 克哈希和模式搜索使用的代数学的签名的性质是概率的搜索。明确地,我们的签名的性质允许由仅仅检查二张张贴的表执行搜索。算法因此享受要求磁盘存取的一个经常的数字的唯一的特征,独立地,从两个,模式尺寸和数据库缩放。我们在大数据集上进行广泛的实验评估我们的索引行为。他们证实获得张贴的表稳定地提供与必要的二磁盘存取成正比的搜索表演。这为在大文本的数据库要求很快的查找的应用的班使我们的结构成为兴趣的一种选择。我们描述索引结构,我们代数学的签名的使用,和搜索算法。我们基于影响我们的结构的行为的参数讨论运作的交易,并且介绍理论、试验性的性能分析。我们下次把当索引与最先进的选择作比较并且显示出那 1 )它的构造时间匹配它的竞争者的由于结构的类似, 2 )至于搜索时间,它常常超过标准途径由于签名计算补充的数据的节俭的存取,它在我们的搜索方法的核心。
  • Context-Based Moving Object Trajectory Uncertainty Reduction and Ranking in Road Network
  • 到大量 GPS 数据从各种各样的动人的对象产生了的支持,后端服务器通常存储 low-sampling-rate 轨道。因此,没有精确位置信息能从后端服务者直接被获得,无常是时间空间的数据的一个固有的特征。怎么这样处理无常成为一个基本、挑战性的问题。很多研究坚硬地自己在一个动人的目标的无常上被进行了并且从它被导出的上下文孤立。然而,我们发现动人的目标的无常能高效地被减少并且有效地评价使用上下文知道的信息。在这篇论文,我们集中于 contextaware 信息并且建议一个综合框架,基于上下文的无常减小并且评价(发咕咕声) ,减少并且评价轨道的无常。明确地,给二连续采样,我们试图根据从上下文提取的信息推断并且评价可能的轨道。当一些上下文知道的信息能被用来评价无常时,自从一些,上下文知道的信息能被用来减少无常,到因此利用他们,自然地发咕咕声由二个阶段组成:补充对方的减小舞台和评价舞台。我们也实现一个原型系统验证我们的解决方案的有效性。广泛的实验被进行,评估结果表明效率和高精确性发咕咕声。
  • RiMOM-IM: A Novel Iterative Framework for Instance Matching
  • 匹配的例子,瞄准发现在知识库之间的例子的通讯,在语义网是为分享的本体论的数据和集成的一个基本问题。尽管可观的例子匹配途径已经被建议了,怎么保证当处理大规模知识库时,高精确性和效率仍然是大挑战。这份报纸建议一个反复的框架, RiMOM-IM (匹配的 RiMOM 例子) 。在这个框架后面的关键想法是充分利用特殊、可得到的匹配的信息改进效率并且控制错误繁殖。我们参予了本体论排列评估行动(OAEI ) 的 2013 和 2014 比赛,并且我们的系统被评价第一。而且,以前的 OAEI 数据集的实验也证明我们的系统执行最好。
  • A Game-Based Approach for PCTL* Stochastic Model Checking with Evidence
  • 随机的模型检查是检查的古典模型的最近的延期和归纳,它集中于检查一个系统模型的时间的性质的份量上。PCTL * 是重要量的性质说明语言之一,它与概率界限严格地是比 PCTL (概率的计算树逻辑) 或 LTL (线性时间的逻辑) 更富有表达力的。目前, PCTL * 随机的模型检查算法是很复杂的,并且不能提供一个公式为什么或不控制一个给定的模型的任何相关解释。为处理这个问题,为 PCTL 的一条直觉、简明的途径 * 随机的模型与证据检查在这份报纸被提出,它包括:为 PCTL 介绍比赛语义 * 在 release-PNF (版本积极的正常形式) ,定义 PCTL * 随机的模型检查游戏,用策略在比赛解决完成 PCTL * 随机的模型检查,并且作为证据精制赢的策略证明随机的模型检查结果。稳固和基于比赛的 PCTL 的完全性 * 随机的模型检查被证明,并且它的复杂性匹配知道更低、上面的界限。基于比赛的 PCTL * 随机的模型检查算法在一个视觉原型工具中被实现,并且它的可行性被一个解说性的例子表明。
  • Adaptive Photon Mapping Based on Gradient
  • 光子印射能高效地模仿一些特殊效果例如阴影和 caustics。在二个阶段的光子印射跑:产生阶段和发光评价阶段的光子地图。在这份报纸,我们在第二个阶段集中于带宽选择过程,当它能显著地影响最后的质量。如果很少光子是镇定的,如果很多光子是镇定的,有噪音的差的结果产生,当偏爱出现时。以便解决这个问题,我们建议一个适应发光评价答案由改变附近的光子的数字和形状获得在噪音和偏爱之间的交易根据发光坡度收集了区域。我们的途径能在两个被使用直接并且间接照明计算。最后,当与印射算法的原来的光子相比完美地保留高频率特征时,试验性的结果证明我们的途径能生产更光滑的质量。
  • Special Section on Data Management and Data Mining
  • Preface(Wen-Guang Chen(1); Xiao-Fei Liao(2);)
    Technological Exploration of RRAM Crossbar Array for Matrix-Vector Multiplication(Lixue Xia[1,2];Peng Gu[1,2];Boxun Li[1,2];Tianqi Tang[1,2];Xiling Yin[1,2];Wenqin Huangfu[1,2];Shimeng Yu;Yu Cao;Yu Wang[1,2];Huazhong Yang[1,2])
    BACH: A Bandwidth-Aware Hybrid Cache Hierarchy Design with Nonvolatile Memories(Jishen Zhao;Cong Xu;Tao Zhang;Yuan Xie)
    Performance-Centric Optimization for Racetrack Memory Based Register File on GPUs(Yun Liang Shuo Wang)
    Modelling Spiking Neural Network from the Architecture Evaluation Perspective(Yu Ji You-Hui Zhang Wei-Min Zheng)
    Optimization Strategies Oriented to Loop Characteristics in Software Thread Level Speculation Systems(Li Shen[1,2] Fan Xu[1,2] Zhi-Ying Wang[1,2])
    Modular Timing Constraints for Delay-Insensitive Systems(Hoon Park[1,2];Anping He;Marly Roncken;Xiaoyu Song;Ivan Sutherland)
    Optimizations for High Performance Network Virtualization(Fan-Fu Zhou Ru-Hui Ma Jian Li Li-Xia Chen Wei-Dong Qiu Hai-Bing Guan)
    Metcalfe's Law and Network Quality: An Extension of Zhang et al.(Leo Van Hove)
    Techniques for Design and Implementation of an FPGA-Specific Physical Unclonable Function(Ji-Liang Zhang;Qiang Wu;Yi-Peng Ding;Yong-Qiang Lv;Qiang Zhou;Zhi-Hua Xia;Xing-Ming Sun;Xing-Wei Wang)
    A Unified Buffering Management with Set Divisible Cache for PCM Main Memory(Mei-Ying Bian Su-Kyung Yoon Jeong-Geun Kim Sangjae Nam Shin-Dug Kim)
    AS-Index: A Structure for String Search Using n-Grams and Algebraic Signatures(Camelia Constantin;Cedric du Mouza;Witold Litwin;Philippe Rigaux;Thomas Schwarz)
    Context-Based Moving Object Trajectory Uncertainty Reduction and Ranking in Road Network(Jian Dai[1,2,3];Zhi-Ming Ding;Jia-Jie Xu)
    RiMOM-IM: A Novel Iterative Framework for Instance Matching(Chao Shao;Lin-Mei Hu;Juan-Zi Li;Zhi-Chun Wang;Tonglee Chung;Jun-Bo Xia)
    A Game-Based Approach for PCTL* Stochastic Model Checking with Evidence(Yang Liu[1,2];Xuan-Dong Li;Yan Ma)
    Adaptive Photon Mapping Based on Gradient(Chun-Meng Kang[1,2];Lu Wang;Yan-Ning Xu;Xiang-Xu Meng;Yuan- Jie Song)
    Special Section on Data Management and Data Mining
    《计算机科学技术学报:英文版》封面
      2010年
    • 01

    关于我们 | 网站声明 | 合作伙伴 | 联系方式
    金月芽期刊网 2017 触屏版 电脑版 京ICP备13008804号-2