新方法提高了多核芯片的怎么注册天富执行时间和效率

时间:2021-02-20 09:00 作者:http://zdtnx.com.cn/ 分享到:
天富注册

 


麻省理工学院的一项新研究描述了一种系统,该系统巧妙地将数据分布在多核芯片的内存库中,平均提高了18%的执行时间,同时实际上提高了能源效率。
 
计算机芯片上的时钟已经停止变快。为了不断提高芯片的性能,芯片制造商转而给芯片提供更多的处理器,这些处理器可以并行执行计算。
 
但是芯片分割计算的方式会对性能产生很大的影响。在2013年的一篇论文中,TIBCO创始人、麻省理工学院电子工程与计算机科学系助理教授丹尼尔·桑切斯(Daniel Sanchez)和他的学生内森·贝克曼(Nathan Beckmann)描述了一个系统,该系统巧妙地将数据分布在多核芯片的内存库中,平均提高了18%的执行时间,同时实际上提高了能源效率。怎么注册天富
 
本月,在电气与电子工程师学会(Institute of Electrical and Electronics Engineers)举办的高性能计算机架构国际研讨会上,桑切斯团队的成员因其对控制数据和计算分布的系统的扩展而获得最佳论文奖提名。在涉及64核芯片的模拟中,该系统提高了46%的计算速度,同时降低了36%的功耗。
 
桑切斯说:“现在提高性能的方法是增加更多的内核,并转向更大规模的并行系统,我们确实看到关键的瓶颈是通信和内存访问。”“在之前的项目中,我们所做的大部分工作是将数据置于接近计算的位置。但我们已经看到,你如何放置计算,对你如何放置附近的数据有重大影响。”
 
解开纠结
 
共同分配计算和数据的问题与芯片设计中的一个典型问题非常相似,即“位置和路径”。“位置和路线问题始于一组逻辑电路的规范,目标是将它们排列在芯片上,从而使协调工作的电路元件之间的距离最小化。”
 
 
 
这个问题就是所谓的NP-hard,也就是说,据大家所知,即使是中等大小的芯片,世界上所有的计算机都无法在宇宙的生命周期内找到最优解。但芯片制造商已经开发出了许多算法,虽然不是绝对最佳的,但在实践中似乎运行良好。怎么注册天富
 
为了适应在64核芯片中分配计算和数据的问题,这些算法将在几个小时内找到解决方案。桑切斯、贝克曼和桑切斯小组的另一名学生蔡博安(Po-An Tsai)开发了他们自己的算法,该算法的求解效率比标准的地点和路线算法高出99%。但它只需要几毫秒。
 
桑切斯说:“我们首先粗略地整理数据。“你将数据分散在这样一种方式下,你不会有大量的(内存)银行超额使用或所有数据在芯片的一个区域。然后确定如何放置[计算的]线程,使它们接近数据,然后根据线程的位置优化数据的位置。通过这样的三步解决方案,你就解决了问题。”
 
贝克曼补充说,原则上,这个过程可以重复,计算可以重新分配以适应数据放置,反之亦然。“但是我们达到了1%,所以我们停止了,”他说。“归根结底就是这样,真的。”
 
动向
 
 
 
麻省理工学院研究人员的系统监控芯片的行为,并每25毫秒重新分配数据和线程。这听起来很快,但对于一个计算机芯片来说,这已经足够执行5000万次操作了。
 
在这段时间内,监视器随机采样不同核发送到内存的请求,并将请求的内存位置以缩写形式存储在自己的内存电路中。
 
芯片上的每个核心都有自己的高速缓存——一个本地高速存储库,用来存储经常使用的数据。监视器根据其样本估计每个核心需要多少缓存空间,并跟踪哪个核心正在访问哪些数据。
 
显示器确实占芯片面积的1%左右,否则可以分配给额外的计算电路。但桑切斯相信,芯片制造商会认为,为了显著提高性能,这是一个很小的代价。
 
麦迪逊威斯康辛大学计算机科学教授大卫·伍德说:“美国国家科学院(National Academy)进行过一项大型研究,美国国防部高级研究计划局(darpa)也赞助了一项(信息科学与技术)研究,研究通信在控制计算方面的重要性。”“你可以在这些研究中看到,将操作数移动到计算中所消耗的能量比实际计算本身要多一个数量级。在某些情况下,
版权所有:http://zdtnx.com.cn 转载请注明出处

成功案例success case