定兴| 达尔罕茂明安联合旗| 枣强| 墨江| 正蓝旗| 丰宁| 蓬莱| 桦甸| 保靖| 田林| 黄冈| 宁陕| 南海镇| 麦盖提| 镶黄旗| 博鳌| 洛南| 沿滩| 越西| 罗定| 花垣| 牟平| 鹤山| 惠民| 遂溪| 高港| 中山| 大石桥| 定远| 磐石| 湘乡| 乌海| 阜宁| 富宁| 松阳| 上林| 松原| 甘洛| 密云| 吉水| 江津| 马龙| 珊瑚岛| 金山屯| 耒阳| 潮州| 红古| 茶陵| 内乡| 阿拉尔| 景泰| 洛宁| 济宁| 龙门| 嘉义县| 新丰| 平遥| 景德镇| 南京| 清水河| 黄陵| 剑川| 双牌| 台北县| 德州| 洱源| 合江| 汕头| 崇仁| 邳州| 长子| 甘谷| 七台河| 广平| 大宁| 泽库| 巴林左旗| 泸溪| 福泉| 依兰| 田林| 泾县| 蒙阴| 兴城| 建始| 闵行| 平武| 柳江| 汪清| 莒南| 叶县| 普安| 桂东| 越西| 桦川| 黔江| 临泽| 兴文| 望奎| 武邑| 枣阳| 肇东| 苏家屯| 五莲| 灵丘| 乌拉特后旗| 苏家屯| 麟游| 石景山| 定南| 承德市| 离石| 镶黄旗| 益阳| 略阳| 大悟| 绍兴县| 囊谦| 绥中| 新巴尔虎左旗| 察哈尔右翼中旗| 晋州| 伊通| 新乡| 余庆| 彝良| 马关| 东方| 林口| 天水| 确山| 镇安| 安西| 富拉尔基| 清河门| 泰顺| 阳江| 山丹| 泗洪| 保山| 黑水| 芦山| 井陉| 合肥| 安龙| 库车| 石狮| 扎囊| 林西| 黟县| 鹤壁| 陆丰| 深州| 达尔罕茂明安联合旗| 汪清| 临沂| 哈尔滨| 建始| 承德县| 郓城| 连州| 香格里拉| 会东| 衢州| 内蒙古| 尉犁| 政和| 镇平| 桐柏| 隆安| 越西| 临沂| 双峰| 同德| 大厂| 雷山| 密云| 禄丰| 祁门| 朗县| 汉沽| 平罗| 科尔沁左翼中旗| 玉门| 南山| 竹山| 洞头| 怀柔| 黄埔| 利辛| 嘉善| 本溪市| 雄县| 札达| 李沧| 武鸣| 襄城| 肇东| 工布江达| 郧西| 左权| 常州| 永清| 扬州| 贵德| 清徐| 大理| 渭南| 巩留| 江夏| 姜堰| 黄岛| 无极| 涉县| 富裕| 商水| 虎林| 镇平| 巫山| 滴道| 浏阳| 循化| 长安| 郴州| 柞水| 铁岭县| 中江| 黟县| 弥勒| 大英| 宿豫| 沽源| 个旧| 兴和| 武陵源| 谢通门| 宜宾县| 博乐| 邢台| 清徐| 海原| 曲周| 新宁| 黄陵| 马鞍山| 察哈尔右翼前旗| 漳州| 阳新| 西畴| 宿迁| 怀集| 盐都| 台儿庄| 澳门| 珙县| 绿春| 伊川| 丰南| 茂县| 遂川| 七台河| 林州| 梁平| 黑水|

莲都区人大常委会:讲政治 浓学风 切实加强意识形态建设

2018-12-19 17:33 来源:东北新闻网

  莲都区人大常委会:讲政治 浓学风 切实加强意识形态建设

  牛宝宝电影网据介绍,从3月24日开始到4月5日,哈尔滨市殡葬事务管理所开展清明树新风系列文明祭扫活动。对于代表委员提出问题和合理化建议,能当场解决的,立即解决,对于不能立即整改到位的,明确整改工作时限,列入督办事项,确保大走访活动达到倾听意见建议、解决实际困难、促进工作转变、凝聚税企共识的积极作用。

要突出系统,全县各级党组织和领导干部要充分发挥引领带动作用,组织好专题讲座、专题培训和专题研讨,带领全县各级干部职工抓好学习贯彻。中国最好的人像摄影师肖全回到了暌别三十年的家乡成都,他准备为这座城市,这个时代的普通人拍摄一张一生中最好的照片。

  全省各级政法机关要牢固树立四个意识,紧密团结在以习近平同志为核心的党中央周围,坚持以习近平新时代中国特色社会主义思想武装头脑,坚决维护以习近平同志为核心的党中央权威和集中统一领导,真正做到思想上认同核心、政治上维护核心、行动上紧跟核心。会议强调,要把推进新型城镇化作为重大战略任务,加强领导、落实责任,一以贯之、久久为功,不断形成推进新型城镇化发展的强大合力。

  办理完备案手续后,参保人员可持医保卡到就医地(所辖市、县)任意一所异地定点医院进行就医。要以学习宣传贯彻全国两会精神为契机,切实做好宣传思想文化战线大调研工作,发扬唯实求真精神,广泛深入调查研究,以大调研推动大落实、促进新发展。

会议指出,这次全国两会是在中国特色社会主义进入新时代,全面贯彻党的十九大精神的开局之年,决胜全面建成小康社会、开启全面建设社会主义现代化国家新征程的关键时期,召开的十分重要的会议,在党和国家事业发展史上具有里程碑意义。

  袁勤华一行还深入沙溪滨河路项目、金沙御景项目、高铁综合体项目、汽车产业园项目,210国道改线工程、登瀛大道等地进行实地查看,了解各项目规划设计、工程进展情况以及我区城市建设总体规划和建设情况。

  3月10日,华西都市报-封面新闻记者在外卖平台饿了么上,短时间内搜索到了不少卖香烟的小超市,不仅购买流程快捷流畅,而且没有确认和识别购买者是否成年。主城区:多云间晴,15~25℃。

  打造改革开放新高地,成为不少地方今年的重点工作之一,包括四川、安徽等地都在全国两会期间提交了探索建设自贸港或者自贸区的建议。

  国务院2018年3月22日(此件公开发布)国务院关于部委管理的国家局设置的通知国发〔2018〕7号各省、自治区、直辖市人民政府,国务院各部委、各直属机构:根据党的十九届三中全会审议通过的《深化党和国家机构改革方案》、国务院第一次常务会议审议通过的国务院部委管理的国家局设置方案,现将部委管理的国家局设置通知如下:国家信访局,由国务院办公厅管理。海葬仪式上,主持人深情宣读了催人泪下的祭文,家属们集体举行了默哀礼,亲属们用白色丝带系住可降解骨灰罐,再捧上一捧菊花敬献在降解罐上,与已故亲人做最后的道别。

  临床免疫乙型肝炎表面抗原(HBsAg)、乙型肝炎表面抗体(HBsAb)、乙型肝炎E抗原(HBeAg)。

  牛宝宝电影网科学技术部对外保留国家外国专家局牌子。

  数字经济已成为近年来带动经济增长的核心动力,2016年我国数字经济对GDP的贡献已达到%。市委书记陈敏尔主持会议并讲话。

  邮箱大全 户籍网 牛宝宝电影网

  莲都区人大常委会:讲政治 浓学风 切实加强意识形态建设

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网 读懂智能&未来
人工智能 正文
发私信给程弢
发送

0

莲都区人大常委会:讲政治 浓学风 切实加强意识形态建设

本文作者:程弢 2018-12-19 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
户籍网 中国能够解决与美国的关税问题,但贸易风险将增加。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网(公众号:雷锋网)了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
秒速赛车 秒速赛车 秒速赛车 秒速赛车 邮箱大全 牛宝宝电影网 户籍网