资讯 > 正文

芯片功耗管理:权衡性能和功耗

发布时间:2006-10-12 作者:Frank J. Bartos,CONTROL ENGINEERING 责任编辑

  动态频率和电压调整、时钟门控以及“低功耗模式”是目前用以降低芯片和微控制器功耗的一些方法,更加新的方法正在完成之中。

  把数目不断增加的晶体管和越来越高的性能挤到尺寸越来越小的芯片级产品(和嵌入式微处理器)中去,正揭示了一个亟待解决的功耗问题。
  随着硅器件产品不断缩小到90纳米、65纳米甚至更小的处理节点时,不是运行速度而是能耗成为了性能瓶颈。
  芯片功耗管理的基本宗旨是这些器件的所有功能元件或资源并非同时或一直需要用动力驱动。目前正在运用的各种技术都贯彻了这一宗旨。此外,一些解决硅衬底、制程和系统级功耗的革新方法也在完成之中。
  这个问题令人生畏;但解决方案的前景是广阔的。

  多内核运动
  切换功能元件以适应运行工况的能力是制止能耗的一种方法。英特尔公司在这个领域最新的方法是采取多内核技术的形式——在一个硅片或硅组件上集成多个独立的处理内核。这种架构可灵活分配整个芯片功耗;例如,在一个特定的应用中,一个内核能处理多线程,则关闭另一个内核的部件来降低功耗。拥有两个(或更多个)内核增加整体灵活性调整能耗。
  英特尔公司结构工艺部门市场经理Phil Ames解释道:“‘内核跳跃机制’可以用来向多个内核分配任务,于是功率耗散可以通过更大范围的区域面积散发出去。多内核处理器还能在低速时钟和低电压下运行,每瓦耗电量产生更大的效能。”他补充道:“尽管单核芯片也能在低速低压下运行,但切换功能元件并不那么有效。”
  英特尔公司还提到较低的运行速度/电压以及更多的分配任务可降低“为保持这些器件可靠性所需的散热成本”,因为它们不像单核器件那样集中处于受热状态。

处理器“性能状态”降低功耗和冷却要求

                        图1:被称之为AMD公司OPTERON处理器独有的5 个功耗状态, 有助于降低
                        CPU内核平均功耗,使性能与应用相适应。降低电压是降低能耗的主要因素。
  Advanced Micro Devices(AMD)公司也正在转向双核技术。AMD公司Opteron产品经理Brent Kerby解释说,因为AMD64架构“是完全考虑多内核”设计的,所以在同一块芯片上放置另一个内核并不明显改变功耗和热温范围。在架构中适当集成多个内核可减少功耗。这是如何做到的呢?降低核心级电压和频率,由于增加了内核,性能多少有所提升。他说:“速度、电压和能耗之间的权衡还在不断地进行着。”重要的是,包括对存储控制器供电,单核和双核最大功耗保持在95瓦。根据Kerby所讲,这大大低于业界同类芯片产品的功耗。
  Kerby说:“在一个给定平台,服务器段有多线程工作量时,在最小程度改变功耗和散热要求的情况下,增加更多个内核可提升计算性能,还能减少能耗处理器所需的数目。”
  AMD公司认为处理器功耗管理技术在过去的几年里已引起高度的关注。他指出,在服务器段,为了提高芯片级的能效仍需对一些项目进行优化。一些平台级的基础设施也能得益于能效的提高。Kerby列举了这一范畴的存储技术、处理器和存储器的电压调整模块,尤其是电源部分——许多只提供了70%的效率。

  一个发展中的问题
  飞思卡尔半导体公司认识到功耗管理对设计工程师们来说虽然是易控制的,但这是一个发展中的问题。飞思卡尔半导体公司负责16/32位用户和工业公司的全球市场经理Jeff Bock认为,若芯片和硬件开发允许设计者有选择性地在功能、速度和运行时间之间进行选择,则功耗管理是易控制的。
  ■ 灵活的时钟门控(能根据应用关闭芯片级和内核部分时钟);
  ■ 功耗管理模块关闭未被使用的芯片元件;以及
  ■ 旁路时钟使一些部件几乎在直流水平下(大大低于1kHz)超低功耗运行,这在使用标准时钟是不可能实现的。
  Bock说:“选择有功耗管理选项的处理器可打开管理功耗的大门。”
  其次,设计师需要了解如何启动各种处理器选项获得最小能耗。这需要工具(编译器、调试器)、培训和附属材料,如对设计者有帮助的应用笔记或其它基于网络/纸面的工具。Bock指出:“软件设计技术也讲究权衡;编写使系统高效快速运转的指令和使系统资源消耗最小化的指令都会对系统能耗产生很大的影响。”

  提出空闲模式
  开发和制造先进半导体和微控制器(MCUs)的全球领导商Atmel公司也积极地投身于功耗管理技术研究。它最新的AVR picoPower技术提出电池供电器件等许多应用它们大多时间都处于空闲状态,然而,即使是在睡眠模式下它们都会耗电。
  具有picoPower技术的微控制器相对业界同类控制器是超低功耗。Atmel公司介绍说,在工作模式下的标准电流低至340uA,1MHz空闲模式下为150uA,节能模式下为650nA,断电模式下为100nA。
  在picoPower技术的显著特性中,有一个不同寻常的欠压检测器(BOD),因为它带有睡眠模式。欠压检测器检测电源电压的工作阈值,一旦检测到失电就会启动一个复位信号,以保护重要数据和控制器。欠压检测器分好几种,AVR产品经理B?rd M. Pedersen解释道:“零电压或低电压情况下欠压检测器就会反应又慢又不准确,而更准确更快的欠压检测器往往会耗费更多的电。”而且,大多数欠压检测器在处理器处于睡眠模式时仍是激活的。据Atmel公司所讲,这会造成明显的漏电功耗,尤其是电池供电的器件,因此大多数低功耗微控制器厂商在设计各自的欠压检测器时都会通过牺牲速度和准确性来降低电耗。
  Atmel公司采取的则是一种不同的方法:不需要欠压检测功能时,在睡眠模式下自动使欠压检测器停止工作。但是,在控制器被唤醒时(在执行任何指令前),电路快速响应(2微秒)激活欠压检测器。Pedersen说:“欠压检测器是最后一个关闭而又最先开启的。”而欠压检测器在正常操作状态下有着足够大的电流,从而能够在1.8伏特、2.7伏特和4.5伏特的条件下提供准确的欠压探测。Pedersen补充道:“这种方法提供更佳的保护而且漏电功耗明显减少。”

英特尔公司酷睿双核处理器
    图2:英特尔公司酷睿双核处理器在单块芯片上嵌入两个高性能执行内核。为了精确监控器
件发热情况,英特尔公司先进的热能管理技术支持各个内核的数字式温度传感器。

  在英特尔公司的解决方案中,英特尔公司引证了有效的功耗管理方法:处理器上或系统中的模块未被使用时,使其“进入睡眠状态”,从而降低功耗要求。例如,“增强型英特尔SpeedStep技术”可动态调整处理器电压和内核频率,降低了功耗,从而减少发热量——由此改善了散热风扇噪音,因为系统级风扇不需要快速旋转。还有,英特尔公司酷睿双核(Core Duo)处理器的全新节能机制使双核处理器的共享高速缓存可以根据需求或在空闲期间内动态刷新系统内存。英特尔公司Ames指出:“数据保存在内存中后,节能特性将随着高速缓存通道的关闭而开启。这丝毫不影响用户对性能的满意程度。”

  远期发展方向
  他补充道:“一个微处理器仅占系统总能耗的一个部分,工程队必须对其各个方面和(涉及到的)预期性能水平进行评估。一旦理解了要求,可重新分配或卸载具体功能元件,对性能与能效和/或内存足迹要求进行权衡。”
  除了多核技术以外,英特尔公司还积极研究降低漏电电流等其它提高能效的方法。Ames提到问题的关键是用高K电介质材料和不同的栅极金属对付在较小的芯片处理节点上的漏电电流。英特尔公司声称使用高K电介质材料和传统的二氧化硅电介质相比漏电电流减少100倍。
  另一个提高能效(和芯片性能)的新方法是这样一种工艺规程:迫使硅原子与半导体材料分开,减小电子通行所受到的阻碍。所谓的“应变硅”能够降低能耗和发热量。Ames指出使用英特尔公司专有的应变硅,漏电电流可减少5倍;使用英特尔公司移植到65纳米制程的第二代应变硅,漏电电流再减少4倍。
  在AMD公司,正在使用的功耗管理方法从略粗的性能状态(降低核电压和频率)延伸到数据粒度非常精细的方式。这包括区块层级法,某些芯片单元未被使用期间适当关闭,并对单个晶体管使用时钟门控技术,例如,按照Kerby说法:“在尽可能大的范围内采取功耗管理。今后,这些技术会更大范围地运用到CPU以外的设备。”
  存储控制器就是这样一个外围设备,AMD公司已将其集成到处理器上,带来的好处就是使存储器与CPU,I/O与CPU以及CPU与CPU之间都可以直接相连,进行更多的线性对称多处理,还有功耗更低。Kerby强调AMD Opteron双核处理器包括存储控制器最大功耗状态是95W。
  在设计各代产品性能时,要权衡和考虑内存足迹、漏电电流或开发工具的作用等与功效管理有关的其它因素。Kerby补充道:“我们采用系统方法,着重于效果改进最明显的方面。”
  飞思卡尔公司作为一个芯片制造商,从三个层面对功耗控制新技术的理解阐述了自己的观点:制程技术,更灵活的新芯片设计以及围绕芯片架构优化系统功耗所需的培训/工具。Bock解释道,制程技术包括继续降低器件在一切性能水平上的漏电电流和运行电流—对于较低性能的器件执行“固有单一”任务。

MCF5213微控制器在低功耗模式下的典型功耗
图3:本图显示的是飞思卡尔半导体公司的MCF5213微控制器在运行和等待/ 睡眠两种
低功耗模式下,运行频率对功耗的影响。在所有频率下,SRAM版(静态随机存取存储器)
消耗的能量大大低于闪存。测量是在室温下进行的。

  Bock说:“较新的尖端制程技术(90纳米)和更成熟的制程相比本身渗漏比较严重,所以控制漏电电流极其重要。然而,较新的制程通常在较低的电压下运行,因此,对于同样数目的晶体管,它们的运行电流往往更容易控制。”但是进一步增加特性会难以控制运行电流。
  芯片设计革新包括更大的灵活性,更快速打开/关闭芯片元件(或整个芯片)的选项以及前面提到的灵活的时钟选项。按照Bock的说法,使用这些技术外加DDR-SDRAM(双倍同步数据率动态随机存取存储器)等低功耗存储器可降低整个系统功耗。工具革新目前集中于低功耗系统的产品培训和有关设计的应用笔记。他还提到即将问世的飞思卡尔公司的仿真器工具能估算芯片能耗并向用户显示。

  系统概观
  本篇文章着重讨论了功耗管理在芯片/处理器级上的广泛作用。英特尔公司采取这种整体论方法,提出了多内核架构还能节省系统/机箱级的能耗。Ames说:“通过多个执行内核和现有的商用虚拟机监控软件结合,开发商能在同一平台上支持多个操作系统。”一个内核能处理一个实时操作系统(RTOS),而另一个内核运行一个非实时操作系统。他解释道,这种方法还能合并专用服务器(各支持一个独立的软件环境)、节省能耗和机箱空间。英特尔公司提供内含支持虚拟环境技术的多核处理器。
  功耗管理必须考虑各个系统单元的效率:电压调整模块(VRMs),存储元件和处理器。Ames总结说:“一个系统可以有一个巨大的MIPS/W(每瓦每秒百万指令)处理器,但一个拙劣的电压调整模块设计或者一个高能耗的存储方案都会使系统进退两难。”
  飞思卡尔公司的Bock指出低功耗、低负载周期应用有一个典型的问题:使处理器唤醒时间最小化。他解释道,因为在每个唤醒周期必须完成固定的工作量,所以处理器效率越高、功能越强,系统能耗越省,比如说,和低档处理器相比只要25%的时间就可以完成规定的工作。他说:“即使运行状态下功率耗散适当地高些,这也是正确的。”
  Bock继续说道:“对于电池寿命需要延长多年的最积极的低功耗应用,漏电电流往往是最主要的因素。”对于这个问题通常关心的是权衡运行状态的功耗(效率)和睡眠状态的功耗(漏电/截止电流)。他补充道,编译器和软件工具的可用性有助于设计者使运行模式下的功耗最小化,而使功耗管理模式的灵活性最大化,这往往是整个系统功耗最小化的关键。
  德州仪器(简称TI)公司同样采取整体论的立场。TI公司利用智能映像(SmartReflex)技术控制功耗,被称作是“智能自适应硅、电路设计以及软件的结合,是为解决较小处理节点功耗和性能管理难题而设计的。”
  智能映像技术包括存储器和逻辑保持单元,它支持动态功率切换,据说无静态漏电功耗,从而减少漏电并降低工作电压;传感器,它能根据芯片处理和温度变化动态调整电压;漏电管理,它根据哪个过程在作用,通过切换至低功耗模式来降低漏电功耗;工作量监控和预测;以及在数字信号处理器(DSP)和其它内核之间的桥路功耗管理。
  TI公司说,智能映像技术能降低芯片级静态漏电功耗,在系统级也同样起作用,可协调多个处理内核、硬件加速器、功能块和外设的功耗和性能。TI公司奉献的部分是一个功耗管理单元库,以精细方式实现对器件功耗域的划分。一种开放式软件框架提供了“较低层硬件技术之间的智能协调”,以及与基于操作系统及第三方功耗管理软件的兼容性。智能映像技术的片上系统(SOC)设计包含了很多先进特性:自适应电压调整、动态功率切换和待机漏电管理。
  智能映像技术集成到TI公司更加新的处理节点(90纳米以及更小)的芯片器件上,正发挥出它们的功效。据TI公司介绍,他们公司的OMAP2420多内核应用处理器采用S智能映像技术后,不但增强了性能,同时降低功耗40%。TI公司正在进行的功耗管理方面的其它研究有望使晶体管漏电功耗更大幅度地下降。

  能解决的问题
  装载功能元件的需要量越来越大,但面临的是芯片尺寸缩小,这是一个令人生畏的难题,但是行业专家们一致认为功耗管理问题是能解决的。
  为了控制功耗,芯片设计者们意识到并非同时或一直需要所有的芯片资源。未来的硅器件将全面贯彻这个理念,把前瞻性的设计、增强型的芯片架构和软硬件新技术结合起来控制功耗。设计者们的创新灵感还会不断地涌现。
  翻译:秦茗

  □ 红外线温度传感器的设计与实现
  CONTROL ENGINEERING China本文介绍了一种新型的红外线温度传感器的测量原理、设计制作和实验结果。这种仪器的温度测量精度可以达到℃数量级,比较市场上现有的温度传感器,其灵敏度和线性度都有较大的优势,具有广泛的应用前景。
  □ 制造业车间级管理系统(MES)及其典型结构
  CONTROL ENGINEERING China制造执行管理系统(MES)是企业CIMS信息集成的纽带,是实施企业敏捷制造战略和实现车间生产敏捷化的基本技术手段。本文介绍了MES的概念、功能模型,以及MES与ERP及现场自动化系统之间的关系,并且描述了MES 系统的典型结构。
  □ LXI总线技术特点及其在分布式测试与诊断系统中的应用研究
  CONTROL ENGINEERING China将LXI 技术应用到远程分布式测试与故障诊断系统中可以很好地解决分布式测试和异构测试系统的融合问题。本文从测试总线的发展着手,介绍了LXI 技术的优点,较深入地分析了同步和触发技术的原理以及在分布式测试系统中的应用方法。
  以上选登文章全文刊登在CONTROL ENGINEERINGChina 网站
www.cechina.cn

如需更多信息,请访问:

www.amd.com
www.atmel.com
www.cechina.com
www.freescale.com
www.intel.com
www.ti.com

标签:芯片功耗管理,嵌入式控制,漏电功耗,多内核处理器,应变硅

相关文章