数字集成电路低功耗物理实现技术与UPF

更新时间:2023-07-27 19:22:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数字集成电路低功耗物理实现技术与UPF

孙轶群sun.

国民技术股份有限公司

Nationz Technologies Inc

摘要

本文从CMOS电路功耗原理入手,针对不同工艺尺寸下数字集成电路的低功耗物理实现方法进行描述,并着重描述了Synopsys UPF(Unified Power Format)对低功耗设计的描述方法。UPF是Synopsys公司提出的一种对芯片中电源域设计进行约束的文件格式。通过与UPF格式匹配的Liberty文件,UPF约束文件可以被整套Galaxy物理实现平台的任何一个环节直接使用,并将设计者的电源设计约束传递给设计工具,由工具完成设计的实现工作,从而实现整套数字集成电路低功耗物理实现的流程。

1.0 概述

本文从数字集成电路低功耗设计原理下手,对设计中低功耗的实现技术进行描述,包括完成低功耗设计需要的库资料以及常用EDA工具对低功耗技术实现的方法。

2.0 CMOS电路的低功耗设计原理

CMOS电路功耗主要分3种,静态功耗主要与工艺以及电路结构相关,短路电流功耗主要与驱动电压、p-MOS和n-MOS同时打开时产生的最大电流、翻转频率以及上升、下降时间有关,开关电流功耗主要与负载电容、驱动电压、翻转频率有关。做低功耗设计,就必须从这些影响功耗的因素下手。

3.0 低功耗设计手段及Library需求

低功耗的设计手段较为复杂,但对于不同的设计,或者不同的工艺,实现的方法却各不相同。

3.1 0.18um及以上工艺

0.18um及以上工艺,在低功耗设计手段上较为有限,主要原因在于,静态功耗很小,基本不用关心。

动态功耗方面,主要的功耗来自于Switching Power,即与负载电容、电压以及工作中的信号翻转频率相关。

减小负载电容,就必须在设计上下功夫,减少电路规模。减少信号翻转频率,除了降低时钟频率外,只有在设计上考虑,能不翻转的信号就不翻转。至于电压,由于0.18um及以上工艺的阈值电压有一定的限制,因此,供电电压降低,势必影响工作频率。

一般说来,在0.18um工艺下设计电路,主要有以下几种对低功耗设计的考虑。

3.1.1 静态功耗可以忽略

根据现有项目经验可知,利用0.18um工艺Standard Cell设计出来的某芯片,数字逻辑加上Ram和Rom约40万门的电路,在完全静止的状态下,功耗约200uA左右(实测数据为400uA左右,包括了50uA Flash,30uA的PHY,113uA的VR,其他模拟部分漏电不大,因此这里估算为200uA)。这样的功耗,我们是可以接受的。如果非要减少静态功耗,则可以参照90nm工艺的设计思路,专门设计高阈值电压的MOSFET,或者专门设计切断电源所需的元件,但由此带来设计的复杂性,对0.18um工艺的影响还是很大的。如果设计规模没有那么大,且可以满足应用,往往还是可以忽略这个结果的。

3.1.2 时钟门控减小不必要的动态功耗

在寄存器的电路设计中,时钟输入端都会有一个反向器负载,就算输入端不发生变化,时钟的变化也会造成该反向器的变化,由此产生动态功耗。因此在如果该寄存器输入在某种条件下等于输出(即输出保持)时,可以将时钟门控住,以减少无效的时钟翻转。

1 / 26

时钟门控的实现原理如下图所示:

图 3-1 时钟门控原理图

如上图所示,由于现在的设计方式,大多数是同步设计,设计人员只考虑数据路径,时钟往往是不做处理的。因此如果要实现门控,只需要在设计电路时提供可以识别的控制信号,在综合的时候,EDA工具就可以自动插入时钟门控。

利用Design Compiler进行时钟门控单元插入,在读入设计以及时序约束后,需要做以下设置:

1. set_clock_gating_style,设置时钟门控单元插入的约束

2. insert_clock_gating –global,开始插入时钟门控单元;

3. uniquify,将所有时钟门控单元做uniquify操作,以便后续PR

4. hookup_testports -se_port ATPGSE_Pad -se_pin uPad/uATPGSE_Pad/C –verbose,将所有时钟门控单元的scan_enable信号与测试用SE信号连接起来。如果没有ATPG,可以不用该句命令。

5. propagate_constraints -gate_clock,将门控单元信息传递给整个电路。

6.report_clock_gating可以查看时钟门控单元插入的情况,以便做电路修改,或插入时钟门控单元设置的修改。

完成这些设置后,只需要和平常一样做系统综合即可。而在DC 2008.09版本以后,第2~5的步骤都可以省略,在利用compile_ultra进行优化时,第2、3步骤都会被自动执行,第4、5步骤会在insert_dft时被执行。

形式验证工具Formality,在进行形式验证,需要设置verification_clock_gatie_hold_mode为low、high或者any,Formality就可以识别出时钟门控单元,并与RTL进行形式验证了。3.1.2.1. Clock Gating Cells

这里所说的Clock Gating Cell是指专门设计的,集成式时钟门控单元(Integrated Clock Gating Cell,简称ICG),就是利用Latch和与门/或门实现的一个独立的Standard Cell,其优势在于以硬IP实现,时序易于掌握,物理实现中对布局布线有帮助。当然如果单元库中不提供专门的时钟门控单元,EDA工具也可以利用与门、或门、Latch甚至是寄存器等进行门控单元的实现,但效果都没有ICG好用。这里针对ICG的插入进行描述。

图 3-1中的门控单元是一种典型的,利用负沿使能Latch以及与门组成的上升沿有效时钟门控单元,只有时钟下降沿后才会将时钟门控住,保证不产生时钟毛刺。

2 / 26

3 / 26 在Liberty 格式文件中,某个Cell ,需要有clock_gating_integrated_cell ,才能让EDA 工具认识到,该Cell 是一种ICG 。不同的clock_gating_integrated_cell 的设置,需要在DC 设置set_clock_gating_style 时做相应的设置,才可能被使用到,下面列举一些常用的设置: 同时,在ICG 的不同Pin 上,必须有以下属性,来告诉DC 该Pin 在ICG 的使用中是什么功能(这里只列举常用的信息): clock_gate_enable_pin 该pin 是时钟使能控制信号

clock_gate_out_pin 该pin 是时钟输出信号

clock_gate_clock_pin 该pin 是时钟输入信号

clock_gate_test_pin 该pin 是scan_enable 或test_mode 信号

3.1.3 使用低电压的库进行设计

由于动态功耗中,驱动电压对功耗的影响也相当大,因此,如果能有一套电压只有1V 的标准单元库,进行设计,仍然可以达到降低动态功耗的目的。但电压的降低,势必引起元件延时的增加,且由于0.18um 工艺下,阈值电压一般在0.4V 左右,驱动电压的稳定性需求也相当大,否则,可能会导致致命性的错误。

法国的Dolphin 公司是一家致力于低功耗设计的IP 提供商,在TSMC 、SMIC 等Foundry 的0.18um 工艺下都提供了1V 的逻辑单元库。下面列出Dolphin 在SMIC 0.18um 工艺下设计的一套1V 逻辑单元库,和SMIC 0.18um 工艺Metro 标准单元库进行比较。比较中Metro 标准单元库使用1个门的BUFX2M ,而Dolphin 使用最小的Buffer ni01d1进行比较。 area (um*um) Average leakage(nW) Rise delay (0.04pf,ns) Typical Rise

Energy

(0.04pf,pJ)

SMIC18

METRO BUFX2M 8.7808 0.048 0.182256 0.0266

Dolphin 1V

for

SMIC 0.18um ni01d1 10.3488 0.01 0.6 0.005

由比较中可以看出,当电压下降到1V 后,Rise Energy 下降了80%以上,除了由于电压下降引起的功耗降低外,Dolphin 应该在电路结构等方面也做了处理,因此不但动态功耗减少了,而且静态功耗也减少了很多。但延时却大了很多,因此如果设计需要翻转的频率不高时,可以考虑利用低功耗的库进行设计,达到降低功耗的目的。如果速度要求很高,这个方法是不可行的。

3.2 90nm 及以下工艺

从3.1.3可以知道,降低驱动电压,可以减少动态功耗,但由于电压降低,驱动能力也同时被减弱,因此元件延时较大。为了解决这个问题,工艺尺寸开始减小,以便在减小驱动电压的情况下,增加宽长比(aspect ratio ),以达到提高驱动电流的目的,保持元件延时。 同时进入更低尺寸的工艺,氧化层厚度也随之减小,以便减少阈值电压,进一步提高速度。但因为氧化层厚度在减小,漏电电流也变大了。在90nm 及以下工艺中,漏电电流开始被设计人员关注。

下面对在90nm 工艺下进行低功耗设计及实现的一些手段结合常用EDA 工具进行描述。

3.2.1 切断未使能电路的电源减小不必要的静态功耗

针对SMIC 0.18um 工艺Metro 标准单元库以及TSMC 90nmLP 工艺高密度标准单元库(dbtcbn90lphdbwptc )进行比较,以一个门的Buffer 来举例:

Average leakage(nW) Incremental Typical Rise

Energe

(0.04pf,pJ) Incremental SMIC18 METRO BUFX2M 0.048 - 0.0266 -

TSMC 90LP Biased

Well BUFFD1BWP 0.214 345.83% 0.00272 -89.77%

可以看出,90nm工艺下的静态功耗,已经是0.18um工艺下功耗的 3.5倍左右了。根据3.1.1可知,利用0.18um设计出来的,约40万门的电路,静态功耗,大约是200uA (360uW,0.18um工艺按 1.8V供电电压计算)。如果同样规模的电路,放在90nm工艺下,则可能达到1.26mW左右,即1.05mA左右的静态功耗(90nm工艺按1.2V供电电压计算)。

既然,静态功耗这么大,那么在静止时,怎样才能将这些功耗减小呢?一个非常彻底的方法就是将静止状态电路的电源关断。

为了关断电源,就需要在电源网络和电路之间建立一个电源控制电路,他们被称为电源开关单元(Power Switching Cell),在需要关断时,控制Power Switching Cell将电路的供电关闭,否则打开,提供电源。

由于电源关断后的电路,其输出信号就没有电路驱动,对于其驱动的电路来说,就会出现输入浮空的状态。为了解决这个问题,就需要在关闭电源的电路输出端添加一个额外的保持电路,当其电源关闭后保持输出,而电源打开时,保持电路则表现的像一个Buffer,输出等于输入即可。同时,如果被关闭电源地电路输入固定电压,也可能产生对地的电流,就需要一个特别的单元对该部分电流进行保护。这样的单元被称为隔离单元(Isolation Cell)。一般来说Isolation Cell的输出部分有较大的电容负载,也就是说Isolation Cell的延时将会比较大,对时序有一定的影响,是需要注意的。

当然,对于寄存器来说,如果断电,则原有的数据就无法保存,重新打开电源后,就一定会出现原有数据丢失的情况。因此可以为一些必须保持数据的寄存器建立一个备份设备,电源关闭前,将寄存器的数值保存到备份设备上,电源打开后从备份设备上将数据重新写入寄存器中。这种备份设备叫做保存寄存器单元(Retention Register Cells)。

对于Power Switching Cell、Isolation Cell以及Retention Register Cell,他们在上电之后是不能关闭的,因此使用的电源也和正常功能不同,这些单元被成为常开逻辑单元(Always-On Logic Cells)

下面就各种不同的Cell,描述其原理、库中保存的信息、以及实现流程。

3.2.1.1. Power Switching Cells

原理上说,Power Switching Cell结构如下图所示:

图 3-2 Power Switching Cell电路结构示意图

从图中可以看到,Power Switching Cell的设计原理非常简单,VDD的控制(被称为Header Switch),利用一个P-MOSFET来控制,当TURN_OFF信号为高时表示电路关闭,P-MOSFET关闭,GA TED_VDD就不供电了,而TURN_OFF信号为低时表示电路打开,P-MOSFET打开,GA TED_VDD等于VDD_SUPPL Y。同理,利用一个N-MOSFET来控制VSS电源是否供电,被称为Footer Switch。

一般来说,只需要使用Header Switch或者Footer Switch就可以实现电路关断,其中Header Switch结构漏电较小,而Footer Switch结构控制效率高,且面积较小。

虽然原理非常容易理解,但电路设计起来非常复杂,需要考虑控制单元对电路供电的能

4 / 26

力,考虑不能产生过大的功耗,等等。这里不详细介绍控制单元的设计,详细设计方法可以参看Synopsys公司和ARM公司联合出版的“Low Power Methodology Manual For System on Chip Design.”。

将Power Switch Cell设计成单独的器件,在实现时,控制某一块电路,叫做Coarse Grain Power Switch Cell。

下面是一个Coarse Grain Power Switch Cell的Liberty格式描述

library(<coarse_grain_library_name>) { #library 描述开始

lu_table _template ( template_name ) #电压状态template描述,

dc_current组中会使用

variable_1 : input_voltage;

variable_2 : output_voltage;

index_1 ( <float>, … );

index_2 ( <float>, … );

}

cell(<cell_name>) { #某个Power Switching Cell描述开始

switch_cell_type : coarse_grain; #Switching Cell类型是

coarse_grain,暂时只支持该类型

pg_pin ( <VDD/VSS pin name> ) { #申明电源和地的pg_pin格式

pg_type : primary_power | primary_ground; #他们是主电源和主地

direction : input ; #方向是输入

}

/* Virtual power and ground pins use “switch_function” to describe the

logic to

shut off the attached design partition */

pg_pin ( <virtual VDD/VSS pin name>) { #申明内部电源和地,这

就是输出电源/地的端口

pg_type : internal_power | internal_ground;

direction: output; #方向是输出

switch_function : “<function_string>”; #定义开断控制功能,例如

SLEEP

pg_function : “<function_string>”;#内部电源或地功能与输入的

pg_pin一致,对于header switch来说就是premary_power的Pin

Name,对于Footer Switch来说就是primary_ground的Pin Name

}

dc_current ( <dc_current_name> ) { #定义不同条件下输出Pin的稳

定电流值,EDA工具利用该数据计算IR Drop,并进行Switch的

优化。

related_switch_pin : <input_pin_name>; #定义控制开断的Pin

related_pg_pin : <VDD pin name>; #定义可以被控制开断的电源

Pin,如果是Footer Switch则是地Pin

related_internal_pg_pin : <Virtual VDD>; #定义不会被关闭的内部

电源Pin,Footer Switch则是地Pin

values(”<float>, …”); #定义不同状态下的该Cell输出的电流值

}

pin (SLEEP) { #Pin SLEEP定义开始,SLEEP只是举例

direction : input;

switch_pin : true; #表示该输入Pin是switch pin,控制电源/地的开

5 / 26

/* The acknowledge output pin uses “function” to represent the

propagated switching signal

*/

pin(<acknowledge_output_pin_name>) { #定义应答输出Pin开始,

完成开断后,与switch pin状态一致,有的Switch Cell可能没有

该pin

function : “<function_string>”; #功能定义,应该与SLEEP状态一

power_down_function : “function_string”; #定义关断后电源状态,

如对于Header switch来说可以是!VDD+VSS,而Footer Switch来

说可以是!VSS+VDD

direction : output;

} /* end pin group */

} /* end cell group */

另外,为了更好的控制电源通断控制,可以专门设计带有电源控制的逻辑单元,实现时,不需要添加额外的控制电路,这种电源开关结构叫做Fine Grain Power Switch Cell,结构简单,但每个单元都有一个控制器,面积比较大。

下面是一个Fine Grain Power Switch Cell的Liberty格式描述

cell(<cell_name>) { #Fine Grain Power Switch Cell都是某个Cell内

的一部分,不单独出现

is_macro_cell : true; #定义是不是macro cell

switch_cell_type : coarse_grain | fine_grain; #多数设置为fine_grain

pg_pin ( <power/ground pin name> ) { #定义电源信号,primary_是

可以断开的,backup_是不会断开的。

pg_type : primary_power | primary_ground | backup_power |

backup_ground;

direction: input | inout | output;

}

/* This is a special pg pin that u ses “switch_function” to describe the

logic to shut

off the attached design partition */

pg_pin ( <internal power/ground pin name>) { #定义内部电源/地

direction: internal | input | output | inout;

pg_type : internal_power | internal_ground;

switch_function : “<function_string>”;

pg_function : “<function_string>”;

}

pin (<input_pin_name>) {

direction : input | inout;

switch_pin : true | false; #如果是switch pin就是true

}

pin(<output_pin_name>) {

direction : output | inout;

power_down_function : <function_string>;

6 / 26

} /* end pin group */

} /* end cell group */

3.2.1.2. Isolation Cells

我们知道,在CMOS数字逻辑电路当中,当某根信号为VDD时,我们认为是逻辑1,如果为GND,则认为是逻辑0。但当某块电路不供电后,其输出就失去了驱动,输出网络如果没有其他信号驱动,其电平就会为高阻态,换句话说,就是不知道电压是多少。

因此,在低功耗设计中,如果需要切断某块电路电源的话,则该电路的输出就会出现不定值,而与这些输出连接的电路也就出现输入浮空的状态,因此就需要在关断电路的输出及其连接的模块之间加一个Isolation Cell,在电源关闭时,将输出网络固定在某一个电平上,而打开电源后,该电路的输出等于输入,不影响电路功能。

Isolation Cell可以利用逻辑门来实现,利用与门实现可以使输出在关闭电源时为0,被称为Low Clamped Isolated Signal,利用或门实现可以使输出在关闭电源时为1,被称为High Clamped Isolated Signal,如下图所示,X是输出信号,“ISOLN”和”ISOL”分别是开关控制信号:

图 3-3 逻辑门组成的Isolation Cell

利用逻辑门组成的Isolation Cell,会产生延时,对速度很快的电路来说可能会有所影响,因此也可以利用一个N-MOS或者一个P-MOS以Pull-Up和Pull-Down电路实现,但这会产生多驱动问题,不是常用的方法。

利用逻辑门组成的Isolation Cell是常见的Cell,下面所示是一个Isolation Cell的Liberty 格式描述:

cell(isolation_cell) {is_isolation_cell : true ; #定义该Cell是isolation_cell

pg_pin(<pg_pin_name_P>) { #电源Pin定义

pg_type : primary_power;

}

pg_pin(<pg_pin_name_G>) { #地Pin定义

pg_type : primary_ground;

}

pin (data) {

direction : input;

isolation_cell_data_pin : true ; #被控制的输入Pin

}/* End pin group */

pin (enable) {

isolation_cell_enable_pin : true ; #控制信号

}/* End pin group */

pin (output) { #输出信号

direction : output;

7 / 26

power_down_function : (!pg_pin_name_P + pg_pin_name_G); #电源关闭后进入为power down状态

}/* End pin group */

}/* End Cell group */

3.2.1.3. Retention Register Cells

对于寄存器来说,当电源关闭后,其保存的数据也就不存在了,如果有些寄存器的数据,希望在断电后继续保持,则需要使用一个专门的Retention Register Cell,在断电前把寄存器的值锁存起来,重新打开电源后将数值存回寄存器去。而该寄存器在断电时,会有一部分电源一直有电。

下图所示,是一种常用的Retention Register Cell基础结构:

图 3-4 Retention Register Cell基础结构图

如上图所示,Master/Slave Latches是常规的寄存器,工作在VDD_SW电压域,也就是可以关断的电压域,D、CLK、RESETN和Q是寄存器的控制和输出信号。RET电路工作在VDD电压域,不会被关闭,当“SA VE”信号有效,RET会把寄存器的值保存起来,而RESTORE有效,RET将保存的数值写入寄存器中(“SA VE”和“RESTORE”具体时序关系需要参考IP提供商提供的数据,这里只是说明一下其功能)。

需要注意的是,一个Retention Register Cell比普通寄存器面积要大约20%,如果设计的鲁棒性好一些,甚至会大超过50%的面积。

Retention Register Cell不但是可以保持寄存器的值,还可以保持Latch的值,两种不同的结构图如下所示:

8 / 26

图 3-5 Retention Cell的电路结构示意图

图中(a)表示寄存器的Retention Cell,当Save和Restore都是0的时候,使能保持电路不工作,而寄存器的置位和复位端无效,寄存器正常工作。需要进入Sleep模式,首先需要停止寄存器的Clk(Clk_On信号关闭),接着准备进入Sleep模式。当Save为1后,Q端数据被采集进保持电路中,然后可以关闭电源(Power_on关闭)。打开电源后(Power_on打开),将Restore置1,如果保持电路输出为1,则对寄存器做异步置位,否则做异步复位,使寄存器输出与保持电路一致。需要注意的是,Save为从0置1后,不可以再有时钟改变Q端输出,且Save必须有一定的宽度,保证Q端数据被记录下来,同时关闭电源一定要等数据被保持下来后才可以进行。打开电源后,Restore一定要保持一定的时间,使寄存器充分复位或置位,同时在下一个时钟沿到来之前,一定要将Restore清0,否则Q端就不会发生变化,电路可能就会出错。当数据被读回后,就可以打开时钟(Clk_On打开),开始正常工作了。时序示意图如下所示:

图 3-6 Retention Register工作时序示意图

图中(b)是一个Retention Latch的电路结构示意图,原理与寄存器的Retention Cell类似,这里就不详细描述了。

下面所示是一个Retention Cell的Liberty格式描述,描述是基于一个常见寄存器或Latch的格式上进行的:

cell(<cell_name>) {

retention_cell : <retention_cell_style>;

pin(<pin_name>) {

retention_pin(<pin_class>, <disable_value>);

}

}

retention_cell_style主要是定义一个器件识别名,不同功能名字不能一样。这里所说的功能,不止是寄存器或latch的功能,还需要考虑到save和restore过程是否一致。

9 / 26

retention_pin是的定义表示该pin是与retention cell功能有关的,其中pin_class可以是restore、save、save_restore,其中restore和save分表表示该pin是restore功能和save功能,而save_restore表示该pin根据不同电平为save或restore功能。disable_value表示save 或者restore无效时的电平是1还是0。

需要注意的是retention_pin定义时一定要有related_power_pin和related_ground_pin定义其所述的电源域,否则编译时会报Warning,并为该Pin定义primary_电源域。

同时对于latch和寄存器的Retention Cell的latch和ff组描述,会与正常的latch和寄存器有所不同,如下,加粗字体为不同的部分:

latch (IQ, IQN) {

data_in: D & (SAVE & RESTORE) ;

enable : CLK ;

}

ff(”IQ”, “IQN”) {

next_state : “D& (!SA VE & !RESTORE)” ;

clocked_on : “CP” ;

}

3.2.1.

4. Always-On Logic Cells

有些Cell是不能够被关闭的,如Power Switch Cell、Retention Register Cells、Isolation Cells,他们就被称为Always-On Logic Cells。在这些Cell的Liberty格式描述中就会有一个属性“always-on”是true。同时对于Always-On Logic Cells,pg_pin描述一般都会有两组,primary和backup,工具看到该cell为Always On,就会把2组电源地都接到长开的电源/地上。

cell(always_on_cell) {

always_on : true ; #定义该Cell是always_on_cell

pg_pin(<pg_pin_name_P>) { #电源Pin定义

pg_type : primary_power;

}

pg_pin(<pg_pin_name_G>) { #地Pin定义

pg_type : primary_ground;

}

pg_pin(<pg_pin_name_P>) { #电源Pin定义

pg_type : backup_power;

}

pg_pin(<pg_pin_name_G>) { #地Pin定义

pg_type : backup_ground;

}

}/* End Cell group */

3.2.2 利用不同VT值的库,实现静态功耗和时序的平衡(Multi-VT)

随着工艺尺寸的减小,Oxide层厚度的减少,VT值也一直在减少,这是为了在驱动电压较低的情况下,提高驱动速度。但同时静态功耗也随之增加。

10 / 26

对电路设计来说,并不是每一个部分的电路,路径延时都需要那么小,对于一些非关键路径来说,如果能够使用高VT值的元件,则可以在满足时序的前提下减小静态功耗了。

在同一种工艺下,实现不同的VT值,可以使用井偏置(Well Bias)技术,使Substrate的电压与Source的电压存在一定的电压差,就可以改变VT值了。使用较多的方法是分别对N-MOSFET和P-MOSFET增加1层Mask来提高VT,或减小VT。

通常情况下IP提供商会提供多套不同的单元库,按照不同的VT值进行设计。如TSMC 90nm LP工艺的单元库,就会提供普通VT、High VT、Low VT以及Ultra Low VT四套单元库。下面TSMC 90nm LP的四套单元库进行分析:

area

(um*um)Average leakage(nW)Rise delay (0.04pf,ns)Typical Rise Energe (0.04pf,pJ)dbtcbn90lphdbwphvttc BUFFD1BWPHVT2.19520.0170.24440.002716dbtcbn 90lphdbwptcBUFFD1BWP2.19520.2140.2371760.00272dbtcbn90lphdbwplvttc BUFFD1B WPLVT2.19520.4120.2171840.002616dbtcbn90lphdbwpulvttc BUFFD1BWPULVT2.1952 5.0550.1935560.003624

表格中dbtcbn90lphdbwptc是正常VT的库,dbtcbn90lphdbwphvttc是High VT的库,dbtcbn90lphdbwplvttc是Low VT的库,dbtcbn90lphdbwpulvttc是Ultra Low VT的库。分析时使用1个门的Buffer来进行,面积上都是2.195um^2。

静态漏电功耗,High VT库中,1个门只有0.017nW,甚至比SMIC18 METRO 1个门的漏电功耗还低(参看3.2.1)。随着VT的减小,静态功耗逐渐变大,到Ultra Low VT时,其静态功耗,1个门就有5.055nW。但也因为VT很高,High VT的Buffer延时很慢,比Ultra Low VT减慢了约27%。

从表格看来,延时的变化并不非常明显,如果在时序上要求不是很高,则尽量还是需要使用High VT的库来实现

3.2.2.1. 常用EDA工具中Multi-VT的实现方法

从Synopsys Multi-VT实现过程主要是在逻辑综合(Logic Synthesis)阶段。DC完成Multi-VT的实现,主要是在target_library中找出可以使用的所有逻辑单元,并在满足时序约束的情况下,使用最低leakage power的单元进行实现。

其实现步骤可以如下:

#读入不同VT的逻辑单元作为target library,当DC有充分的选

择空间

set_target_library {dbtcbn90lphdbwptc.db

dbtcbn90lphdbwphvttc.db \

dbtcbn90lphdbwplvttc.db dbtcbn90lphdbwpulvttc.db}

#读入HDL代码

read_verilog design_include.v

#link design

current_design design_top

uniquify

11 / 26

link

#读入约束

source design_constraint.tcl

#其他设置

……

#设置最大漏电电流,该设置必须有,否则优化过程不考虑漏电的

优化

set_max_leakage_power 0 mw

#开始编译

compile_ultra

由于综合时,时序信息并不完全准确,特别是setup类的时序。因此可以对setup时序做稍紧一些的约束,使结果进入PR工具后还能够满足时序,如果进入PR后仍然无法满足setup时序,PR工具也可以利用类似的原理进行优化。

如在IC Compiler里,在布线后优化时可以使用如下语句来进行优化:

physopt –preserve_footprint –only_power_recovery –post_route –incremental

这里设置了-preserve_footprint以及-only_power_recovery,因此只是针对相同footprint的单元做漏电功耗优化,也就是说如果某个使用了High VT X2的Buffer需要减小延时,则可以替换成Low VT X2的Buffer,这样做可以保持原有的布线结果。

当出现Multi-VT的单元库后,每个单元库都会多一个default_threshold_voltage_group以及threshold_voltage_group属性来说明该单元库是High VT、标准VT还是Low VT。可以利用report_threshold_voltage_group(DC和IC Compiler都支持)指令报出设计中每种单元库单元占整个设计的百分比,如High VT的单元库占60%,标准VT占25%,等。这样做可以使设计者了解不同VT对自己设计的影响,如果速度不快,则Low VT的库可能占用很少,甚至没有使用,那么完全可以在设计过程中直接不使用该库。

如果库中没有default_threshold_voltage_group变量,我们可以在DC中设置:

set_attr -type string dbtcbn90lphdbwphvtwc.db: dbtcbn90lphdbwphvtwc default_threshold_voltage_group HVT

3.2.3 时钟门控减小不必要的动态功耗

时钟门控单元的插入在3.1.2已经有所描述,这里就不多进行描述了。同样的,标准单元库必须提供相应Cell的库才可以实现。

3.2.4 多供电电压,实现动态功耗与时序的平衡(Multi-Voltage)

我们知道,降低驱动电压VDD,是减小动态功耗最快的方法,因此在满足时序的情况下,适当降低驱动电压,可以有效的减小动态功耗。而设计中可以使用多驱动电压的设计方法,对于速度要求快的电路,供高一些的驱动电压,如 1.3V,而速度要求不高的模块,则只需要供比较低的驱动电压,如1.0V。

对于逻辑综合来说,DC中,首先需要对不同电压域的电路设置不同的operating_condition,综合工具就可以对该电压域电路进行初步分析和优化了。如果使用UPF,则可以直接使用load_upf,工具会根据UPF的描述自动寻找相应的库文件进行分析。如下所示:

set target_library “slow_14V slow 10V

……

read_verilog design_include.v

current_design design_top

link

#set_operating_condition –max slow_10V –max_library slow_10V

#uDesign/uDMA速度快,需要使用1.4V供电

#set_operating_condition –max slow_14V –max_library slow_14V

–object_list \

12 / 26

#uDesign/uDMA

load_upf power.upf

……

check_mv_design

compile –scan

check_mv_design

……

这里check_mv_design主要是检查UPF对设计的描述是否正确,在compile之后再做一次是为了查看compile后,电路结构域UPF的描述是否正确。

接着,需要在不同电压电路之间,添加Level_shifters,进行电压转换。如下所示:

check_level_shiftersinsert_level_shifters –all_clock_nets -verbose

DC会根据不同电压域设置operating condition中voltage的数值或者UPF中的描述,查找Level Shifter Cell中input_voltage_range和output_voltage_range满足这些电压域需求的元件,在2个电压域的数据交互信号上添加Level Shifter Cells。

3.2.

4.1. 常用EDA工具中Multi-VT的实现方法

Level Shifters主要是在多供电电压设计中,在2个不同电压域之间进行电压转换的器件,将某个电压域输出的逻辑电平转换成另外一个电压域可以识别的逻辑电平。

从功能上来看,就像一个Buffer。

下面描述的是level_shifter的Liberty格式:

cell(level_shifter) {

is_level_shifter : true ; #定义为true,则该Cell被认为是lever

shifter cell

level_shifter_type : HL | LH | HL_LH ; #定义电平转换方向,HL

表示高电平转低电平,LH直低电平转高电平,HL_LH表示都可

以用

input_voltage_range (<float>, <float>); #输入电压范围,指该Cell

输入连接的电路,电压工作范围,EDA工具会根据Operating

Condition的选择,检查该Cell是否满足电路需要,可以在功能

pin中进行定义,如果在cell主体定义,则必须与

output_voltage_range同时存在

output_voltage_range (<float>, <float>);#输出电压范围,指该

Cell输出连接的电路,电压工作范围,EDA工具会根据

Operating Condition的选择,检查该Cell是否满足电路需要,可

以在功能pin中进行定义,如果在cell主体定义,则必须与

input_voltage_range同时存在

pg_pin(<pg_pin_name_P>) {

pg_type : primary_power;

std_cell_main_rail : true; #该primary_power连接在Cell设计中

的主rail

}

pg_pin(<pg_pin_name_G>) {

pg_type : primary_ground;

}

pin (data) {

direction : input;

input_signal_level : “<voltage_rail_name>”; #输入信号电压环名

input_voltage_range ( <float> , <float>);

level_shifter_data_pin : true ; #数据功能Pin

13 / 26

}/* End pin group */

pin (enable) {

direction : input;

input_voltage_range ( <float> , <float>);

level_shifter_enable_pin : true ; #使能Pin,如果level shifter还作

为isolation cell的时候,使能信号会在电源关闭时停止level

shifter功能,仅仅作为isolation cell存在

}/* End pin group */

pin (output) {

direction : output;

output_voltage_range ( <float> , <float>);

power_down_function : (!pg_pin_name_P + pg_pin_name_G);

}/* End pin group */

}/* End Cell group */

3.2.

4.2. Liberty PG Pin格式

Liberty PG Pin格式,就是在传统的Liberty格式文件中,加上与Power有关的信息。在工艺尺寸较大的时候,逻辑单元基本上只工作在一个电源系统中,但在使用多电压设计的小工艺尺寸库文件中,则需要告诉分析工具,该Cell的电源和地是接在哪里的,每个pin所处的电压域在哪里?(实际上IO设计中应该已经有类似的数据,但因为不涉及到多电压设计的方法,在传统的IO Liberty中也很少见到PG Pin的格式)

下面所示是PG Pin格式的描述

library(slow) { #library “slow”描述开始

voltage_map(vdd, 1.2); # 有一个1.2V的驱动电压,名为“vdd”

voltage_map(vss, 0.0); # 有一个0V的驱动电压,名为“vss”

operating_conditions(slow_12V) { #Operating Condition

“slow_12V”定义开始

voltage : 1.2; #使用1.2V作为该condition的电压条件

} #Operating Condition定义结束

default_operating_conditions : slow_12V; #default使

用”slow_12V”

cell(BUFFX1) { # BUFFX1 Cell描述开始

pg_pin (“VDD”) { # BUFFX1有一个Pin “VDD”,定义为pg_pin

voltage_name : “vdd”; # Pin “VDD”电压是接在

voltage_map ”vdd”上的,即1.2V

pg_type : “primary_power” # Pin “VDD”是”primary_power”类型

}

pg_pin (“VSS”) { # BUFFX1有一个Pin “VSS”,定义为pg_pin

voltage_name : “vss”; # Pin “VSS”电压是接在voltage_map ”vss”

上的,即0V

pg_type : “primary_ground” # Pin “VSS”是”primary_ground”类

型的

}

14 / 26

leakage_power() { #leakage_power定义开始

related_pg_pin : VDD; # VDD Pin供电时的leakage power

}#leakage_power定义结束

pin (A) { #有一个功能Pin ”A”

direction : input ; #”A”是一个输入

related_power_pin : VDD; #”A”是VDD供电电压域的

related_ground_pin : VSS; #”A”是VSS供地的电压域信号

}# “A”申明结束

pin (Y) { #有一个功能Pin “Y”

direction : output; #”Y”是一个输出

power_down_function : (!VDD + VSS) ; #当VDD关断,VSS开着

的时候,输出被关断

related_power_pin : VDD; #”Y”是VDD供电电压域的

related_ground_pin : VSS; #”Y”是VSS供地的电压域信号

internal_power() { #internal_power申明开始

related_pg_pin : VDD; #internal power由VDD供电引起

} /* end internal_power group */

}/* end pin group*/

}/* end cell group*/

}/* end library group*/

在PG Pin格式中,有一个pg_type的属性,下表描述该属性的含义:

pg_type简单描述具体描述

primary_power 主电源一般功能信号使用的电源,可以关断

primary_ground 主地一般功能信号使用的地,可以关断

backup_power 备用电源Always-on的电源,主要用于always-on logic cell的常开电源backup_ground 备用地Always-on的地,主要用于always-on logic cell的常开地

internal_power 内部电源主要用于Power Switch cell的内部电源

internal_ground 内部地主要用于Power Switch cell的内部地

3.2.

4.3. 电压和频率的Scaling分析

有的时候,IP提供商可能无法提供足够的单元库,例如提供商可能提供了1.4V的单元库和1.0V的单元库,但我们希望提供一个1.2V的电压,则需要进行电压的Scaling。

首先我们需要建立一个独立的operating_conditions,基于slow_14V的库,电压是1.2V:create_operating_conditions –name slow_12V –library slow_14V –process 1 –voltage 1.2 –temperature 125

然后对于需要使用1.2V的子电路,需要设置operating_condition为slow_12V。分析和优化工具,会首先根据slow_14V提供的model计算出在1.4V驱动下,延时、功耗、电容等信息,然后利用slow_14V提供的k_factor进行scaling,计算出1.2V条件下的数值。

利用这个方法可以在IP提供商没有提供所需分析环境的情况下,利用已有模型估计出在其他环境中出现的情况。但需要注意的是,当条件相差很大时,Scaling的结果偏差会很大,建议不要使用这种方式进行sign-off工作。

15 / 26

至于频率Scaling,则是在应用过程中可以减少频率,以减少翻转率,达到低功耗应用的需求。

Scaling的使用最好不要超过标准单元库的10%,否则结果完全不可行,同时如果采用CCS 格式的电流源模型Liberty,则Scaling结果会比普通的NLDM格式Liberty更精确一些。3.3 其他未提及工艺

实际上,上述提到的2种工艺范围,甚至是现在已有的所有工艺技术,从本质上想进行低功耗设计,其思路都是一致的,方法无外乎关断电源、低压驱动(多电压混合设计)、Multi-VT等方法,只是当工艺尺寸下降到一定程度后,IP提供商能提供足够的数据,使EDA工具直接使用,减少工程师重复劳动的工作量。

所以低功耗设计,首先应该从系统设计下手,在一个设计中,应该使用怎样的低功耗策略,采用那种工艺尺寸,有没有合适的单元库,如果没有库,是否自己可以设计,这些都必须首先考虑清楚。而工具,只是为了帮助我们实现自己的想法。

4.0 一个低功耗设计实现的例子

这里提供一个DEMO(pl8051_extend_chip),可以使读者更快的理解低功耗设计的基础。下图所示,是该设计的功能结构图:

图 4-1 pl8051_extend_chip功能结构图

由图 4-1可以看出,整个设计主要是由一个8051控制器,通过SFR总线对其他模块进行控制,U_Des是一个算法模块,U_Pcu是功耗控制单元(Power Control Unit)。整个设计都在Clk的控制下进行工作,只有U_Des工作在ClkF下。

这里假设Clk(28ns)是ClkF(7ns)的4分频时钟,且与ClkF同源同向,这样才可以保证U_Des控制的正确性。

由于U_Des需要在较快的频率下工作,因此需要对U_Des进行一些特殊的设计,也就是对整个设计进行低功耗设计,如下所示:

16 / 26

图 4-2 低功耗设计方案示例

上图主要描述以下信息:

1. 2个电压域,TOP以及DES_DOMAIN。

2. 电源设计外部提供,分1.2V的VDD12和1.0V的VDD10

3. 设计中除DES电路几乎所有电路工作在1.0V的VDD电压域。

4. U_Des由于工作速度要求较高,工作在1.2V的VDD12电压域DES_DOMAIN,但由于不使用的时候需要关断,以降低静态功耗,因此,通过一组PowerSwitch进行控制,控制信号来源为U_Pcu的PcuSfrDatOut[0]输出。该电压域与TOP电压域共用VSS地信号。

5. 由于U_Des电路处于VDD12电压域,而U_Pcu处于VDD电压域,因此需要添加Level Shifter进行电平转换。

6. U_Des电路输出信号,需要通过一个Isolation Cell,在关断电源时提供稳定电平,而该电平为1.2V,因此还需要利用Level Shifter转换成1.0V电压域信号,Isolation Cell的Enable信号来自于U_Pcu模块的PcuSfrDatOut[1]信号。

7. U_Des电路中的寄存器需要使用Retention Register,save和restore控制信号分别来自于U_Pcu输出PcuSfrDatOut[2]和PcuSfrDatOut[3]经过Level Shifter产生的信号。Synopsys公司为低功耗设计提供了一整套的解决方案,即UPF设计流程。UPF(Unify Power Format)是一种描述功耗设计思想的文件,Synopsys Galaxy Implementation Platform 只需要读取UPF文件,就可以将低功耗设计思路实现,而Synopsys Discovery Verification Platform读取UPF后,可以对低功耗思路以及最终实现的电路进行验证。

接下来,我们利用UPF描述该DEMO的功耗设计思路。

4.1 申明电压域以及虚拟电压接口

首先申明电压域,并申明VDD、VDD12以及VSS等电压端口:

create_power_domain TOP

create_power_domain DES_DOMAIN_domain –elements U_Des

create_supply_port VDD

create_supply_port VDD12

create_supply_port VSS

根据上述指令,工具会识别出如下图所示中画圈的信息,电压域及虚拟电压端口开始出现:

17 / 26

图 4-3 电压域及虚拟电压端口信息

需要注意的是电压端口只不过是虚拟存在的,并不是一定在顶层连接。

4.2 申明电源网络

接着申明每个电压域中的电源网络,建议从顶层往底层进行申明,如首先申明TOP的VSS,VDD。:

create_supply_net VDD

create_supply_net VSS

以上语句添加下图中画圈部分:

图 4-4 产生顶层电源网络

接着申明DES_DOMAIN的电源网络,但需要注意的是,如果需要插入Level Shifter,最好是在与其有连接关系的电源域(TOP)同时申请电源线,并连接起来:

create_supply_net VDD12

create_supply_net VDD12 –domain DES_DOMAIN –reuse

#DES_DOMAIN的VDD12与TOP的VSS共用一个网络,因此

需要-reuse

create_supply_net VDD12G

create_supply_net VDD12G –domain DES_DOMAIN -reuse

create_supply_net VSS –domain DES_DOMAIN –reuse

create_supply_net VDD –domain DES_DOMAIN –reuse

以上语句添加下图中画圈部分:

18 / 26

图 4-5 子电路的电源网路申明

然后将电源网络和电源端口连接起来:

connect_supply_net VDD12 –port {VDD12}

connect_supply_net VDD –port {VDD}

connect_supply_net VSS–port {VSS}

以上语句添加下图中画圈部分:

图 4-6 连接电源网络和电源端口

最后为每个电源域申明主电源网络来源,主电源就是该电压域普通逻辑工作使用的电源:set_domain_supply_net TOP –primary_power_net VDD –

primary_ground_net VSS

set_domain_supply_net DES_DOMAIN –primary_power_net

VDD12G –primary_ground_net VSS

做完这一步,电源网络申明基本完成

4.3 添加Power Switch

这添加Power Switch主要是2步,第一步创建Power Switch,第二步map Power Switch。可以参看以下脚本进行:

# Power Switch

create_power_switch des_sw \

-domain DES_DOMAIN \

-input_supply_port {in VDD12} \

19 / 26

本文来源:https://www.bwwdw.com/article/q5jm.html

Top