注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

見るところ花にあらずと云ふことなし

褎然举首

 
 
 

日志

 
 

转:动态可重构技术打造更灵活的芯片  

2009-10-26 11:13:23|  分类: IC design |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

http://china.nikkeibp.com.cn/news/semi/48458-20091022.html

http://china.nikkeibp.com.cn/news/semi/48459-20091022.html

看来很不错.

 

本文中文翻译由《电子设计应用》特别提供

  动态可重构是一种能够动态切换芯片电路结构的技术,目前,该技术正被越来越多地应用于各种设备中。例如,在复合机(MFP,Multi Function Peripheral)市场上,IPFlex公司是动态可重构技术的开创者,其图像处理器芯片相继被富士施乐、理光、东芝泰格(ToshibaTEC)等三家日本大型复合机厂商采用。在录像机领域,NEC电子的动态可重构技术被应用于索尼的3款录像机产品中。松下的录像机中也采用了原英国Elixent公司的技术,松下还在2006年7月收购了这家公司。此外,索尼公司早在2002年就开始推进针对便携设备的低功耗动态可重构技术VME(虚拟移动引擎)的实用化,并将该技术应用到了便携音乐播放器Walkman与PSP Go等PSP系列掌上游戏机中(见图1)。

图1 采用动态可重构技术的设备开始增加

  动态可重构这一概念是在大约8年前提出的,当时众多企业纷纷进行开发,但大多以失败告终,像美国QuickSilver Technology公司、Chameleon Systems公司、日本AOI技术公司等后来都撤出市场,并最终宣布公司解散。但其中也有一些企业坚持改进技术,终于获得成功。上文提到的IPFlex、NEC电子及Elixent等就都是在动态可重构技术还处于黎明期时便开始投入开发的公司。此外,2004年左右,东芝、三洋电机、三菱电机等本来未涉及动态可重构技术的日本厂商也开始着手开发这一技术。随着半导体制造艺的发展,先进ASIC芯片的掩膜成本不断攀升至高达数百万美元。开发新设备时,如果采用ASIC芯片,就很难兼顾设备的开发成本及开发周期,因此需要研究可编程的芯片。

呈矩阵状排列的ALU

  很多人认为,动态可重构技术主要用于多功能系统中,通过改变工作模式来切换芯片的功能。但实际上,动态可重构技术的本质并不是切换功能。单功能系统也常常需要在有限的芯片面积内高效地完成极为复杂的处理。

  动态可重构技术通常所采用的结构是将数十到上千个ALU(算术逻辑单元)排列成矩阵(见图2)。虽然随着工艺技术的发展,芯片上可以集成的ALU的数量在不断增加,但如果想要控制成本,那就不能集成太多的ALU,这样又很难实现深度达数百级的长流水线结构。因此,需要将长流水线进行划分,并通过资源的时分复用来实现芯片的动态可重构。

图2 矩阵排列的ALU

  虽然芯片中实际的ALU数量是一定的,但通过每秒数十次的频繁切换电路结构,给人的感觉就像是芯片中存在着众多的虚拟ALU。切换的间隔通常为数十毫秒,但实际上每次的切换动作大多在1个时钟周期(数十纳秒)内就已经结束。

优化流水线的划分及重构

  在利用动态可重构技术时,如果能够更好地划分长流水线,就能够大大提高处理速度,在单芯片上实现更复杂、庞大的处理。

  复合机厂商富士施乐公司便对流水线的划分及重构技术进行了彻底的优化,力求以技术取胜。该公司的复合机图像处理器中使用了IPFlex公司的动态可重构芯片DAPDNA-IMX。复合机需要针对数量庞大的像素实时地进行缩放、误差扩散、DCT处理等各种图像处理操作,但是,复杂处理所需的流水线并不能全部容纳于动态可重构芯片的ALU矩阵内。因此,富士施乐将长流水线进行了划分,然后每40ms对电路结构进行切换。该公司的布线设计、优化设计等工作全部是手工完成的,没有依赖任何工具。

  富十施乐公司研究技术开发本部光电基础技术研究所组长山田和雄表示:“我们只需采用1000个DAPDNA-IMX的ALU就能够确保实时性,而且可以充分利用、切换所需电路。”

  富士施乐公司之所以对自己的动态可重构技术充满自信,是因为该公司从2000年左右就开始关注可编程芯片,2003年就开始采用与英特尔公司针对复合机领域共同开发的异构多核型可重构处理器MXP5800,并将其应用到了2004年上市的产品中。

  山田和雄认为:“经过之前的经验,我们已经证实,无需开发AS I C,使用可编程芯片就可以实现具有足够功能的图像处理器。虽然采用MXP5800的设备已经在市场上取得销售实绩,但公司内部讨论之后最终还是决定采用DAPDNA。”

  此外,该公司并不认为将来DAPDNA之类的动态可重构技术会与ASIC直接竞争,公司计划将两者定位为结合互补的关系。具体来说就是采用动态可重构芯片迅速实现一些新的功能,以实现具差异化的产品,一旦这些新功能演变为标准功能后,再尽快将其转移至由ASIC实现,以降低成本。当将一部分功能转移到ASIC中后,就可以对动态可重构芯片的ALU进行重新分配,以实现更新的功能。山田和雄表示:“动态可重构芯片的结构较为简单,只是将多个有规律的ALU并列配置为矩阵,因此扩展性较好,能够容易地实现多个芯片的组合或转向更先进的工艺。”

 

通过工具进行设计

  与富士施乐公司不同,另外一些芯片厂商则希望无需手动设计电路结构的切换方式,而是将其交由软件工具完成,以缩短开发周期,如NEC电子于2002年推出的STP引擎。目前NEC电子的STP引擎技术已应用于索尼的播放器设备中。索尼共有3款设备采用了同样的芯片,在随后上市的产品中,也并未更改芯片的掩膜,只是增加了图像处理功能等。

  如果像索尼这样,在多款设备中采用同样的芯片,并通过软件来增加新功能,那么就无需使用任何动态可重构技术,直接采用普通的FPGA即可实现。而且,最新的FPGA也已经可以在数十毫秒内动态地改变电路结构。

  不过,对于各种媒体处理任务来说,动态可重构技术与FPGA相比具有明显的优势。动态可重构芯片的单元粒度比FPGA粗,因此面积效率较高。FPGA的处理单元是查找表(LUT),以门为单位,粒度极小;而大多数动态可重构芯片的粒度较粗,以ALU为单位,粒度达8位~32位(见图2)。当单元粒度较粗时,单位面积内的单元数就较少,布线与开关等外围电路所占的面积也较小,面积效率自然得以提高。据庆应义塾大学理工学院信息工程系教授天野英晴称:“如果要在电路中实现普通的媒体处理功能,那么使用动态可重构技术时的面积效率大约是FPGA的5倍~10倍。”

继续改善架构 减少布线数量

  目前已进入实用化阶段的动态可重构技术大多基于IPFl e x、N E C电子等厂商在2 0 0 0 年前后所开发的基础技术。受这些基本架构的影响,很多企业在2004年左右也开始着手自行开发相关技术,这些企业包括东芝、三洋电机、日立制作所、三菱电机、瑞萨科技等(见表1)。

表1 日本厂商所开发的动态可重构技术

  这些公司的动态可重构技术大多尚未应用到实际产品中,仍处在研发阶段。不过,这些技术都是以IPFlex、NEC电子等开发的基础技术为参考,再设法进行改善。具体来说,是考虑如何减少单元间的布线,削减冗余面积和电路面积。东芝研究开发中心计算机网络拓扑研究主管、动态可重构技术FlexSword的开发者吉川宜史就认为:“对于消费类设备来说,现有的动态可重构技术中单元之间的布线还是过多。”

  在东芝的FlexSword技术里,ALU矩阵规模较小,仅8路×5级,ALU之间的连接只有上下方向(见图3)。图3中的蓝色虚线显示出数据的流向,数据先进入ALU矩阵完成SIMD(单指令多数据流)所不擅长的处理,然后再通过SIMD运算单元进行特定的媒体处理。而且,FlexSword技术中不是简单的连接邻近单元,而是依次连接1个、2个、4个邻近单元。吉川宜史表示:“对于媒体处理的蝶形运算那样一边载入数据一边进行处理的方式,这种连接的效率最高。”

图3 将ALU矩阵与SIMD结合在一起的FlexSword技术

  三洋电机开发的动态可重构技术的内部结构与东芝的Fl e xSwo r d技术较为类似。其将24位的ALU排列成6路×4级的矩阵,每个ALU只与下一级的3个ALU相连接(见图4)。该技术主要用于车载调谐器的基带处理。三洋电机研究开发本部数字技术研究所系统设计研究部科长平松达夫介绍说:“如果要用于消费类设备,那么必须实现更小的电路面积,因此需要减少布线的连接端,使布线的总长度和电路规模均得以减小,这样还有利于提高速度。”

图4 三洋电机车载调谐器

ALU阵列以外的电路也可以动态重构

  通常说的动态可重构技术大都是指ALU的矩阵排列以及媒体处理和通信处理的优化等。但最近业界又提出了一种完全不同的动态可重构技术,其中排列的单元并不是ALU。虽然其内部架构与ALU矩阵架构完全不同,但其目的都是通过切换电路结构来实现动态可重构,以削减电路面积,提高编程灵活性。

  例如,三菱电机面向MPEG-2及H.264等熵编码VLC/D(可变长编/解码)处理开发了全新的动态可重构技术。该技术给数据流中出现频率较高的数据分配一个较短的霍夫曼编码,然后尽可能将这些编码集成到有限的电路面积上。各单元由4位寄存器与比较器组成,霍夫曼编码表的查询处理其实是通过多个单元并行执行位列的模式匹配(见图5)。在该应用中,各单元的处理只有位列的简单比较,如果采用粗粒度的ALU矩阵来实现就会太过浪费。

图5 H.264/MPEG-2等VLC/D处理的动态可重构技术

  VLC/D处理通用于MPEG-2及H.264等,但表的查询方式不同。在MPEG-2里,只使用单一的固定表;而H.264及MPEG-4里,数据流的内容需针对每一帧图像分别使用多种不同的表。为了支持多种标准,并将每个标准的优化特性集成到逻辑电路上,就需要进行动态可重构。(全文完 记者:进藤智则)

  评论这张
 
阅读(339)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017