2023年12月9日发(作者:太宗)
NEW TECHNOLOGY I新技术聚焦 算子设计方法缩小IC设计与制造 间的“剪刀差” IC设计方法学是缩/]xlC设计技术与制造技术间“剪刀差”的有效途径。作为设计方法学的新探索, 算子设计的粒度大于标准单元,兼顾IP复用的一些属性,旨在提升IC设计效率和缩短IC设计时间。 ■王新安 信息工程学院常务副院长 北京大学深圳研究生院 JC设计技术落后于制造技术 节点为代表的基于IP的设计。2009年 程)基本包括六个步骤:1.C语言或M 形成的“剪刀差”是Ic设计方法的 32nmi[:艺已经成熟量产,预计2014 语言的算法理解与分析;2.算法分 研究起因。纵观IC设计的发展历史 年1二艺节点可望达到l0nm。IC的设 析与设计优化,此步骤过程复杂、 方法学将如何发展,才能与工艺 个体差异大、失误多;3.关键模块 我们可以看到.IC设计方法的评价 计‘体系随着工艺节点发展而演变,设 技术相适应,成为Ic设计发展到今 设计与评估;4.RTLf七码设计;5.验 计方法与工艺节点相关。Ic的设计 天日益突出的问题 方法由最早的全定制设计,发展到 证过程,此过程工作量大,排错 I C产品的生命周期逐渐缩短 难;6.后端设汁,工作馈大,优化 1 984年前后以1.0gm_-E艺节点为代表 和快速上市的需求,设计复杂度和 闲难。 的门阵列设计,再到1994年前后以 NRE费用的迅速提升,都驱动着lc 这样的设计流程势必使得IC 0.5gmSK艺节点为代表的标准单元设 设计方法学的研究。目前从算法到 设计存在周期长和成本高的问题。 计,以及1999年前后以0.25gm工艺 IC的设计过程(或者说AsIc设计过 为了解决这个问题,现在很多EDA 工具研究者和厂商,郜在寻求一 种南算法的高级语言(包括Java、 Matlab、C等)捕述直接得到RTL代 码描述的高层次综合设汁方法, 并且已经初见成果。其中有Mentor 公司的Catapult、Synopsys公司的 Synphony HLS和加州大学圣地亚哥 分校和尔湾分校(] ̄JSPARK fC to RTL VHDL)等。 C ataPuIt兼容SY Stem C; Synopsys公司的Synphony HLS提出 了独特的M语言和基于模型的综合 法,与传统RTL流程相比,能够为通 信和多媒体应用提供高达1 0倍或更 高的设计和验证能力。目前高层次 综合的产品刚刚进入市场,还需要 王新安:IC设计方法学的进步是缩小lC设计技术与制造技术之间“剪刀差”的有效途径。 时间完善。 集成电路应用I 23 新技术聚焦]NEW TEcHN。L。GY 有功能的需要,设计人员可以采用 子与运算算子,形成数据流结构。 述和验证; 交叉开关和总线。 4.控制算子 算子的提出 回顾IC设计方法学的发展历 基于算子的上层语言对算法进行描 其实现形式主要有三种:多选器、 程,全定制是基于MOS管的设计, 门阵列是基于逻辑门的设计,标准 单元是基于触发器的设计……可以 2.支持算法的实现 种类完备但是数量有限的算 控制算子的作用是正常控制数 发现随着Ic的复杂性逐渐提高,Ic 子既能够支持卜层语言描述中刈‘运 据流的流动。其实现形式有三种: 设计的基本 元的粒度也越来越 算、存储、控制和数据路径的捕 计数器、状态机和微指令字。控制 大。粒度的增大带来的直接影响就 述.并且可以基于算子描述进行优 输出内容包括运算算子动态重构信 是加快了IC的设计速度。IP核的使用 化和验证; 息、存储算子AGU的配置信息、链 通过复用来加速Ic设计。但是在以 “应用需求决定硬件结构”的ASIC 3.能够加速设计和验证 接算子的配簧信息,实现对其他算 5.时钟算子 时钟箅子是驱动和定时部件, 设计人员利用箅子完成算法的 子的控制。 设计中,设计实践表明仅由IP核的复 功能描述后,对应的硬件设计也同 用来提升设计效率还是不够的,因 时完成。因为所有算子均是预先全 为基于IP的设计仍然显示出了其灵活 定制的且已被验证正确的单元.【大1 用于产生供所述控制算子部件和处 性的不足。我们提 的粒度大于标 此将缩短设计和验证的时问,设计 理算子的时钟信号,所述时钟信号 准单元的算子设计概念,也是从提 人员只需要保证基于算子的描述和 还包含控制时钟起停和控制时钟频 升设计效率的角度出发,兼顾IP复用 映射过程的正确即可,从而将大大 率的信号。 的一些属性。 加速设计和验证过程。 算子设计方法学 lc的算子设计过程可以概括为 箅子设计方法希望从数学上能 够支持算法的描述,为实现算法到 算子的种类 箅子语言、算子结构的自动化翻译 提供支撑。算子的特点如下: 1.粒度更大 1.运算算子 将C、Matlab等高级语言或者流程 运算算子支持算术逻辑、移位 图的算法描述转化为算子描述并在 等运算功能的实现,称为基本运箅 算子结构上进行优化设计的过程。 每个算子都具有一定功能,它 算子。针对不同应用会有专门的算 由于算子已经预先设计并验证,因 是一种函数运算的符号表示。整个 子支持,比如媒体处理中相减取绝 此算法的算子描述可以快速或者自 算子体系能够支持算法描述中的所 对值、求平均值、同定系数滤波运 动完成设计验证过程。对于特定领 算等复杂但很常用的运算,这些运 域,比如通信或媒体,可以设计一 算算子称为扩展运算算子,它们由 些更好支撑算法实现的扩展算子或 基本运算算子搭建而成。 2.存储算子 算法中的不同阶段对数据处理 得在每个阶段中数据的存储格式和 方式不同,存储算子则针对这类需 算子IP,从而更大程度地加速和优化 设计过程。 算子设计方法学的关键流程如 1.算法分解 将数据流算法的流程图或者C、 的顺序和排列是不一样的,从而使 图所示,主要步骤如下: lab等高级语言描述形式, 求实现数据不同存储格式和方式的 Java、Mat转换。提取出不同应用中基本且常 划分为若干个子算法过程。 用的存储格式和转换方式,比如串 并转换、并串转换、队列结构、堆 支持。 3.路径箅子 算子设计方法学的关键流程 2.标注时间 对各个子算法过程标注完成该 描述来标注时间。 栈结构等,存储算子将对它们进行 过程所需要的时间,用户根据系统 3.生成算子时空图 (下接26页) 路径算子的作用是连接存储箅 24『集成电路应用 新技术聚焦I N ⅣTEcHN。L。GY 品组合转入更 FPGA结合,一起提供高带宽、低延 RLDRAM 2产 时网络存储解决方案。 Altera组件产品营销资深总监 先进的5 0 n m Luanne Schirrmeister表示: “Altera 工艺,提高系 的28nm Stratix V FPGA包括新的硬 统性能,降低 化数据通路.针对美光内存设有高 系统功耗,预 性能、低延迟接口。RLDRAM 3内 计将在201 0年 存的发布让我们的内存带宽可高达 第四季度开 1600Mbps,为行业内最高速度,大 始对其5 0 n m 幅降低了延时。美光新的存储产品 RLDRAM 2产 搭 ̄Altera新的内存接口架构是一项 品进行抽样。美光的RLDRAM产品路线图 重要技术成果,是我们与美光多年 Franklin介绍说,美光已经采取 576Mb RLDRAM 2采 frH 144uBGA ̄,] 多项措施,确保客户顺利完成新旧 装,而RLDRAM 3采用1 69焊球的 产品过渡。例如,RLDRAM 3正在 FBGA封装。 Franklin强调,考虑到当前市 技术合作的一项巅峰之作。” 从RLDRAM 2到RLDRAM 3的平滑 使用DDR3 I/O(基于SSTL的I/O、读 过渡 访问校准寄存器等)和RLDRAM 2功 场对RLDRAM 2系列的需求,以 RLDRAM 3将采用50nml丁岂,预 能(命令协议、SDR寻址等),提供开 及客户漫长的设计周期,美光承诺 计将在20l1年上半年开始抽样,目 发人员熟悉的电压值(1.35V内核电压 为RLDRAM 2提供长期的技术支 前美光正在与客户合作,征求其对 /1.2V l/0外设电压),为客户在设计 持。美光目前对RLDRAM 2产品线 RLDRAM 3内存设汁的意见。对于 中使用RLDRAM 3提供更多方便。 的投入和支持有助于增强目前使朋 现有的RLDRAM 2,荚光承诺将 RLDRAM 2的引脚和RLDRAM 3的 RLDRAM 2产品同时还考虑在下一 继续提供高水平的技术支持,并且 引脚不兼容,主要原因是RLDRAM 代产品使用RLDRAM 3的客户对美 计划 期生产该产品。美光正将其 3提供更强的功能和性能,特别是 光的信心。■ (上接24页) 选择复用面积较小的算子。在算子 满足时间约束的结果将代表其硬件 的最优结果。 6.验证提交 生成算法(包含各个子算法)的算 聚类过程中,这两种【大1素都需要考 实现代价最小,就是本步骤优化出 子时空图。将一个算法描述用算子 虑到。完全平铺开,没有任何复用.算法 的完成速度将最快,但这带来的代 4.聚类压缩 根据各个子算法过程的时间标 验证算法功能和算子设计的一 致性。 价将是很高的面积成本和功耗,这 注,在算子时空图中进行聚类压缩,IC设计方法学的进步是缩小 当然不是我们所希望的。我们希望 通过增加控制算子和数据路径算子来 在满足用户时序要求的前提下.最 提高存储算子和运算算子的复用,使 lc设计技术与制造技术之间“剪刀 c制造丁艺进入 大地减小面积和功耗需求,所以需 各个子算法过程的完成时间尽量与算 差”的有效途径。IC设计方 要复用一些算子。这样就需要在每 法过程标注的时间接近,即尽量减少 90nm以后,迫切需要新的I 法学的诞生。算子设计方法是IC设 个算子执行相应的功能上加上其执 运算和存储算子的数量。行时间的标注,在聚合映射中根据 执行时间复用算子,使之总体箅法 执行时间最接近于实际要求时间, 5.算子聚类优化 块步骤,都会产生不只一种结果, 计方法的一种探索,这种方法旨在 速度,希望可以缩短现有设计流程 聚类压缩步骤和生成算子功能 提升从高级语言向下层硬件映射的 这就是算子的时间图。空间图是对 因此,需要根据时间、面积、功耗 需要的时间。■ 集成 算子面积的定义,即在算子聚类映 等参数进行优化,按用户定义的指 《本文由雍姗栅根据I薪安在深蝴|iS能(执行H,tlN) ̄}出顺序,恰好 电路 耨应用震上的演讲编辑整理 ) 射时,根据算子的面积进行聚类, 标如 26 I集成电路应用
本文发布于:2023-12-09 05:06:49,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1702069609240023.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:算子设计方法缩小IC设计与制造间的“剪刀差”.doc
本文 PDF 下载地址:算子设计方法缩小IC设计与制造间的“剪刀差”.pdf
留言与评论(共有 0 条评论) |