分享
一种基于Hierarchy...的可重构S-box实现方法_方震.pdf
下载文档

ID:2728104

大小:1.86MB

页数:4页

格式:PDF

时间:2023-10-13

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
一种 基于 Hierarchy 可重构 box 实现 方法
电子技术应用 2023年 第49卷 第1期Microelectronic Technology微电子技术一种基于 Hierarchy LUT 的可重构 S-box 实现方法方震,赵伟,刘勇(中国电子科技集团公司第五十八研究所,江苏 无锡 214035)摘 要:基于查找表方法构建的 Substitution box(S-box)在可重构分组密码实现中广泛使用,然而因消耗的资源过大,其面积利用效率低。为提高可重构 S-box 面积利用效率,提出一种基于 4R/1W 存储结构的分层查找表(Hierarchy LUT),构建可重构 S-box。所提出的 4R/1W 存储结构能减少存储单元的例化数量,提高存储密度。在 40nm CMOS工 艺 下,实 现 基 于 Hierarchy LUT 的 可 重 构 S-box,其 面 积 利 用 效 率 得 到 改 善,对 比 Table Lookup Unit(TLU)和Memory Sharing 的可重构 S-box 方案,效率分别提高了 51.76%和 6.88%。关键词:可重构;S-box;4R/1W;Hierarchy LUT中图分类号:TN46 文献标志码:A DOI:10.16157/j.issn.0258-7998.222891中文引用格式:方震,赵伟,刘勇.一种基于 Hierarchy LUT 的可重构 S-box 实现方法J.电子技术应用,2023,49(1):41-44.英文引用格式:Fang Zhen,Zhao Wei,Liu Yong.A scheme of the reconfigurable S-box based on Hierarchy LUTJ.Application of Electronic Technique,2023,49(1):41-44.A scheme of the reconfigurable S-box based on Hierarchy LUTFang Zhen,Zhao Wei,Liu Yong(No.58 Research Institute of China Electronics Technology Gruop Corporation,Wuxi 214035,China)Abstract:The S-box based on LUT is widely used in the reconfigurable block cipher.It is not efficient in area for the expended resources.In this paper,the Hierarchy LUT architecture based on 4R/1W memory unit is proposed to compose the reconfigurable S-box.The 4R/1W can reduce the numbers of the storage unit in the reconfigurable S-box.The proposed Hierarchy LUT is applicable for different sets of ciphers and it is implemented under 40 nm CMOS technology to compare with similar work.The comparison result shows that the proposed Hierarchy LUT gains 6.88%to 51.76%resource efficiency improvement.Key words:reconfigure;S-box;4R/1W;Hierarchy LUT0 引言通信领域中,高吞吐量的加密和解密技术一直是研究的重点。分组密码算法在高速、海量数据加密解密应用中广泛使用。为使分组密码达到高的性能,通常采用硬件加速。专用集成电路(ASIC)虽然性能高,但是在算法切换、参数可变的应用中缺乏灵活性。可重构架构技术则可在一定程度上弥补短板,平衡高性能和灵活性,有利于分组密码算法硬件加速应用,进而通过优化分组密码算法实现。分组密码算法主要包括逻辑运算、算数运算1、置换处理2、字节替换(S-box)2-3。S-box作为分组密码算法的非线性处理单元,在分组密码算法中发挥着重要的作用。一般而言,不同的分组密码算法,S-box 的结构都有所不同,这也是分组密码算法的瓶颈所在。因而 S-box 的性能和面积的优化成为了分组密码算法主要研究目标。S-box 的构建方法通常有两种:一是基于逻辑结构的构建方法,二是基于查找表结构的方法。第一种方法主要基于真值表生成或基于生成规则的逻辑运算。例如 Product of Sums(POS)4、Positive Polarity Reed-Muller form(PPRM)5、Binary Decision Diagram(BDD)6采用两级逻辑实现,或者采用 GF(28)、GF(24)2 7或者 GF(22)2)2)8有限域运算逻辑实现。虽然逻辑构建实现占用资源较少,但缺乏灵活性,不能适配不同的 S-box 结构。此外 S-box 综合时会产生很大的累积资源占用。第二种方法基于查找表。通常将存储单元用于 Look Up Table(LUT),存储字节替换表。由于存储单元中的字节替换表可以很方便地更新,这种方法被广泛应用于分组密码的可重构实现2-3,9-10。相比与基于逻辑的方法,其缺点是需要占用更多的硬件资源,特别是在支持几种不同的 S-box 操作时3。为了减少面积的资源消耗,文献41Microelectronic Technology微电子技术www.ChinaAET.com2提出由多个子系统组成存储系统,谋求性能和资源的平衡,实用效果有限。基于上述问题,本文提出了一种 4R/1W 存储结构,并基于此存储单元构建分层查找表(Hierarchy LUT),以节省资源消耗,提高面积利用效率。1 可重构 S-box 存储单元改进在基于查找表的实现中,S-box 的数据信息存储在一个基本的存储单元中。这些存储单元的数量会随着输入输出位宽、并行端口数量的增加而急剧增大。因此需要分析影响存储单元开销的因素。例如,一个经典的分组密码算法 Advanced Encryption Standard(AES),每轮需要 16 个相同的 S-box,传统的S-box 查找表的实现如图 1 所示,16 个 RAM 存储块用来存储相同的查找表信息,每个 RAM 块都有独立的读写端口。因为每个 RAM 块存储的信息都一样,可以共用输入端口,将其换成图 2 所示的结构,用触发器来存储查找表信息。这些触发器存储结构共用一个输入端口,而输出端口则通过多路选择器选择输出。基于此思路,本文提出一个定制的 4R/1W(4 个读端口,1 个写端口)存储单元,用来减少整体存储的面积开销。如图 3 所示,该电路基于 6 管 SRAM 结构,包括 1 对写 信 号 线(WBL 和 WBLB)以 及 4 个 单 端 的 读 信 号 线(RBL_1、RBL_2、RBL_3、RBL_4)。每个读信号线都由两个 NMOS 组成,以 M7 和 M8 组成的读端口为例,M7的漏极连接 M8 的源极,M8 的漏极接到读信号端口。其他三个读端口结构相同。这种存储结构可以同时接收 4路彼此独立的读信号,获取 4 个地址的数据,而无需额外例化 3 个存储单元,因而有很高的存储密度。用来存储S-box的RAM存储单元所占用的面积占据总面积的相当大的比重。以 AES 算法为例,尽管 IP vendors提供的RAM存储器经过优化,占用很少的资源,但在AES算法中需要16个RAM单元存储S-box,这些累计存储单元面积开销则不容忽略,如图4所示。通过主从触发器搭建的存储的结构虽然能够减少重复的存储面积的占用,但是其输出端口中的选择器占用的资源却很大。而采用本文提出的4R/1W结构的存储器则占用很小的资源开销。2 可重构 S-box 查找表改进S-box 有四个主要的特性,分别为输入位宽、输出位宽、S-box 的数量和每轮并行端口数量。不同的 S-box 结构,四个特性有着较大的差异。为便于表述,在本文中定义了 AW、DW、N、m 四个参数:AW 为地址最大位宽,DW 为数据最大位宽,N 为最大的 S-box 数量,m 为最大并行端口数量。表 1 展示了几个常用的分组密码加密算法,其中 RU 参数表征加解密处理的性能2。分组密码算法的 S-box 结构不一样,其对应的一些参数也各不相同。当 AW、DW、N 和 m 四个参数变化时,分组密码算法的面积开销大有不同。如果只有一个读端口,则会大大图 1重复 RAM 块存储查找表图 2寄存器储存查找表图 34R/1W 存储单元结构图 4各类存储在电路中面积开销表 1不同算法中 S-box 性能及特性表AlgorithmAESBlowfishCamelliaCAST128DESGOSTKASUMISEEDRU1022916112622AW/位88886498DW/位8328324498N/个161111114m/个1448881242Microelectronic Technology微电子技术电子技术应用 2023年 第49卷 第1期增加面积的开销。为尽可能减小面积的开销,适当增大可读的端口数量、AW 和 DW。但要注意,因为读写控制逻辑会占用一定的资源,过多的读写端口同样会引起面积开销增大。基于上节提出的 4R/1W 存储单元,本节提出一个分层查找表 Hierarchy LUT,如图 5 所示。Hierarchy LUT包括 4 个 32 端口存储器以及输入输出控制逻辑。其中32 端口的存储器由 8 个 4R/1W 存储单元组成,它们共用一个写数据线。Hierarchy LUT 可以根据 S-box 的结构来配置重构输入输出位宽,进而重构电路。根据输入输出的位宽,可以提供 6 种不同的查找表模式,如图 6 所示。Mode1:工作于 4 个 2568 的多端口模式。Mode2:工作于 2 个 25616 的多端口模式。Mode3:工作于 1 个 51216 的多端口模式。Mode4:工作于 1 个 25632 的多端口模式。Mode5:工作于 1 个 10248 的多端口模式。Mode6:工作于 2 个 5128 的多端口模式。3 对比实现本文在 40 nm CMOS 工艺下,通过 Synopsys IC compiler 工具进行综合,实现 Hierarchy LUT 构造可重构 S-box,结果如表 2 所示,面积利用率为 1.724。与之对比的是基于 Table Lookup Unit(TLU)2和 Memory Sharing3的可重构 S-box 结构。基于 TLU 结构的 S-box 是可重构加解密处理器的一个主要部分。为了提供并行的数据端口,TLU 结构提供比较大的输入输出位宽,存储深度达 1 024,其基本结构是由单端口的存储单元组成的。本文提出的基于 Hierarchy LUT 结构的 S-box,减少了存储器的冗余,具有较高的存储密度,与 TLU 结构相比,面积利用效率从 1.136提高到 1.724,性能提升 51.76%。基于 Memory Sharing3触发器结构的可重构 S-box,适用于 AES、DES 及 Serpent 的算法。该结构有 16 个端口,其占用的面积很小,但是此结构不够灵活,且并行度不高,最大输入输出位宽为 8 位,而且在数量多的端口情况下,因其端口数据选择器控制占用较多的资源,面图 5分层查找表结构图 6可重构 S-box 查找表模式43Microelectronic Technology微电子技术www.ChinaAET.com积会迅速增大。与之相比,本文提出的基于 Hierarch

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开