半导体器件包含数以亿计在极度温度和恶劣环境下事情的晶体管,因此,许多器件不能正常事情或寿命有限也就不足为奇了。有些器件永久出不了实验室,还有很多器件去世在晶圆厂里。人们希望大多数放到产品中的器件都能存活下来,直到它们过期,但很多事情可能会导致它们走不了那么远。纵然是运行正常的器件也可能受到危害,以至于无法供应精确的结果。
常见危害及其缘故原由不可胜数。它们常日分为几个种别,下面将对此进行详细解释。

去世于设计

根据Mentor/Wilson的功能验证研究,2018年,只有26%的ASIC实现了一次流片成功,低于此前的研究结果。成功率低的部分缘故原由是新技能节点增加了尚未完备理解的寻衅。已经存在了一段韶光的问题被纳入到工具和流程中,从而使那些已知的问题不再是威胁。然而,2018年,稠浊旗子暗记接口、串扰、时序和IR drop,这些已知的问题导致了重新流片的增加。
图1:导致重新流片的ASIC毛病类型。 (来源:Wilson Research Group和西门子M
Synopsys的产品经理Kenneth Chang表示:“一些客户的芯片失落败,是由于他们的设计过程更加分外。一位客户进行了block级功耗剖析,然后进行了整合。 他们认为可以在这个阶段修复问题。但问题是不可修复的,芯片已经失落败了。芯片失落败的缘故原由在于旧方法不再适用于新的前辈技能。”
失落败不一定是不能正常事情。Cadence公司Digital和Signoff部门产品管理总监Jerry Zhao表示:“失落败可能是由于它没能达到性能目标,如果芯片的运行速率比预期低10%,那么它在市场上可能没有竞争力。”
电源正在成为一项寻衅,特殊是当电源在片上的时候。Arm公司物理设计部门高等办理方案营销经理Lisa Minwell表示:“电源供电网络(PDN)是一个分布式RLC网络,可以分为三个部分:片上、封装和电路板。片上须要更快的时钟频率、更低的事情电压、更高的晶体管密度。虽然前辈的finFET技能已经实现了持续的性能提升,增加的功率密度使IR drop闭合成为一项寻衅。准确建模和最小化电压裕度是平衡电源效率和鲁棒性的关键。”
但裕度可能是悲观的,从而限定了竞争力。只管创造了问题,但一些公司还是冒险连续提高。Kenneth Chang表示:“一家大型存储器公司的流片涌现了已知的大量IR drop问题。只要看上去不太糟糕,他们就会流片,由于日程表对他们来说更主要。客户正在学习,在这种情形下,他们的芯片并没有失落败。如果他们没有失落败,他们就会连续做正在做的事情。当他们到达更前辈的节点时,他们会更加被指标驱动,并且须要实行EMIR剖析。”
越来越多的问题也开始同时涌现。例如,功率、IR drop、发热、时序、电迁移都是干系的,但是对付个中大部分问题的剖析是分开进行的。Jerry Zhao表示:“电源噪音是一个问题。供电电压正不才降,同时用户希望得到更高的性能。你无法从电池得到太多的驱动功率,或许850 mV,但你仍旧想要3GHz的性能。电源噪声会产生重大影响,特殊是当裸片有变革的情形下,这种(噪声)会随着韶光和位置而变革。因此,不同位置的同一电池可能会因电压低落而失落效,从而导致时序延迟。你必须在电压低落的背景下剖析电池,并进行静电电压感合时序剖析。有些路径对电压变革非常敏感。”
随着问题得到更好的理解,工具可以进行更好的剖析,并且可以利用设计方法来规避问题。Moortec公司营销副总裁Ramsay Allen阐明道:“繁芜性导致了更大的功率密度,而这反之又在芯片内部产生了局部热点。栅极密度的增加还会导致供给电路的电源电压低落更大。在全体设计过程中,高精度的温度传感器和电源监控器使系统能够管理温柔应这些条件,通过供应热管理和供电非常检测的办理方案,提高器件的可靠性和优化性能。这一点在数据中央和人工智能设计中尤为主要,在这些设计中,性能哀求的提高使设计在温度和电压方面承受了巨大的压力。”
去世于制造
半导体器件的制造涉及到丈量仅几纳米的构造。作为参照,人类DNA链直径为2.5nm,而人头发直径则为80,000至100,000nm。一粒尘埃可以摧毁晶圆片上的几个裸片。如果裸片的尺寸变大,随机失落效的可能性就会增加。对付成熟的工艺节点,产率可能在80%到90%之间。然而,对付较新的节点,产率可能大大低于50%,只管实际数字是严格保密的。
图2. 晶圆毛病图案。(来源:Marvell Semiconductor,ITC 2015)
纵然裸片没有受到灾害性的影响,也不能被认为是可操作的。制造步骤不完善,哪怕一个原子的工艺变革也会产生显著的差异。虽然这可能不会对设计的某些部分产生影响,但如果工艺变革恰好与关键时序路径吻合,则可能会使器件不符合规格。
ANSYS公司ESD/heat /reliability产品经理Karthik Srinivasan阐明说:“随着设计逐渐演化成采取前辈封装的深亚微米技能,现有的仿真工具和设计方法无法很好地反响变革及其对可靠性的影响。这会导致设计流程涌现漏洞,从而导致一些失落败。”
设计流程越来越多地许可在开拓早期就考虑到变革,以最大限度地减少其影响,而冗余等设计技能可以减少须要丢弃的“险些可以事情”的芯片的数量。“险些可以事情”的芯片对付大型存储器阵列非常常见。分类(Binning)是常常用于处理器的另一种做法,以较高频率运行的优秀器件可以以较高价格出售,而那些只有在低频时才能成功事情的器件则以折扣价出售。
测试的浸染是找出哪些裸片功能完备。那些临界的裸片常日会被丢弃,但一些无功能的裸片确实存在漏检,并终极成为产品。
去世于触摸
杀去世芯片有多种方法。请考虑,施加在芯片外部的0.5V电压在1nm的介质上产生0.5mV/m的电场。这足以导致高压电弧。现在考虑一下当你触摸芯片的引脚时会发生什么。
Jerry Zhao阐明说:“常日情形下,它是一个高电压,根据引脚的打仗办法,会有不同的模型,如人体模型或电荷分布模型(CDM)。这些模型定义了电流如何流入引脚。这是一个随韶光变革的波形。”
常日,芯片会包含静电放电(ESD)保护。ANSYS公司的Srinivasan指出:“对付封装内的单个裸片,他们的目标是2kJ这样的标准。多芯片办理方案,例如HBM,标准略低。利用2.5D或3D IC的一个缘故原由是为了性能,而ESD则是性能的障碍。你试图最小化ESD,乃至在这些Wide I/O接口或任何类型的多芯片接口通道上肃清它,这意味着你无法按照你针对单芯片的相同标准对每个芯片进行真正的测试。它们必须经由更专业的测试,由于它们的ESD保护很小,或者可能没有ESD保护。”
纵然在运行期间,ESD事宜也可能导致问题。Arm公司的Minwell说:“在便携式电子产品中,ESD可以导致许多类型的软缺点。在ESD事宜期间,电源供电网络(PDN)上可能会引起噪声,缘故原由在于某些IC(振荡器IC、CPU和其他IC)的灵敏度,或是PDN的场耦合。”
去世于关联问题
Helic公司营销副总裁Magdy Abadir说:“软缺点可能以多种办法发生,如果缺点是系统上的,它可能会使芯片看起来彷佛不事情。3D IC正在增加对电磁感应设计方法的需求。这是由于产生的功率密度更高和堆叠层数的增加,这就增加了产生天线的风险,它会放大全体设计过程中产生的磁场。”
电力供应不敷也会造成问题。Jerry Zhao说:“芯片的功能取决于晶体管开关。这取决于供电电压。如果它在1V下事情,它可能会低落10%或20%并仍旧可以正常事情。但时序会有所不同,因此可能须要降落最大时钟频率。”
由于电压降落,电路更随意马虎受到噪声的影响。ANSYS公司半导体奇迹部首席技能专家Norman Chang说:“电磁滋扰(EMI)是芯片向环境发出的噪声。噪声源来自有源电路,它会在电源/地线和旗子暗记线上产生电流。电源线/地线将通过封装到PCB,如果它看到封装或PCB上有天线构造,就会引起空气辐射,然后通过天线构造辐射到环境中产生滋扰。”
但出去的东西也会进来。Norman Chang表示:“电磁敏感性(EMS)是人们不得不担心的新问题。能量注入测试是从150kHz开始注入1W能量,一贯到1GHz。在每个频率,你会向系统注入1W的能量。如果你没有足够的保护,就会毁坏沿路径进入芯片的电路。我们的目标不是毁坏芯片,而是测试这种噪声是否会影响电路。或者引脚上的电压可能过高,如果电压太高,就会产生过电应变(electrical over-strain)。”
去世于操作
此时,芯片已经到达现场并被认为是可操作的。Microchip仿照电源和接口部门首席产品营销工程师Fionn Sheerin说:“可靠性是个大问题。在很多情形下,糟糕的热设计并不会导致瞬间灾害性的故障,乃至不会导致产品平庸。但器件寿命会变短。不雅观察layout中的热点或最佳layout实践以及良好的层次方案可能会产生不同的效果。这也是验证和可靠性测试真正主要之处,也是汽车运用中的功能安全问题。”
西门子Mentor奇迹部的产品营销总监Joe Davis对此表示赞许:“发热带来的问题不仅仅是手机在口袋里变热。它会导致晶体管和它们之间的连接退化。这可能会影响性能和可靠性。”
热量产生于两个来源。Jerry Zhao表示:“首先是路由层。这是与导线中的电流有关的热量。仿照电路比数字电路有更大的电流。因此,仿照设计者不得不担心温度过高是否会使连线融化。第二个来源是晶体管。当我们迁移到finFET时,一个新的征象是自热。热量沿着弱电阻路径运动,从晶体管的鳍片垂直发散。这就增加了连线中的热量。”
昔时夜电流和热量聚拢在一起时,电迁移效应会逐步破坏连线。类似地,诸如负偏置温度不稳定性(NBTI)之类的物理效应,当你有很大的电荷时,会对器件造成压力,如果持续足够长的韶光会导致永久性破坏。
结论
本文仅包含芯片从操持到产品,然后在产品的生命周期中所面临的一些寻衅。
芯片在恶劣环境中运行,半导体行业已经学会了如何应对这些寻衅。但是随着制造尺寸变小以及采取新的封装技能时,新问题涌现了。有时,这些新效应会导致器件失落败。但从历史上看,行业很快就学会了要么规避新问题,要么将问题最小化的方法。









