現(xiàn)階段,越來越多的芯片應(yīng)用于安全或關(guān)鍵任務(wù)領(lǐng)域,對(duì)于芯片缺陷率和良率的要求越來越高。另一方面,對(duì)于企業(yè)來說,更低缺陷率和更高良率也是降低設(shè)計(jì)和制造成本的一種方式。
而在初始設(shè)計(jì)中解決這些問題已經(jīng)成為降低芯片缺陷率、提高良率的新方向。過去,芯片缺陷和良率問題總是被歸結(jié)于晶圓廠。為了確保芯片設(shè)計(jì)能夠成功流片點(diǎn)亮,企業(yè)實(shí)施了限制性設(shè)計(jì)規(guī)則 (RDR)。但RDR對(duì)于芯片設(shè)計(jì)生產(chǎn)來講,仍然存在一些挑戰(zhàn):
RDR增加了太多設(shè)計(jì)裕量,尤其是在先進(jìn)工藝節(jié)點(diǎn)上。這會(huì)對(duì)性能、功耗和面積產(chǎn)生負(fù)面影響。
為特定應(yīng)用定制的芯片越來越多,頻繁使用某種類型的先進(jìn)封裝、不同種類的處理器和存儲(chǔ)器,以及過去未批量生產(chǎn)的獨(dú)特架構(gòu)。
在某些應(yīng)用中,芯片的預(yù)期壽命更長(zhǎng),這意味著在智能手機(jī)中原本不是問題的潛在缺陷現(xiàn)在可能需要花更大代價(jià)召回。因此,設(shè)計(jì)團(tuán)隊(duì)開始在設(shè)計(jì)中加入傳感器,以確定芯片從開啟到預(yù)期壽命結(jié)束的使用狀態(tài)。
如今,設(shè)備及產(chǎn)品對(duì)芯片都有著不同的要求。例如,與為物聯(lián)網(wǎng)消費(fèi)設(shè)備生產(chǎn)的芯片相比,用于汽車傳動(dòng)系統(tǒng)的芯片具有完全不同的應(yīng)力和預(yù)期。設(shè)計(jì)團(tuán)隊(duì)需要了解這些芯片隨著時(shí)間的推移會(huì)如何表現(xiàn),從環(huán)境和使用條件到老化、電熱、應(yīng)力和變化效應(yīng)等綜合考量。
“可靠性是當(dāng)今電路設(shè)計(jì)和仿真中需要解決的最重要議題之一,”西門子EDA ICVS AMS驗(yàn)證產(chǎn)品工程總監(jiān)Ahmed Ramadan Hassan表示。“我們現(xiàn)在擁有的產(chǎn)品在2年、5年或10年后可能不再起作用。例如以特定頻率運(yùn)行的處理器,由于電路中的每個(gè)設(shè)備都施加了應(yīng)力,其頻率可能會(huì)在5年或更長(zhǎng)時(shí)間后下降。對(duì)于更大的設(shè)計(jì),這種偏壓或溫度方面的應(yīng)力會(huì)降低特定設(shè)備的整體性能。因此,芯片可能無法執(zhí)行預(yù)期的功能,或者會(huì)降低其預(yù)期的功能?!?/p>
設(shè)計(jì)人員現(xiàn)在必須在電路設(shè)計(jì)和驗(yàn)證中考慮可靠性問題,有效地將有關(guān)缺陷、良率和可制造性問題從設(shè)計(jì)到制造流程中一直左右轉(zhuǎn)移。
“過去,由于缺乏良好的可靠性分析和仿真技術(shù)以及可靠性模型,設(shè)計(jì)人員會(huì)過度設(shè)計(jì),并留有很多裕量。他們?cè)谠O(shè)計(jì)中添加了大量防護(hù)帶,來確保該產(chǎn)品至少在保修期內(nèi)不會(huì)出現(xiàn)故障?!?/p>
這種轉(zhuǎn)變意義重大,但需要從更高層面來看,才能真正了解其包羅萬象?!岸嗄陙?,我們始終努力制造更好、更快、更新的芯片,”Vtool前數(shù)字設(shè)計(jì)經(jīng)理Aleksandar Mijatovic表示?!爱?dāng)技術(shù)處于臨界點(diǎn)時(shí),我們也面臨著一系列問題。有時(shí)技術(shù)突破邊界卻與預(yù)期背道而馳。這意味著如果嘗試使用最大頻率來實(shí)現(xiàn)芯片上的最大密度,則很可能在給定技術(shù)的可能性邊緣工作,有時(shí)可能會(huì)破壞芯片功能。但另一方面,這不是工程師的錯(cuò)。我們都知道這一點(diǎn),但市場(chǎng)要求更好、更新、更快?!?/p>
經(jīng)濟(jì)負(fù)擔(dān)也在向左轉(zhuǎn)移。雖然這種動(dòng)態(tài)在某種程度上一直存在,但隨著芯片制造商努力控制成本,這種趨勢(shì)已成為行業(yè)關(guān)注的焦點(diǎn)。
圖1:每個(gè)工藝節(jié)點(diǎn)的SoC成本以百萬美元成倍上升。
圖源:Cadence
“當(dāng)前,一些公司表示,‘我們沒有必要使用最新工藝制程,而是需要可靠的工藝節(jié)點(diǎn)。我們不想太頻繁地更換芯片。’這并不是什么新鮮事,只是關(guān)注重點(diǎn)正在轉(zhuǎn)移,” Mijatovic表示?!坝性S多公司正在使用非常過時(shí)的技術(shù)制造芯片。因?yàn)槌墒旃に囈呀?jīng)足夠好,且經(jīng)過驗(yàn)證,并且沒有太多驚喜,整個(gè)汽車芯片制造工作都是用成熟技術(shù)完成的。在追逐全新的更先進(jìn)的技術(shù)和工藝過程中,我們忘記了很多時(shí)候并不需要最新的制程節(jié)點(diǎn)?!?/p>
對(duì)于汽車、醫(yī)療、工業(yè)和數(shù)據(jù)中心應(yīng)用,這些考慮變得更加復(fù)雜。在這些應(yīng)用中,芯片成本急劇上升、對(duì)更長(zhǎng)壽命的需求、令人生畏的更換成本以及出現(xiàn)問題時(shí)的潛在責(zé)任掀起了一場(chǎng)風(fēng)暴。
“當(dāng)我們開始談?wù)撛谄噾?yīng)用中使用電子產(chǎn)品時(shí),更重要的是要確保此類故障不會(huì)發(fā)生。確保全面考慮了這些問題,確保汽車電子在更長(zhǎng)時(shí)間或很短時(shí)間內(nèi)都不會(huì)出現(xiàn)問題,” Hassan表示。“此外,這意味著在設(shè)計(jì)方面需要更嚴(yán)謹(jǐn)?shù)陌踩雷o(hù)。”
與此同時(shí),隨著從汽車、機(jī)器人、無人機(jī)等應(yīng)用場(chǎng)景的自主性越來越高,可靠性已成為重中之重。
安全問題
與可靠性密切相關(guān)的是安全性,尤其是在汽車、醫(yī)療、工業(yè)和軍用/航空應(yīng)用方面。
Vtool項(xiàng)目經(jīng)理Olivera Stojanovic 回憶稱,在一次與安全相關(guān)的會(huì)議上,最終得出的結(jié)論是,若黑客可以在車輛行駛過程中控制汽車駕駛,那么security(面對(duì)惡意操作的安全)可能比safety(面對(duì)非惡意操作的安全)更重要。
Mijatovic指出,當(dāng)很少有設(shè)備連接到互聯(lián)網(wǎng)時(shí),這并非什么大問題。“這不僅是我們的個(gè)人電腦和手機(jī),還有冰箱、微波爐和暖氣。我們把所有設(shè)備都連接入網(wǎng)。”
越來越多的設(shè)備聯(lián)網(wǎng)將增加設(shè)備的復(fù)雜性,這反過來又需要更多的驗(yàn)證和更好的兼容性。
“從設(shè)計(jì)驗(yàn)證的角度來看,可以將提出的每個(gè)附加要求都視為規(guī)范中的附加層,”Mijatovic表示?!耙?guī)范并不意味著設(shè)備必須執(zhí)行規(guī)范中的功能,而是需要保證設(shè)備更可靠、準(zhǔn)確和安全地運(yùn)行。所有這些都可以定義為功能,最終也將作為功能實(shí)現(xiàn)。可使用不易出錯(cuò)或不易被黑客入侵的架構(gòu),并進(jìn)行安全檢查。最后,這也適用于協(xié)議,以及從一開始就考慮到的安全性或可靠性概念?!?/p>
持續(xù)監(jiān)測(cè)
這些可靠性問題不僅限于汽車領(lǐng)域。“我們已經(jīng)開始看到,對(duì)于其他應(yīng)用,可靠性設(shè)計(jì)和可靠性驗(yàn)證也變得越來越重要,”Hassan表示。“我們已經(jīng)看到許多EDA供應(yīng)商與Compact Model Coalition等組織合作,從電路設(shè)計(jì)所需的仿真和建模角度解決這種可靠性問題。”
Compact Model Coalition開發(fā)了一個(gè)用于老化和仿真的標(biāo)準(zhǔn)接口,稱為開放模型接口,為代工廠或任何設(shè)計(jì)公司的各個(gè)團(tuán)隊(duì)創(chuàng)建了一種方法來集成老化模型以處理機(jī)械退化等影響、熱載流子注入(HCI)等機(jī)制或該接口內(nèi)的負(fù)偏置溫度不穩(wěn)定性 (NBTI)。它還能夠使用EDA工具運(yùn)行仿真,并在5或10年后或在該產(chǎn)品的預(yù)期使用壽命內(nèi)捕獲芯片運(yùn)行狀態(tài)。
“這項(xiàng)工作旨在是通過運(yùn)行這種分析,設(shè)計(jì)人員將不需要過度設(shè)計(jì),因?yàn)橐呀?jīng)有了這種老化仿真,” Hassan表示?!艾F(xiàn)在他們可以看到并預(yù)測(cè)其設(shè)計(jì)在一定年限后的狀態(tài),并且可以將其設(shè)計(jì)推向極限以獲得性能——但不會(huì)留有裕量。當(dāng)他們開始使用時(shí),實(shí)際上可以在其電路和設(shè)計(jì)中添加一些補(bǔ)償技術(shù)。”
使用的一些技術(shù)包括創(chuàng)建片上監(jiān)控器和傳感器,以檢測(cè)操作期間設(shè)備性能的任何下降。通過這種感應(yīng),可以應(yīng)用補(bǔ)償來適應(yīng)參數(shù)退化,從而避免設(shè)計(jì)的整體性能退化。
額外的監(jiān)控器可能會(huì)增加設(shè)備和后續(xù)產(chǎn)品的面積,并消耗額外的功率或影響性能。但在某些情況下,擁有此類監(jiān)控器和補(bǔ)償技術(shù)可以確保在不造成傷害或服務(wù)中斷的情況下采取糾正措施。
老化和應(yīng)力
雖然老化和各種類型的應(yīng)力(機(jī)械、電氣、熱)是不可避免的,但能夠預(yù)測(cè)這些影響會(huì)對(duì)設(shè)備執(zhí)行規(guī)范的時(shí)間產(chǎn)生重大影響。預(yù)測(cè)影響的關(guān)鍵要素之一是了解芯片的使用環(huán)境。
“對(duì)于分析的探索源于汽車等傳統(tǒng)領(lǐng)域,例如如何對(duì)應(yīng)力環(huán)境進(jìn)行建模,如何讓設(shè)計(jì)工程師有信心確保部件在未來15年內(nèi)都能正常工作?!盋adence數(shù)字與簽核小組高級(jí)產(chǎn)品管理總監(jiān)Brandon Bautz表示?!捌噾?yīng)用要求設(shè)備能夠運(yùn)行10年,但只消耗這么多電力,否則我的電動(dòng)汽車不會(huì)走那么遠(yuǎn)。部件的可靠性和性能之間需要平衡。如何獲得更準(zhǔn)確的分析,以便可以更清楚地了解芯片性能與可靠性?從數(shù)字角度進(jìn)行的老化分析已經(jīng)有一段時(shí)間了,但分析結(jié)果相對(duì)悲觀。但考慮到10年前,甚至5年前擁有的工具,這種分析方法確實(shí)是需要的?!?/p>
然而,鑒于汽車行業(yè)對(duì)硅的依賴程度如此之高,出于成本原因,許多較新的領(lǐng)域也在尋求高可靠性?!澳梢允剐酒浅?煽浚赡軣o法按照需要的方式運(yùn)行?!?Bautz表示?!坝捎谛酒旧淼膹?fù)雜性,成本、性能、面積和風(fēng)險(xiǎn)的權(quán)衡變得越來越激烈。因此,需要進(jìn)行的分析類型更加復(fù)雜。保護(hù)帶和確??煽渴呛玫?,但根據(jù)我們所做的一些研究,以及我們?cè)诒碚骱头治鏊惴ㄖ兴龅母倪M(jìn),已經(jīng)展示了客戶使用這些較舊的方法所擁有的利潤(rùn)率。通過更準(zhǔn)確的分析,設(shè)計(jì)團(tuán)隊(duì)將能夠平衡可靠性和性能?!?/p>
這為更多的全面分析打開了大門,反過來又會(huì)對(duì)可靠性產(chǎn)生重大影響。
“從了解過去二十年的工作方式開始,我們認(rèn)識(shí)到10年前有限的計(jì)算能力無法真正捕捉到問題的真正本質(zhì)。在這種情況下,我們指的是老化,以及影響老化的應(yīng)力依賴性,”Bautz稱?!巴ㄟ^在數(shù)字分析中將兩個(gè)部分放在一起,表征過程可以在單元級(jí)別捕獲設(shè)備性能。然后查看設(shè)計(jì)級(jí)別,并在設(shè)計(jì)的上下文中觀察特定的元件和設(shè)備性能。將特征與時(shí)序分析相結(jié)合,為設(shè)計(jì)人員提供準(zhǔn)確度,更具體地說,讓設(shè)計(jì)人員深入了解他們的電路在整體設(shè)計(jì)環(huán)境中的工作方式。那么將電路置于設(shè)計(jì)環(huán)境中,便可以分析設(shè)備的實(shí)際應(yīng)力。因此,我們可以更準(zhǔn)確地分析老化對(duì)設(shè)備的影響,并了解它如何影響設(shè)備的整體壽命?!?/p>
模擬可靠性問題
這僅適用于數(shù)字設(shè)計(jì),模擬設(shè)計(jì)面臨著更多的自身挑戰(zhàn)。
如今,幾乎所有的芯片都包含模擬電路?!凹词乖趽碛袛?shù)百萬個(gè)門級(jí)的系統(tǒng)中,仍然存在一定數(shù)量的模擬電路,而且這個(gè)數(shù)量還在增加。”Cadence定制IC和PCB集團(tuán)產(chǎn)品管理總監(jiān)Jay Madiraju表示。“模擬設(shè)計(jì)團(tuán)隊(duì)關(guān)心的不僅僅是功能,他們?cè)O(shè)計(jì)的模擬組件和模塊將與龐大的數(shù)字邏輯電路相連接。他們想預(yù)先知道設(shè)計(jì)是否可靠?!?/p>
可靠性在模擬方面具有多重含義?!爱?dāng)您查看經(jīng)典浴缸曲線時(shí),您認(rèn)為什么時(shí)候產(chǎn)品才算是可靠的?可靠性的概念實(shí)際上意味著什么?這需要看模擬器件隨著時(shí)間的推移是否能夠運(yùn)作良好,”Madiraju表示?!斑@絕對(duì)是模擬人關(guān)心的問題。那么,隨著時(shí)間的推移,電路如何發(fā)揮作用?從多年經(jīng)驗(yàn)來看,設(shè)備故障將會(huì)變得越來越多,越來越不易于使用。但哪些地方損壞了?就載流子遷移率、閾值電壓和其他器件特性而言,這是整個(gè)電路按其應(yīng)有的方式運(yùn)行的基礎(chǔ)。它是如何隨著時(shí)間的推移而退化的,如何在退化之前預(yù)測(cè)?”
雖然老化技術(shù)的仿真已經(jīng)發(fā)展了幾十年,但其任務(wù)配置文件在過去幾年中才得到了改進(jìn)。
“在任務(wù)配置文件之前,工程團(tuán)隊(duì)仿真了最壞的情況,”他介紹?!啊@將是最糟糕的情況。該芯片將用于汽車領(lǐng)域。我們將假設(shè)這輛車將永遠(yuǎn)在120°的天氣里。如何仿真這種極端情況?’你必須通過假設(shè)這些極端惡劣情況來保障設(shè)備可靠性,但其意外后果是過度設(shè)計(jì)、過度裕量和保護(hù)帶。設(shè)計(jì)人員的設(shè)計(jì)理念相當(dāng)保守,全面考慮性能會(huì)受到的影響——性能來自不同方面,比如速度、時(shí)序和功率泄漏,以及芯片應(yīng)該如何表現(xiàn)的所有不同方面。任務(wù)配置文件有助于解決這個(gè)問題,因此可以定義不同的條件,包括溫度、電壓和其他隨時(shí)間變化的條件。你可以說有時(shí)候這些芯片有不同的應(yīng)力模式,或者在這種操作下,比如在進(jìn)行校準(zhǔn)過程時(shí),它會(huì)承受多大的應(yīng)力。應(yīng)力會(huì)導(dǎo)致退化。不同模式下也不盡相同?!?/p>
另一方面是制造可靠性,在模擬領(lǐng)域中,有幾個(gè)因素將會(huì)影響可靠性。“一個(gè)是時(shí)間的退化。另一個(gè)是在制造過程中發(fā)生的未通過測(cè)試的缺陷,例如芯片已經(jīng)完工且在將其發(fā)布給原始設(shè)備制造商之前已經(jīng)完成了初始測(cè)試。例如,在汽車領(lǐng)域,一些芯片通過了這些測(cè)試并交付給客戶,汽車OEM會(huì)面臨這些問題??煽啃詥栴}將是業(yè)界重點(diǎn)關(guān)注的問題。”他解釋。
這就是模擬故障仿真的用武之地。它類似于數(shù)字端的DFT,在芯片流片之前的驗(yàn)證過程注入故障?!拔覀兛梢钥吹侥男┕收蠜]有影響,哪些故障會(huì)影響輸出,哪些不會(huì)影響輸出,然后可以嘗試進(jìn)行覆蓋測(cè)量。我們正在通過各種測(cè)試來驗(yàn)證設(shè)計(jì)。當(dāng)注入故障時(shí),預(yù)期看到的是錯(cuò)誤的輸出。最終,所有這一切的目標(biāo)是看看在使用測(cè)試集來運(yùn)行電路時(shí),是否捕捉到了需要的一切現(xiàn)象,以便當(dāng)芯片退化時(shí)客戶不會(huì)發(fā)現(xiàn)錯(cuò)誤?” Madiraju說。
電熱效應(yīng)是模擬領(lǐng)域中另一個(gè)日益重要影響因素,而自熱模型中缺少的是熱量對(duì)相鄰或附近設(shè)備的影響。這需要電熱模擬仿真。
“以前,工程團(tuán)隊(duì)只會(huì)進(jìn)行熱模擬,測(cè)量傳播效果,然后他們會(huì)根據(jù)對(duì)功率的影響返回相應(yīng)信息至模擬電路,這是電氣仿真、電路仿真和熱之間單向流動(dòng)的一部分。”他說?!艾F(xiàn)在,這對(duì)于先進(jìn)芯片和高壓設(shè)備來說顯然是不夠的,當(dāng)然還有汽車領(lǐng)域的那些芯片,以及承受高壓條件的工業(yè)芯片。亟需一種綜合方法,使這種反饋效應(yīng)在單個(gè)仿真中建模。”
可靠性和內(nèi)存
內(nèi)存對(duì)可靠性的影響越來越大,因?yàn)閮?nèi)存選擇會(huì)影響從功率到面積的所有性能參數(shù)。這在 DRAM中尤為明顯,隨著時(shí)間推移,選擇高帶寬內(nèi)存或GDDR會(huì)對(duì)內(nèi)存在其他組件環(huán)境中的狀態(tài)產(chǎn)生重大影響。
“與DDR、GDDR或LPDDR相比,HBM設(shè)備的功耗將更低,需要處理的物理接口更少?!盨ynopsys內(nèi)存接口IP產(chǎn)品營(yíng)銷經(jīng)理Brett Murdock表示?!叭绾卧赟oC上物理實(shí)現(xiàn)它們是不受控制的。你想做什么,就可以做什么。你可以將一個(gè)完整的線性PHY放在芯片的一側(cè),可以環(huán)繞在角落,也可以將它折疊起來。有無數(shù)種方法可以實(shí)現(xiàn)該物理接口。但是使用 HBM,則需要放置HBM立方體,而JEDEC已經(jīng)準(zhǔn)確定義了該立方體上的凸點(diǎn)地圖是什么樣子。這意味著雖然就放置凸點(diǎn)的位置而言,靈活性可能較低,但它能夠帶來更好的可預(yù)測(cè)性和可靠性。中介層以及如何將其連接在一起有多種不同的選擇,但歸根結(jié)底,如果選擇GDDR、LPDDR、DDR,則可以構(gòu)建數(shù)百萬種不同的電路板,以數(shù)百萬種不同的方式將其連接起來,導(dǎo)致數(shù)百萬種不同的實(shí)現(xiàn)方式,以及數(shù)百萬種不同的錯(cuò)誤結(jié)果。而對(duì)于HBM,放入PHY,放入設(shè)備,并且如何在這兩者之間放置中介層沒有太多可變性。SoC和HBM設(shè)備之間會(huì)有最小間距規(guī)則?!?/p>
在可能的情況下,重復(fù)過去有效的方法可以大大確保它在新設(shè)計(jì)中有效?!爸貜?fù)有助于提高可靠性,” Murdock認(rèn)為?!拔覀?yōu)槊總€(gè)客戶做同樣的事情,或幾乎同樣的事情,這一事實(shí)意味著我們?cè)絹碓接薪?jīng)驗(yàn)。這是經(jīng)過驗(yàn)證的方案?!?/p>
偏差
偏差是另一個(gè)影響可靠性的因素,因此了解其對(duì)先進(jìn)節(jié)點(diǎn)和先進(jìn)封裝的影響尤為重要。造成偏差的原因有很多,從材料中的污染物和CMP的剩余顆粒,到封裝過程中的芯片移位和光刻技術(shù)的不一致性。芯片在什么時(shí)候會(huì)產(chǎn)生缺陷,以及如何在設(shè)計(jì)階段解決這些問題仍然是一個(gè)挑戰(zhàn)。
“設(shè)計(jì)團(tuán)隊(duì)意識(shí)到需要對(duì)設(shè)計(jì)中的偏差采取解決措施,”西門子EDA AMS驗(yàn)證產(chǎn)品PLM 軟件負(fù)責(zé)人Sathishkumar Balasubramanian表示?!叭藗儑@這個(gè)談?wù)摬煌母拍?,包括穩(wěn)健性和可靠性。歸根結(jié)底,這些都指向同一目標(biāo),即客戶希望設(shè)備能夠在投入最終產(chǎn)品的任何地方工作,且能夠在給定的合理時(shí)間表內(nèi)工作更長(zhǎng)時(shí)間。”
Balasubramanian表示,偏差非常重要,以至于業(yè)界開始將偏差作為高sigma要求包含在內(nèi),從庫(kù)組件的設(shè)計(jì)流程早期開始,將其作為流程的一部分。“他們旨在確保組件堅(jiān)固耐用。例如,在標(biāo)準(zhǔn)庫(kù)中,對(duì)于給定的標(biāo)準(zhǔn)單元庫(kù)和特定工藝,它滿足所有不同的 PVT,范圍更廣,并且仍然滿足3到7 sigma要求?!?/p>
總結(jié)
將所有這些部分放在設(shè)計(jì)到制造流程的最左側(cè)是一項(xiàng)復(fù)雜的工作。實(shí)際上,過去可以在制造中修復(fù)的問題已經(jīng)越來越難以完成。如今,必須在更左側(cè)考慮潛在問題,這意味著設(shè)計(jì)團(tuán)隊(duì)現(xiàn)在正在努力解決通常為工藝工程師保留的概念,而工藝工程師正在將數(shù)據(jù)反饋給EDA供應(yīng)商,從而對(duì)工具進(jìn)行調(diào)整,或增加新功能。
當(dāng)前,可靠性仍是一個(gè)普遍性挑戰(zhàn),從最初設(shè)計(jì)到現(xiàn)場(chǎng)產(chǎn)品監(jiān)控,整個(gè)供應(yīng)鏈都需要為保障芯片可靠性盡職盡責(zé)。