《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > ESL綜合解決方案提高DSP的設計效率 推動ASICS與FPGA器件發展

ESL綜合解決方案提高DSP的設計效率 推動ASICS與FPGA器件發展

2012-07-31
關鍵詞: FPGA ESL DSP ASICS Virtex-4

  電子產品中數字信號處理(DSP)芯片的使用率正急劇增加。現場可編程門陣列(FPGA)可支持數百萬個門,并以DSP為中心,這種特性使其性能比標準的DSP芯片有了大幅提升。此外,FPGA還可進行中小型批量生產,能支持非常強大的原型設計與驗證技術,以實現DSP算法的實時仿真。但為FPGA和ASIC創建可移植性算法IP也面臨著諸多挑戰與要求。

  本文將介紹如何通過ESL綜合技術大幅縮短在FPGA或ASIC上實現算法所需的時間,并簡化相關工作。

  FPGA和ASIC之間RTL移植所面臨的挑戰

  盡管RTL支持邏輯級的移植性,但卻不支持架構層移植。如果將同一RTL在不同的目標器件上實現,會導致結果不夠理想;在不同目標器件中,綜合結果可能在功能上正確,但卻根本沒有優化。

  如何選擇算法架構取決于一個基本問題,即滿足算法的采樣率和吞吐能力要求,需要進行多少流水線、并行和串行優化處理。此外,FIR、FFT、正弦、余弦、除法等基本的DSP功能根據目標技術的不同,有著不同的優化實現要求。比如,FIR濾波器的直接形式與轉置形式(transposed form)就是一個很好的例子,一種適用

 

于特定的FPGA器件,而另一種則更適用于ASIC技術。

 

  根據FPGA和ASIC的不同要求,我們往往需要不同的架構。眾所周知,FPGA器件傾向于以寄存器為中心,而許多ASIC到FPGA移植指南也建議增加流水線設計,對所有端口進行寄存,并將組合邏輯分解為較小的部分。這樣的設計在ASIC上實現就會增加面積,但這是滿足FPGA時序要求所必需的。

  如果以ASIC為目標,我們往往需要完全相反的做法。這時我們建議將寄存器最小化,以盡可能減小占用面積與功耗。我們可以采用時分復用和資源共享的辦法來提高時鐘速度,從而最小化乘法器及其他浪費資源的操作。消費類及無線產品市場領域中的近期設計趨勢就是仔細平衡上述做法的結果。

  ASIC RTL和FPGA RTL之間不可避免的差別之一在于存儲器的使用。就FPGA而言,器件內置了標準存儲器。根據FPGA工具流程和廠商的不同,我們需要特定的編碼風格來描述存儲陣列和存儲器。高質量FPGA綜合工具會自動將RTL代碼映射到存儲器上實現。不過,在ASIC領域中,IP和制造庫廠商(fab library vendor)的存儲器選項多種多樣,用戶要根據具體的配置選擇和編輯存儲器,并在RTL設計中進行例化。

  許多文章和資料都介紹了在 FPGA 和 ASIC 之間轉移 IP 的編碼風格及移植技術問題。在不同器件類型之間移植實施方案,需要進行大量的編碼與驗證工作,并擁有精湛的的專業技術。

  如果首先用FPGA進行原型設計,再移植為ASIC設計,那么還要面臨更多的挑戰。在需要實時刺激和實際速度驗證的情況下,就會出現上述問題。為了滿足上述要求,我們應當保證仿真模型之間的位和采樣準確度,特別是FPGA實現和ASIC模型不能出問題。這要求我們做大量工作,尤其是實現方案不同或經常變化時更應如此。此外,我們還必須手動修改、比較和調試測試工具。

  ESL 綜合解決方案

  ESL 綜合解決方案能提供強大的性,有助于解決上述諸多問題。

  •   使用電子系統層級 (ESL) 模型,支持高級架構與硬件抽象;
  •   根據用戶定義的采樣率進行自動優化;
  •   用戶選擇目標技術;
  •   為多速率設計提供原生支持。

從統一 ESL 模型快速實現設計方案

圖1  從統一 ESL 模型快速實現設計方案

  利用上述特性,DSP 綜合引擎可根據用戶定義的約束條件在了解目標的基礎上進行整個系統優化,對不同的 RTL進行綜合。這些為優化架構和特定編碼風格而定的RTL 隨后可進入標準化的邏輯綜合流程。

  利用ESL綜合技術,我們可以在一個高度抽象的層面完成設計工作,這不僅提高了可移植性,縮短了開發時間,而且還提高了工程設計的工作效率。除了保持RTL級的IP之外,我們還能在算法模型層保持IP,從而提高可移植性以及算法開發人員的工作效率。

  如圖1所示,DSP綜合技術使用戶能通過統一的算法模型快速生成并實現多種不同實施方案。FPGA可使用完全并行的流水線架構,也可像ASIC一樣采用占用面積更小的串聯架構。此外,不同實施方案能自動保持位和采樣的準確度,并通過標準化的RTL仿真工具實現完整的驗證路徑。與此形成對比的是,參數化的原理圖輸入法,和那些需要用戶在了解面積、延遲特性之前就確定具體架構的RTL方法,其移植到新的實施目標時往往需要進行大量的修改。

表1 針對Virtex-4 FPGA的自動折疊優化綜合對濾波器吞吐能力和硬件共享的影響

針對Virtex-4 FPGA的自動折疊優化綜合對濾波器吞吐能力和硬件共享的影響

  用DSP 綜合技術進行算法實施

  支持DSP綜合和自動優化架構的工具(如 Synplicity的Synplify DSP工具)能提供設計優勢,從而有助于在 FPGA和ASIC上順利實現設計。在DSP綜合步驟之前,用戶不必定義目標器件并做出架構優化選擇。DSP綜合引擎隨后可從算法模型開始綜合RTL優化實施方案。

 

  我們特別要注意時序優化(Retiming)和折疊(Folding)選項。時序優化選項使我們能修改架構以使用流水線形式和其他技術來達到理想的性能目標,但會造成輸出時延。折疊選項使設計方案能共享硬件,但會降低吞吐能力(即要在資源利用率和最大采樣率之間進行平衡取舍)。

表2 串行化和硬件共享使65-tap FIR濾波器的實施方案占用面積縮減了一半

串行化和硬件共享使65-tap FIR濾波器的實施方案占用面積縮減了一半

  •   表示面積單位的量度為2.8平方納米,這大約是雙輸入NAND門的大小。
  •   乘法器用邏輯(門)實施。
  •   提取的存儲器為雙端口。

  架構實現

  自動DSP綜合引擎的優勢在于,它能快速實現多種架構和目標技術。這種設計空間實現過程有助于顯著優化解決方案,特別是在我們需要考慮在多種 FPGA 和 ASIC技術上實現DSP算法時會特別有用。

  以下我們給出一個時序優化和折疊優化范例,看看這兩個選項如何在速度與占位面積間做

 

出重要的取舍。首先,我們在Virtex-4 FPGA中生成4個10 MHz 64-tap FIR濾波器:其中1個作為基準,另外3個采用不同的折疊因數(folding factors),用來在不同程度上縮減面積占用。我們用Synplify DSP RTL的邏輯綜合技術來生成結果如表1所示。

  表2中給出了對于相同設計的 ASIC 實現方案的類似分析數據。我們從中可以看出在采用90納米技術情況下,完全并行與完全串行兩種極端實施方案相對比的面積差值。

  我們從表2中可以明顯看出,在更低的采樣率且允許共享硬件的情況下,DSP綜合技術能自動縮減面積占用。此外,強大的ESL功能則能通過利用更高的時鐘頻率更方便地在各種技術上實現。同時,由于我們可在統一的算法模型基礎上開展工作,因此無須改變模型 或重新驗證模型。

  結論

  上述簡單 FIR 范例反映出,DSP 綜合技術有助于我們快速高效地根據相關性能與占用面積的準確仿真進行架構權衡。這樣,用戶就有了實現多種架構的可能性,其中包括定點設計考慮事項等重要實施細節,同時還能高效獲取有用的性價比數據。這樣,我們就能在高級算法基礎上實現最佳 FPGA 與 ASIC 實施方案,同時盡可能縮短設計時間。

  EDA 行業似乎正向著實現初期 ESL 設計優勢的方向發展,既要發揮針對硬件原型設計的集成式設計流程的優勢,又要充分利用發貨系統。

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 欧美怡春院 | 妞干网免费视频 | 日韩欧美一区二区三区视频 | 亚洲伦理影院 | 18女人免费毛片a级 18女人毛片水真多免费 | 欧美国产大片 | 国产精品自产拍在线观看 | 性欧美高清videofree | 性欧美极品 | 黄在线免费看 | 永久黄网站色视频免费 | 久久精品国产波多野结衣 | 欧美日韩一区二区综合 | 久久久青青草 | 正在播放亚洲一区 | 免费永久观看美女视频网站网址 | 国产色婷婷亚洲 | 亚洲第一区视频在线观看 | 最近的2019中文字幕4 | 毛片手机在线观看 | 天天插天天舔 | 成年片人免费www | 第一区免费在线观看 | 日韩三级在线观看 | 精品亚洲欧美中文字幕在线看 | 天堂成人在线观看 | 欧美成人手机在线视频 | 99久久精品免费 | 免费一区视频 | 午夜激情视频在线 | 国产一级视频久久 | 日韩欧美中文在线 | 亚洲欧洲在线视频 | 国产亚洲精品精品国产亚洲综合 | 岛国aⅴ | 欧美日韩一区不卡 | 亚洲日韩欧美一区二区在线 | 在线视频一区二区三区在线播放 | 国产免费不卡 | 性做久久久久久久免费看 | 欧美亚洲综合另类成人 |