圖片出處@華蓋創(chuàng)意
文丨學術研究今日頭條
當代測算的改革在非常大水平上是由計算機軟件和硬件配置的明顯發(fā)展促使的。伴隨著顛覆性創(chuàng)新的變緩和Dennard平均誤差的擴張,全球正向著專用型硬件配置發(fā)展趨勢,以達到指數級增長的測算要求。
殊不知,今日的芯片必須兩年的時間來設計,因而大大縮短芯片設計周期時間,使硬件配置融入迅速發(fā)展趨勢的深度學習行業(yè)是當今的一個發(fā)展趨向。
假如應用深度學習優(yōu)化算法替代人為因素設計工作中來試著設計芯片,另外其自身可以出示減少芯片設計周期時間的方式,進而在硬件配置和深度學習中間建立一個更為集成化的關聯來推動彼此之間的發(fā)展趨勢,那又會怎么樣呢?
近日,由GoogleAI的首席科學家Jeff Dean領導干部的精英團隊一同編寫了一份預印畢業(yè)論文,該畢業(yè)論文敘述了一種根據學習培訓的芯片設計方式。
她們將芯片放置視作增強學習(RL)難題,用RL策略來提升芯片放置的品質。與之前方式不一樣的是,該方式能夠從以往的工作經驗中學習培訓,并伴隨著時間的變化不斷完善。尤其是,當訓煉大量的芯片塊時,該方式更善于為此前未見過的芯片塊迅速轉化成提升的布局。
她們宣稱,該方式進行芯片設計的均值時間不上6個鐘頭,這比人們權威專家花幾個星期時間進行設計要快得多。
芯片布局整體規(guī)劃困境
在傳統式的 “布局走線” 每日任務中,芯片設計工作人員應用手機軟件來明確芯片電源電路在芯片中的布局,類似設計房屋建筑的平面設計圖。
電子計算機芯片被分為許多塊,每一塊全是一個獨立的控制模塊,如運行內存分系統、測算模塊或操縱邏輯系統。這種控制模塊可以用網表、電源電路部件和標準單元 (如 NAND、NOR 和 XOR 等邏輯門) 的圖型來敘述,全部這種部件全是根據輸電線聯接。
明確一塊芯片的布局是一個稱之為芯片布局整體規(guī)劃的全過程,它是芯片設計全過程中最繁雜、最用時的環(huán)節(jié)之一,牽涉到將網表放置在一個芯片蒙版 (2d 網格圖) 上,進而提高輸出功率、特性及其地區(qū) (PPA) 降到最低,另外遵循對相對密度和路由時延的限定。為了更好地尋找達到好幾個總體目標的最好布局,必須考慮到很多自變量。
雖然這些方面的科學研究早已開展了幾十年,可是人們權威專家依然必須花上幾個星期的時間來迭代更新,以轉化成達到各個方面設計規(guī)范的解決方法。這個問題的多元性源于網表圖的尺寸,這種圖的尺寸范疇從上百萬到數十億個連接點構成數千個群集,一般,評定總體目標指標值必須耗費數小時到一天的時間。
“大部分,在設計全過程中,你能應用一些設計專用工具來開展一些布局,但仍必須人力布局和走線權威專家同這種設計專用工具一起開展很反復多次的迭代更新,”Dean講到,“從你要想的設計到具體將其物理學布局到芯片上,并在總面積、輸出功率和輸電線長短上面有適度的限定,并且還要達到全部的設計人物角色或一切已經開展的生產制造全過程,這是一個幾個星期的全過程。而根據創(chuàng)建一個深度學習實體模型,能夠讓它學好玩特殊芯片的部件放置手機游戲?!?/p>
深層增強學習實體模型
科學研究工作人員設計了一個深層加強實體模型,該實體模型能夠試著各種各樣流程來查詢什么流程能夠產生更強的結果,這種流程并不是游戲中板上放置零件,只是科學研究怎樣在全部芯片中設計放置恰當的電源電路布局。
該實體模型能夠具體指導歷經增強學習訓煉的RL策略來提升芯片放置。其鍵入是芯片網表 (連接點種類和圖臨接信息內容)、要放置的當今連接點的ID,及其一些網表數據庫,如聯接數量、宏和標準單元群集。網表圖和當今連接點根據一個根據邊沿的圖神經網絡傳送,該神經元網絡是為編號鍵入情況而開發(fā)設計的,置入轉化成一部分放置的圖和備選連接點。
圖神經網絡轉化成的置入與數據庫置入串連在一起,產生對策略和使用價值互聯網的鍵入
隨后將邊沿、宏和網表數據庫置入相互連接,以產生單獨情況置入,并將其傳送給前饋控制神經元網絡。前饋控制互聯網的輸出是一種學習培訓表明,它捕捉有效的特點并做為策略和使用價值互聯網的鍵入。策略互聯網在全部很有可能的網格圖模塊上轉化成一個概率分布函數,當今連接點能夠放置在這種網格圖模塊上。
在每一次訓煉的迭代更新中,宏均依據RL策略先后放置,隨后根據力導向性方式放置標準單元簇,該方式將電源電路模型為一個彈黃系統軟件,以較大 水平降低輸電線長短。RL訓煉的具體指導標準是應用類似線長(即自感電動勢線長,HPWL)的加權平均和類似時延(路由器資源耗費的占比),為每一個推行RL策略的芯片部位測算一個迅速但類似的獎賞數據信號放置的網表。
在每一次訓煉迭代更新期內,一次將一個宏放置一次策略,并根據強制性定項方式放置標準單元簇。獎賞是依據類似輸電線長短和時延的權重計算組合計算得到的。
結合實際,RL策略從空的芯片逐漸,按序先后放置部件,直至它進行網格圖截止,而且直至最終代理商光波長 (與輸出功率和特性有關) 的負權重計算總數和時延為零,才得到獎賞。為了更好地具體指導代理商挑選先放置什么部件,部件按尺寸升序排列,最先放置很大的部件,減少了之后沒有適合部位的概率。
訓煉 RL 策略必須建立一個包括10,000 個芯片放置的數據,在其中鍵入是與給出放置有關的情況,標識是放置的獎賞 (即線長度時延)。科學研究工作人員最先挑選了五個不一樣的芯片網表,隨后運用AI優(yōu)化算法為每一個網表建立2000個不一樣的部位。
訓煉數據信息尺寸與調整特性
雖然此項工作中并不徹底是新奇的,它是根據Google技術工程師在3月份發(fā)布的一篇畢業(yè)論文中明確提出的一項技術性,但該工作中推動了此項技術性的發(fā)展趨勢,因為它代表著芯片上晶體三極管的放置能夠在非常大水平上完成自動化技術。一旦公布公布,Google科學研究工作人員的技術性能夠讓資金短缺的新成立公司開發(fā)設計出自身的芯片,用以人工智能技術和別的獨特主要用途。除此之外,它能夠協助減少芯片設計周期時間,使硬件配置能夠更好地融入迅速發(fā)展趨勢的科研。
科學研究工作人員表明,當她們在大量的芯片上訓煉架構時,可以加速訓煉全過程,并迅速地造成高品質的結果。事實上,她們宣稱與領跑的標準對比,它在生產制造中的Google偏微分控制部件 (TPUs)(一款Google訂制設計的人工智能技術加快芯片)上完成了好于領跑基準線的PPA。
科學研究工作人員匯總道:“與目前的重新開始提升每一個新芯片的部位方式不一樣,大家的工作中運用從放置之前的芯片中得到的專業(yè)知識,來使其伴隨著時間的變化越來越更強。除此之外,大家的方式能夠立即提升總體目標指標值、線長、相對密度和時延,而無須像別的方式那般界定這種作用的自然數。大家的方式不但使新的成本函數在可以用時便于融合,并且還使大家可以依據給出芯片塊的要求,比如,時鐘頻率重要或功能損耗受到限制,來衡量他們的相對性必要性?!?/p>
而在Reddit上,這則信息也引起了網民強烈反響。有網民說,當他見到這則信息,他感覺十分酷。由于放置數以億計的晶體三極管,使其能夠聯接并一切正常工作中是一項艱巨的任務,在其中布局和走線十分關鍵的,數據信號沿輸電線挪動必須花費時間,而布局總體目標是使輸電線長短最少,降低部件中間的等待的時間,這難以保證??墒且廊粫嬗幸恍╇y題,比如布線不適合,這就必須人力來處理。而降低設計芯片需要的時間,就可以設計大量的芯片來加速迭代更新速率。
也是有網民表明,它能夠協助設計工作人員輕輕松松設計用以神經元網絡、深度學習、深度神經網絡的芯片,加快AI的發(fā)展趨勢。
手機軟件與硬件配置的發(fā)展趨勢緊密聯系,深度神經網絡三巨頭Bengio、Hinton、LeCun就曾在AAAI 2交流會上一同討論將來深度神經網絡神經元網絡的市場前景,她們均表明用以加快神經元網絡訓煉和邏輯推理的新式硬件配置能夠轉化成更高的實體模型,也許有一天有可能使數十萬億神經遞質神經元網絡變成很有可能,而Google的迅速設計電子計算機芯片也是助推了其發(fā)展趨勢。