國際最新AI基準(zhǔn)測試SPEC ML首提模算效率,填補大模型計算效率評測空白
北京2025年1月8日 /美通社/ -- 日前,國際標(biāo)準(zhǔn)性能評估組織SPEC公布了AI基準(zhǔn)測試SPEC ML最新進(jìn)展,該基準(zhǔn)已完成面向不同AI負(fù)載下的軟硬件系統(tǒng)的性能、擴(kuò)展性和模算效率三大關(guān)鍵指標(biāo)構(gòu)建。其中模算效率首次納入SPEC ML基準(zhǔn)評測,將填補大模型計算效率評測基準(zhǔn)領(lǐng)域的研究空白。
隨著人工智能更加廣泛的應(yīng)用,為AI/ML建立強大的基準(zhǔn)測試比以往任何時候都更加重要。SPEC ML基準(zhǔn)委員會主席Arthur Kang表示,統(tǒng)一的基準(zhǔn)評測方法不僅有助于簡化模型比較,還將為注重效率、準(zhǔn)確性和可持續(xù)性的創(chuàng)新鋪平道路。目前AMD、英特爾、NVIDIA、浪潮信息、NetApp和Red Hat等科技企業(yè)正在共同參與開發(fā) SPEC ML基準(zhǔn)測試,SPEC呼吁更多伙伴參與到項目中,通過產(chǎn)業(yè)上下游的合作,為大模型的開發(fā)應(yīng)用樹立新的性能評估標(biāo)桿,為AI技術(shù)的高效、綠色、可持續(xù)發(fā)展注入新動力,共創(chuàng)更加繁榮與可持續(xù)的AI新時代。
近年來,隨著預(yù)訓(xùn)練模型的快速發(fā)展,人工智能領(lǐng)域迎來了顯著的技術(shù)進(jìn)步。這些模型通過大規(guī)模數(shù)據(jù)集的預(yù)訓(xùn)練,并結(jié)合微調(diào)技術(shù)來適應(yīng)不同任務(wù),在自然語言處理和計算機(jī)視覺等多個領(lǐng)域取得了顯著成效。然而,隨著模型結(jié)構(gòu)和參數(shù)量的日益復(fù)雜,其在不同軟件框架和硬件平臺上的表現(xiàn)存在差異,如何全面、公正地比較模型、算力系統(tǒng)的綜合性能變得愈加困難。為了在不增加大規(guī)模計算資源投入的情況下提升模型的準(zhǔn)確性和效率,建立統(tǒng)一的基準(zhǔn)測試體系已成為AI領(lǐng)域的迫切需求,這不僅可以幫助開發(fā)者選擇最適合的技術(shù)方案,還能為優(yōu)化計算資源利用、降低碳排放提供科學(xué)的參考依據(jù)。
但當(dāng)前業(yè)界在模型、框架和硬件協(xié)同效能評估方面存在顯著空白,缺乏統(tǒng)一的評估基準(zhǔn),評估過程難以量化,導(dǎo)致開發(fā)者難以做出最優(yōu)的技術(shù)選擇。尤其是在大型模型的訓(xùn)練和推理過程中,計算資源和能源的消耗成為行業(yè)面臨的重要挑戰(zhàn)。如何在滿足性能需求的同時優(yōu)化計算資源的利用,降低能源消耗,是當(dāng)前研究和應(yīng)用的關(guān)鍵所在。為此,SPEC ML首次提出將模算效率納入基準(zhǔn)評測,模型本身精度越高、在對應(yīng)軟件上對硬件性能利用率越高、推理及訓(xùn)練所需算力越小,模算效率越高。模算效率的評價對象涵蓋了AI大模型、運行框架和硬件算力平臺的一整套軟硬件系統(tǒng)。
模算效率的首次提出,將增強不同預(yù)訓(xùn)練模型、軟件框架和硬件系統(tǒng)之間的可比性,促進(jìn)模型與硬件的協(xié)同優(yōu)化,推動AI計算系統(tǒng)的能效提升和技術(shù)創(chuàng)新:
- 提升可比性與公正性:統(tǒng)一的基準(zhǔn)測試標(biāo)準(zhǔn)能夠提供公平的評估平臺,幫助開發(fā)者、研究人員和企業(yè)通過可量化的指標(biāo)對不同模型、框架和硬件平臺進(jìn)行公正比較。
- 促進(jìn)模型與硬件的協(xié)同優(yōu)化:通過標(biāo)準(zhǔn)化的基準(zhǔn)測試,不僅能提高模型的效能,還能指導(dǎo)硬件平臺與軟件框架的協(xié)同發(fā)展。通過合理配置計算資源,可以在保證高效性和準(zhǔn)確性的前提下,減少不必要的計算開銷,從而降低成本和碳排放。
- 推動綠色發(fā)展與可持續(xù)性:隨著模型規(guī)模和計算需求的增長,能源消耗和碳排放問題日益嚴(yán)峻。標(biāo)準(zhǔn)化的基準(zhǔn)測試能夠幫助行業(yè)識別效率低下的環(huán)節(jié),促進(jìn)綠色計算技術(shù)的發(fā)展,推動AI技術(shù)朝著更可持續(xù)的方向發(fā)展。
- 激發(fā)創(chuàng)新與優(yōu)化:明確的評估標(biāo)準(zhǔn)為開發(fā)者提供了方向,能夠幫助開發(fā)者識別現(xiàn)有技術(shù)的瓶頸,進(jìn)一步推動技術(shù)突破和創(chuàng)新。通過標(biāo)準(zhǔn)化的測試,軟硬件的開發(fā)中可以更加專注于如何提升模型的效能和計算效率,而不是陷入復(fù)雜且不一致的評估過程中。
【免責(zé)聲明】本文僅代表作者個人觀點,與云財經(jīng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,云財經(jīng)對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
新聞標(biāo)題 | 時間 | 消息來源 | 新聞熱度 |
---|---|---|---|
證監(jiān)會主席吳清會見盧森堡財政大臣羅特 | 01-10 20:23 | 云財經(jīng) |
|
中央組織部從代中央管理黨費中劃撥5000萬元用于西藏抗震救災(zāi) | 01-09 15:54 | 云財經(jīng) |
|
國科軍工公告 全資子公司江西先鋒軍工機(jī)械有限公司與九江國科遠(yuǎn)大機(jī)電有限公司收到與某單位簽署的兩型主用彈藥等彈藥產(chǎn)品2025年年度訂貨合同 | 01-09 15:39 | 云財經(jīng) |
|
智能三合一電池充電器Ostation X亮相CES 2025 | 01-08 13:12 | 商業(yè)新聞 |
|
證監(jiān)會發(fā)布關(guān)于蜜雪冰城股份有限公司首次公開發(fā)行境外上市外資股(H股)及境內(nèi)未上市股份“全流通”的備案通知書:公司擬發(fā)行不超過73,058,823股境外上市普通股 | 01-07 19:31 | 云財經(jīng) |
|
宿遷聯(lián)盛在蘭州成立新材料公司 | 01-03 09:52 | 云財經(jīng) |
|