日本一区二区三区播放,日韩性xxx,国产精品极品尤物在线观看,草莓视频一区二区三区

加速3.47倍!火山引擎助力AIGC突破性能瓶頸


【資料圖】

AIGC(AI-Generated Content 人工智能生成內容)一經推出火爆全網,各種畫風和產品形態頻頻出現且快速演進。以Stable Diffusion模型為例,一次完整的預訓練大約需要在128張A100計算卡上運行25天,用戶付費上百萬,高額的研發費用是用戶的痛點之一。同時,AIGC產品演進快速,對性能和資源提出更高要求。

火山引擎云服務,為此類問題提供了解決方案,推動AIGC產業的發展。火山引擎打造同時支持訓練加速與推理加速的自主研發高性能算子庫,在全面提升AI計算性能的基礎上,不斷追求節省顯存、簡單適配,同時支持多款GPU卡,為客戶帶來更多低成本、便捷的部署方案。

在推理場景下,基于Stable Diffusion模型的端到端推理速度達到66.14 it/s,是PyTorch推理速度的3.47倍,運行時GPU顯存占用量降低60%。在客戶AI視頻創作的AIGC推理業務實踐中,火山引擎高性能算子庫搭載客戶的推理模型幫助其推理性能提升一倍,GPU資源使用量減少一半,可為客戶節省50%成本。

在訓練場景下,使用該高性能算子庫可將上文Stable Diffusion模型在128張A100的訓練時間從25天減少到15天,訓練性能提升40%。同時,由于AIGC模型在訓練時占用GPU顯存容量非常大,未經優化時的模型只能運行在最高端的A100 80GB GPU卡上。火山引擎高性能算子庫通過大量消減中間操作,將運行時GPU顯存占用量降低50%,使得大多數模型可從A100遷移到成本更低的V100或A30等GPU卡上運行,擺脫特定計算卡的限制,而且不需要做額外的模型轉換工作。

以此,以AIGC場景為代表,無論是迭代速度,還是單次的訓練成本,都有了顯著的性能提升和成本節省。未來,火山引擎云服務將持續在機器學習、科學計算、圖形處理等領域深耕,不斷追求極致性能。(作者:宋齊鴻)

推薦DIY文章
win7旗艦版怎么降級到專業版 已有原版win7旗艦版ISO鏡像的話可以這樣做-焦點熱門
電腦登錄LOL英雄聯盟提示服務器連接異常的解決方法 重裝游戲也無法解決的話該怎么辦
Windows10如何打開IE臨時文件夾 如何查看本機IE臨時文件夾路徑?-環球觀速訊
怎么給共享的打印機加密 需要找到簡單文件共享選項并開啟
電腦中百度離線下載錯誤36000如何解決 希望本教程能夠幫助到所有有需要的朋友-天天微資訊
FlashFXP 的使用教程來了 使用FlashFXP的方法就在本文-每日速訊
精彩新聞

超前放送

主站蜘蛛池模板: 宜春市| 西贡区| 克拉玛依市| 内黄县| 阳春市| 五莲县| 滦平县| 随州市| 临漳县| 焉耆| 滦南县| 农安县| 合作市| 蒙城县| 泰来县| 荣成市| 班玛县| 灵川县| 赤城县| 汉寿县| 康定县| 确山县| 永年县| 宣化县| 南平市| 双流县| 紫云| 枣强县| 深泽县| 疏勒县| 长春市| 油尖旺区| 留坝县| 岳阳市| 通许县| 阜康市| 古田县| 滨州市| 昌江| 中宁县| 栖霞市|