華納兄弟探索公司(WBD)是一家全球領先的媒體與娛樂公司,擁有豐富的內(nèi)容組合,涵蓋電視、電影和流媒體等多個領域。隨著用戶對個性化內(nèi)容的需求不斷增加,該公司決定通過改進其人工智能和機器學習(AI/ML)推理基礎設施來提升用戶體驗。在這一過程中,他們采用了 AWS Graviton 處理器和 Amazon SageMaker AI 實例,取得了顯著的成本節(jié)約和性能提升。
WBD 在全球范圍內(nèi)擁有超過1.25億用戶,其個性化推薦系統(tǒng)需要在實時環(huán)境中進行高效運行。為了應對日益增長的用戶需求和成本壓力,該公司在 AWS 的支持下,開始了向 Graviton 實例遷移的工作。通過這種方式,WBD 不僅降低了基礎設施的成本,還提升了推理的速度,平均節(jié)約達60%。在某些情況下,特別是在目錄排名模型中,成本甚至降低了88%。
在推理速度方面,WBD 也取得了顯著的成效。通過優(yōu)化后的基礎設施,P99延遲在不同模型中減少了7% 到60% 不等,XGBoost 模型的延遲減少幅度達到了60%。這種性能提升使得用戶能夠體驗到更快速、更精準的內(nèi)容推薦,從而增強了用戶的參與度和粘性。
WBD 的遷移過程非常順利,從初步測試到最終全面部署,僅用了一月時間。公司計劃繼續(xù)將更多的推薦系統(tǒng)遷移至 Graviton 實例,以進一步提高運營效率和降低成本。
劃重點:
?? 實現(xiàn)60% 的成本節(jié)約:WBD 通過遷移至 AWS Graviton 實例,顯著降低了其個性化推薦系統(tǒng)的運營成本。
? 推理速度提升:不同模型的 P99延遲減少了7% 到60%,為用戶提供了更快速的內(nèi)容推薦。
?? 順利的遷移過程:從初步測試到全面部署,僅用一個月的時間,確保了項目的高效執(zhí)行。

