2024年7月4日,MediaTek(聯發科技)與快手共同宣布,推出高效端側視頻生成技術,共同探索并推進生成式AI技術的革新。該技術是對2024 世界移動通信大會(MWC 2024)上初次亮相的視頻生成技術的延續與提升,結合快手的AI模型I2V(image to video)Adapter與MediaTek天璣9300、天璣8300移動平臺強勁的AI算力,在端側實現由靜態圖像生成動態視頻的創新體驗。通過這項技術,用戶只需在設備上選取圖片,應用即可智能地識別照片中的人物和場景,生成自然流暢的視頻佳作,顯著提升了視頻制作的創意表現和效率。
雙方的合作充分借助MediaTek天璣移動平臺先進的AI技術,攜手攻克了模型底層適配優化及上層開發的系列技術及工程難題,為用戶帶來讓人耳目一新的端側生成式AI體驗,將改變用戶創作和分享內容的方式。
I2V-Adapter是快手AI團隊提出的一種適用于基于Stable Diffusion文生視頻擴散模型的輕量級適配模塊,作為即插即用的擴散模型輕量級模塊,專門用于由圖像到視頻的生成任務。該模塊能夠在不需要改變現有文本到視頻生成(T2V)模型原始結構和預訓練參數的情況下,將靜態圖像轉換成動態視頻。此外,其解耦設計使得該方案能夠與DreamBooth、LoRa、ControlNet等模塊無縫兼容,實現客制化和可控的圖像到視頻生成。
MediaTek天璣9300和天璣8300移動平臺集成了先進的NPU(神經網絡處理單元),為生成式AI而設計,提供強勁算力和能效。在圖像生成視頻的應用中,NPU可顯著加速AI模型的運算,結合與快手I2V Adapter模型的適配和優化,實現更快的視頻生成速度,同時兼具低功耗特性。天璣移動平臺可結合深度學習和實時渲染技術,對圖像內容進行深度分析,捕捉關鍵幀,并據此生成流暢、逼真的視頻畫面效果。同時,MediaTek的實時渲染技術可確保視頻在各類設備上均能帶來高畫質表現。
全球短視頻市場正迎來高速增長期,行業對創新、高效的視頻生成技術的需求日益迫切。MediaTek與快手基于對市場需求和趨勢的深刻洞察,為廣大用戶帶來更加先進、便捷的視頻生成工具,共同推動短視頻生態的繁榮發展。未來,雙方將持續深化合作,推動生成式AI技術的進一步發展,滿足市場不斷變化的需求,共同開創和探索短視頻技術的新紀元。