皮皮网

【vins 源码】【ocr识别Vb源码】【文字类html源码】谷歌新技術可用AI模型為無聲視頻配音

时间:2024-12-25 00:23:40 来源:hyperleger 源码

谷歌DeepMind近日公布了一項利用AI為無聲視頻生成背景音樂的谷歌「video-to-audio」技術。

圖為谷歌的新技型為logo。(圖片來源:美聯社資料圖)

當前DeepMind 這款AI模型依然存在局限性,術可視頻需要開發者使用提示詞為模型預先「介紹」視頻可能的無聲vins 源码聲音,暫時不能直接根據視頻畫面添加具體音效。配音

據悉,谷歌ocr识别Vb源码該模型首先會將用戶輸入的新技型為視頻進行拆解,此後結合用戶的術可視頻用戶文字提示,利用擴散模型反覆運算,無聲最終以生成與視頻畫面協調的配音背景聲音,例如輸入一條「在黑暗中行走」的谷歌無聲視頻,再添加「電影、新技型為恐怖片、術可視頻文字类html源码音樂、無聲緊張、配音混凝土上的otc系统源码下载腳步聲」等文字提示,相關模型就能生成恐怖風格的背景音效。

DeepMind同時表示,該「video-to-audio」模型可以為任何視頻生成無限數量的付费API调用源码音軌,還能夠通過提示詞內容判斷生成的音頻「正向性」或「反向性」,從而令生成的聲音更貼近某些特定場景。

(來源:第一財經)

責任編輯: 文劼

推荐资讯
陕西咸阳:探索旅游市场及高速服务区食品安全监管新模式

陕西咸阳:探索旅游市场及高速服务区食品安全监管新模式

泉州市举办“世遗泉州”宣传进校园活动

泉州市举办“世遗泉州”宣传进校园活动

北京多种形式开展食品安全宣传周活动

北京多种形式开展食品安全宣传周活动

鑽石塔Diamond Towers試營運搶先看:最小的新光三越百貨,品牌超過100間、二館為餐廳專屬入口

鑽石塔Diamond Towers試營運搶先看:最小的新光三越百貨,品牌超過100間、二館為餐廳專屬入口

國家級警報大響!對流旺盛「慎防暴雨、雷擊」 12縣市大雨下到晚上

國家級警報大響!對流旺盛「慎防暴雨、雷擊」 12縣市大雨下到晚上

習近平在上海合作組織成員國元首理事會第二十三次會議上的講話(全文)

習近平在上海合作組織成員國元首理事會第二十三次會議上的講話(全文)

copyright © 2016 powered by 皮皮网   sitemap