91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

騰訊混元視頻生成工具 HunyuanCustom 宣布開(kāi)源,融合文本、圖像、音頻、視頻等多模態(tài)輸入生視頻的能力

2025/5/9 11:48:35 來(lái)源:IT之家 作者:問(wèn)舟 責(zé)編:問(wèn)舟
感謝IT之家網(wǎng)友 有鯽雪狐 的線索投遞!

IT之家 5 月 9 日消息,騰訊混元宣布今天正式推出并開(kāi)源全新的多模態(tài)定制化視頻生成工具 Hunyuan Custom。該模型基于混元視頻生成大模型(Hunyuan Video)打造,主體一致性效果超過(guò)現(xiàn)有的開(kāi)源方案。

據(jù)介紹,Hunyuan Custom 融合了文本、圖像、音頻、視頻等多模態(tài)輸入生視頻的能力,是一款具備高度控制力和生成質(zhì)量的智能視頻創(chuàng)作工具。

騰訊表示,Hunyuan Custom 模型能實(shí)現(xiàn)單主體視頻生成、多主體視頻生成、單主體視頻配音、視頻局部編輯等能力,其生成的視頻與用戶輸入的參考主體能保持高度一致。

其中,單主體生成能力已經(jīng)開(kāi)源并在混元官網(wǎng)(IT之家附官網(wǎng)地址:https://hunyuan.tencent.com/)上線,用戶可以在“模型廣場(chǎng)-圖生視頻-參考生視頻”中體驗(yàn),其他能力將于 5 月內(nèi)陸續(xù)對(duì)外開(kāi)源。

有了 HunyuanCustom,用戶只需上傳一張包含目標(biāo)人物或物體的圖片,并提供一句文本描述(例如“他正在遛狗”),HunyuanCustom 就能識(shí)別出圖片中的身份信息,并在完全不同的動(dòng)作、服飾與場(chǎng)景中生成連貫自然的視頻內(nèi)容。

除了單主體以外,這個(gè)能力同樣能實(shí)現(xiàn)多主體視頻的生成,用戶提供一張人物和一張物體的照片(比如一包薯片和一名男子的照片),并輸入文字描述(比如“一名男子正在游泳池旁邊,手里拿著薯片進(jìn)行展示”),即可能讓這兩個(gè)主體按要求出現(xiàn)在視頻里。

此外,HunyuanCustom 不止于圖像和文本的配合,還具備強(qiáng)大的擴(kuò)展能力。在音頻驅(qū)動(dòng)(單主體)模式下,用戶可以上傳人物圖像并配上音頻語(yǔ)音,模型便可生成人物在任意場(chǎng)景中說(shuō)話、唱歌或進(jìn)行其他音視頻同步表演的效果,廣泛適用于數(shù)字人直播、虛擬客服、教育演示等場(chǎng)景。

在視頻驅(qū)動(dòng)模式下,HunyuanCustom 支持將圖片中的人物或物體自然地替換或插入到任意視頻片段中,進(jìn)行創(chuàng)意植入或場(chǎng)景擴(kuò)展,輕松實(shí)現(xiàn)視頻重構(gòu)與內(nèi)容增強(qiáng)。

此前大部分的視頻生成模型主要能實(shí)現(xiàn)文生視頻和圖生視頻。文生視頻每次均根據(jù)本文提示詞重新生成,很難持續(xù)保持人物和場(chǎng)景的一致性。而圖像生成視頻模型主要實(shí)現(xiàn)的是“讓圖片動(dòng)起來(lái)”。例如,上傳一張人物照片,最終生成的視頻通常只能在照片的原始服飾、姿態(tài)和場(chǎng)景下做出一些固定表情或動(dòng)作,服裝、背景和姿態(tài)幾乎無(wú)法修改。

但在部分場(chǎng)景下,創(chuàng)作者希望保持人物一致的情況下,改變?nèi)宋锼诘沫h(huán)境和動(dòng)作。此前的視頻生成模型無(wú)法實(shí)現(xiàn),多模態(tài)視頻生成模型 HunyuanCustom 則可以很好地滿足創(chuàng)作者的需求,通過(guò)引入身份增強(qiáng)機(jī)制和多模態(tài)融合模塊,真正實(shí)現(xiàn)了“圖像提供身份,文本定義一切”。

參考資料:

  • 體驗(yàn)入口:https://hunyuan.tencent.com/modelSquare/home/play?modelId=192

  • 項(xiàng)目官網(wǎng):https://hunyuancustom.github.io/

  • 代碼開(kāi)源:https://github.com/Tencent/HunyuanCustom

  • 論文地址:https://arxiv.org/pdf/2505.04512

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:騰訊混元大模型

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知

白朗县| 晴隆县| 桂东县| 遂昌县| 涞源县| 桦甸市| 普兰县| 穆棱市| 甘孜| 荥经县| 朝阳市| 江北区| 曲水县| 平顺县| 朝阳市| 蓝田县| 文山县| 盈江县| 康马县| 资源县| 浦城县| 安徽省| 惠东县| 芜湖县| 邳州市| 渭南市| 札达县| 台江县| 田林县| 辛集市| 咸宁市| 达拉特旗| 扎鲁特旗| 得荣县| 同心县| 永吉县| 博兴县| 睢宁县| 和硕县| 西畴县| 和顺县|