Wan 2.6 AIビデオジェネレーター

Wan 2.6でシネマティックなマルチショットビデオを作成。業界初のキャラクター一貫性のためのReference-to-Video(R2V)、自動ショット計画、ネイティブ音声-視覚同期。

対応:
テキストから動画画像から動画動画から動画

動画生成

0 / 2000

計算中...

残り 0 クレジット

動画プレビュー

まだ動画はありません

主な機能

マルチショットストーリーテリング

完全なナラティブのためのクローズアップ、ミディアムショット、ワイドショットを含む複数の調整されたショットを自動生成

Reference-to-Video (R2V)

キャラクターリファレンスをアップロードして、一貫した外観と音声でAI生成シーンにあなた自身または任意の被写体を出演させる

キャラクター一貫性

カット全体で安定した視覚的アイデンティティを維持 - 顔、比率、衣服、スタイルが全体を通して一貫

ネイティブ音声-視覚同期

中国語と英語でのスピーチとの精密リップシンク、同期効果音、アンビエントオーディオ

最大15秒

完全なナラティブアーク、製品ショーケース、SNSコンテンツのためのより長いビデオを生成

柔軟なアスペクト比

16:9、9:16、1:1、4:3、3:4をサポート - YouTube、TikTok、Instagramなどに最適化

Wan 2.6 ビデオギャラリー

このモデルで作成された動画を探索

料金プラン

透明なクレジットベースの価格設定

5s / 720P
70

credits per video

10s / 720P
140

credits per video

15s / 720P
210

credits per video

5s / 1080P
105

credits per video

10s / 1080P
210

credits per video

15s / 1080P
315

credits per video

使い方の使い方

たった3ステップで映画品質の動画を作成

1

生成モードを選択

キャラクター一貫性のためにテキストからビデオ、画像からビデオ、またはReference-to-Videoを選択

2

プロンプトを作成

シーンを説明するか、リファレンスをアップロード。自動ナラティブ構造化のためにマルチショットを有効化

3

生成&ダウンロード

生成をクリックして、同期オーディオ付きのマルチショットビデオを受信

技術仕様

モデルプロバイダー
Alibaba
モデル名
Wan 2.6
最大長さ
15秒 (T2V/I2V), 5-10秒 (R2V)
解像度
480p, 720p, 1080p
フレームレート
24 FPS
オーディオサポート
スピーチ、効果音、アンビエントオーディオ
音声言語
中国語と英語
入力タイプ
テキスト、画像、リファレンスビデオ
アスペクト比
16:9, 9:16, 1:1, 4:3, 3:4
パラメータ
14B (オープンソース, Apache 2.0)

使用事例

パーソナル出演ビデオ

R2Vを使用して、外観と音声を維持しながらAI生成シーンに自分自身を挿入

ブランドストーリーテリング

マーケティングキャンペーン用の一貫したキャラクターを持つマルチショットナラティブビデオを作成

SNSコンテンツ

縦長、横長、正方形フォーマットでプラットフォーム最適化されたビデオを生成

製品ショーケース

複数のカメラアングルとトランジションを持つプロフェッショナルな製品デモを制作

キャラクター駆動シリーズ

複数のビデオにわたって一貫したキャラクターでエピソード的コンテンツを構築

シネマティックショート

自動ショット計画と構成で映画品質のショートビデオを作成

よくある質問

このモデルに関するよくある質問への回答をご覧ください

Wan 2.6はAlibabaの高度なAIビデオ生成モデルで、マルチショットストーリーテリング、キャラクター一貫性のためのReference-to-Video(R2V)、ネイティブ音声-視覚同期を特徴としています。シネマティック品質のビデオ作成向けに設計されています。

R2Vは、人物、動物、またはオブジェクトの1-3個のリファレンスビデオをアップロードし、その被写体を一貫した外観と音声で特徴とする新しいシーンを生成できます。文字通りAI生成ビデオに自分自身を出演させることができます。

モデルは単一のプロンプトから複数の調整されたショットを自動的に計画および生成します - 感情のためのクローズアップ、アクションのためのミディアムショット、雰囲気のためのワイドショット - 完全なナラティブシーケンスを作成します。

テキストからビデオおよび画像からビデオモードで最大15秒、Reference-to-Videoモードで5-10秒をサポートし、480p、720p、または1080p解像度です。

はい、スピーチの精密リップシンク、効果音、アンビエントオーディオを含むネイティブ音声-視覚同期が含まれています。中国語と英語の両方の音声生成をサポートしています。

3つの入力モードがサポートされています: プロンプトベース生成のためのテキストからビデオ(T2V)、画像をアニメーション化する画像からビデオ(I2V)、1-3個のリファレンスクリップを使用するキャラクター一貫性生成のためのReference-to-Video(R2V)。

モデルはキャラクタードリフトを最小限に抑えるように特別に設計されています。カット全体で安定した視覚的アイデンティティを維持し、マルチショットシーケンス全体で顔、比率、衣服、スタイルを保持します。

ナラティブシーケンスを自動計画するマルチショットストーリーテリング、ビデオに自分自身を出演させるR2V、優れたキャラクター一貫性、14Bオープンソースアーキテクチャ、より長い15秒生成持続時間で際立っています。

Wan 2.6

Wan 2.6で作成を開始

AI駆動のキャラクター一貫性でシネマティックなマルチショットビデオを作成