Seedance 1.5 Pro AIビデオジェネレーター

ByteDanceの45億パラメータを持つ革新的な共同音声-ビデオモデル。完璧に同期されたリップシンク、没入型3Dサウンドスケープ、ワンパスで15以上のプロフェッショナルカメラムーブメントを備えたシネマティックビデオを生成。

対応:
テキストから動画画像から動画

動画生成

0 / 2000

計算中...

残り 0 クレジット

動画プレビュー

まだ動画はありません

主要な機能

共同音声-ビデオ生成

Dual-Branch Diffusion Transformer (DB-DiT)アーキテクチャを使用して、ワンパスで同期されたビデオとオーディオを生成し、共有潜在空間で両方のストリームを処理

ミリ秒精度のリップシンク

真のリップシンク技術が音素を視素にミリ秒精度でロックし、英語、日本語、韓国語、スペイン語、ポルトガル語、インドネシア語、中国語方言を含む8以上の言語をサポート

シネマティックカメラコントロール

トラッキングショット、ドリーズーム、プッシュイン、クレーンムーブメント、ヒッチコックテクニックを含む15以上のプロフェッショナルカメラムーブメントを実行 — ナラティブコンテキストに基づいてインテリジェントに適用

3D空間サウンドデザイン

インテリジェントシーン分析がプロフェッショナルな深さと没入感を持つ層状環境サウンドを生成

多言語音声サポート

英語、日本語、韓国語、スペイン語、ポルトガル語、インドネシア語、広東語、四川語、陝西語などの中国語方言のネイティブサポート

物理-オーディオ同期

オーディオスパイクを視覚的イベントに自動同期 — ガラスの粉砕、足音、衝撃が完璧に整列

Seedance 1.5 Pro ビデオギャラリー

このモデルで作成された動画を探索

料金プラン

透明なクレジットベースの料金設定

4s / 480P

オーディオなし

8

credits per video

4s / 480P

オーディオあり

14

credits per video

8s / 480P

オーディオなし

14

credits per video

8s / 480P

オーディオあり

28

credits per video

12s / 480P

オーディオなし

19

credits per video

12s / 480P

オーディオあり

38

credits per video

4s / 720P

オーディオなし

14

credits per video

4s / 720P

オーディオあり

28

credits per video

8s / 720P

オーディオなし

28

credits per video

8s / 720P

オーディオあり

56

credits per video

12s / 720P

オーディオなし

42

credits per video

12s / 720P

オーディオあり

84

credits per video

使い方

3つのステップで同期オーディオ付きシネマティックビデオを作成

1

入力タイプを選択

プロンプト用のテキストからビデオ、または静止写真をアニメーション化する画像からビデオを選択

2

プロンプトを作成

シーン、対話、効果音、希望するカメラムーブメントを説明

3

生成&ダウンロード

同期オーディオ付きのビデオを生成し、準備ができたらダウンロード

技術仕様

モデルプロバイダー
ByteDance
モデル名
Seedance 1.5 Pro
アーキテクチャ
Dual-Branch DB-DiT (4.5Bパラメータ)
最大長さ
4-15秒
解像度
480p / 720p
アスペクト比
16:9, 9:16, 1:1, 4:3, 3:4, 21:9
オーディオサポート
音声、対話、効果音、3D空間
音声言語
EN, JA, KO, ES, PT, ID, 中国語方言
入力タイプ
テキスト、画像
生成時間
約2-3分 (720p)

使用事例

ショートドラマ&ナラティブ

同期された対話、感情、シネマティックストーリーテリングを持つ魅力的なショートドラマを作成

コマーシャル&広告

完璧な音声-視覚同期とブランドメッセージングを持つプロフェッショナルな製品プロモを制作

ローカライズされたコンテンツ

グローバル市場向けにネイティブ方言サポートで地域固有のコンテンツを生成

ゲームカットシーン

空間オーディオとダイナミックカメラワークを備えた没入型ゲームシネマティックを作成

SNS

TikTok、Reels、YouTube Shorts向けの魅力的なショートフォームコンテンツを生成

ステージパフォーマンス

同期された音楽、対話、効果音を持つステージスタイルのパフォーマンスを制作

よくある質問

このモデルに関するよくある質問への回答をご覧ください

Seedance 1.5 ProはByteDanceの45億パラメータを持つ高度な共同音声-ビデオ生成モデルです。従来の「ビデオ+吹き替え」アプローチとは異なり、Dual-Branch Diffusion Transformer (DB-DiT)アーキテクチャを使用して、単一の統一プロセスで音と視覚を同時に合成します。

ミリ秒精度の真のリップシンク、オーディオスパイクが視覚的イベントと正確に一致する物理-オーディオ同期、シーンの深さに基づいた層状環境エフェクトを持つ3D空間サウンドスケープを特徴としています。

モデルは英語、日本語、韓国語、スペイン語、ポルトガル語、インドネシア語、広東語、四川語、陝西語を含む複数の中国語方言をネイティブにサポートし、本格的なローカライズされたストーリーテリングを実現します。

複数のアスペクト比(16:9、9:16、1:1、4:3、3:4、21:9)で480pまたは720p解像度の4-15秒のビデオを生成します。制作品質の720pビデオは10倍の推論加速により約2-3分で生成されます。

モデルはクローズアップ、フルショット、トラッキングショット、ドリーズーム、プッシュイン、クレーンムーブメント、POVパースペクティブを含む15以上のプロフェッショナルシネマティック技術を実行します — ナラティブコンテキストに基づいてインテリジェントに選択されます。

テキストからビデオ(T2V)と画像からビデオ(I2V)の両方をサポートし、正確なクリエイティブコントロールのためのビデオ拡張とエンドフレームコンディショニングなどの追加機能があります。

他のモデルがワールドビルディングや物理シミュレーションに焦点を当てているのに対し、このモデルは正確な音声-視覚同期に優れています。タイトな音声-ビデオ統合を必要とするクリエイター向けの制作ツールとして設計されており、ネイティブ方言リップシンクは2026年時点で独自の機能です。

ショートナラティブ、コマーシャル、製品プロモ、ローカライズされたショートドラマ、ステージスタイルのパフォーマンス、ゲームカットシーン、タイトな音声-視覚統合から利益を得る任意のコンテンツに理想的です。

Seedance 1.5 Pro

Seedance 1.5 Proで作成を開始

同期音声-視覚コンテンツでAIビデオ生成の未来を体験