今回のニュース
Alibaba Cloudから発表された2つの革新的な生成AI技術について取り上げます。動画生成AIのWan2.1と、高精度な画像生成&編集が可能なQwen-Image-2.0です。 これらの技術は、画像・映像生成の分野で大きなブレークスルーをもたらす可能性があり、特にオープンソースでの提供やテキスト描画精度の向上など、実用性の高い特徴を持っています。
ピックアップ
1. Wan2.1 - オープンソースの次世代動画生成AI
https://github.com/Wan-Video/Wan2.1 • VBenchで総合スコア86.22%を記録し、SoraやLuma、Pikaを上回る性能を実現 • Text-to-Video、Image-to-Video、編集機能など、幅広い用途に対応 • 小型版モデル「T2V-1.3B」は必要VRAMが約8.2GBと軽量で、RTX4090で5秒/4分の生成が可能 • プロンプト拡張機能により、短い指示でも映像品質と安定性が向上 • Apache 2.0ライセンスで商用利用可能
2. Qwen-Image-2.0 -