![見出し画像](https://assets.st-note.com/production/uploads/images/173154138/rectangle_large_type_2_95c52b4ca79755c4713aad8e7ce6833c.jpeg?width=1200)
バイトダンス社に迫る!OmniHuman-1とLumaAI、動画生成ツールの違いを語る。
はじめに
こんにちは、naoです。25年前に少しシステム系の仕事をかじったものの、当時はどうにも窮屈で馴染めず、その後18年間子育てに専念してきました。すっかりアナログ人間になっていた私ですが、2023年末にLarkというDXツールに出会い、その便利さに衝撃を受けました。そこからAIにも興味がわき、いろいろ調べているうちに「動画生成AI」の世界が想像以上に進んでいることを知ったんです。
実は私、LumaAIなど、ほかのAI動画生成サービスもいくつか試してみたことがあります。簡単に動画を作れたりと、どれもすごい技術だと思いました。ただ、今回話題になっているバイトダンス社のOmniHuman-1は、まだ実際に触れたことがないんですよね。この記事では、バイトダンス社が開発したOmniHuman-1がどんな特徴をもつのか、私が使ったほかのツールとの違いも簡単に比較しながらまとめてみます。
1. アナログだった自分がなぜAI・DXに惹かれたのか
私がAIやDXに興味をもったのは、Larkの「シンプルだけど何でもできる」機能に救われたことが大きいですね。難しい操作がいらないのに連携機能が豊富で、そこで初めて「デジタルって思ったよりハードル低いかも」と思えました。その流れで動画生成AIにも興味を持つようになり、LumaAIなどのツールも試してみたところ、「これなら私にも使える!」と感動したんです。
↑Larkの3月1日から料金プランの改定に向け、現在サポート中。
2. 今日の学び:OmniHuman-1が注目される理由と、私が試したツールとの比較
バイトダンス社のOmniHuman-1は、少ない入力データ(写真1枚や音声など)から自然なフルボディ動画を作り出せるのが特徴らしいですね。Diffusion Transformerという仕組みを使って不自然な映像の破綻を抑えつつ、Omni-Conditions Trainingで音声やポーズ情報をまとめて学習するので、動きや口パクがかなり自然になるといわれています。
私が触れたLumaAIなどは、シーン全体を立体的に再構築してくれるので、実在の物体を映し出すにはとても便利。一方、OmniHuman-1は「実在するかどうかは関係なく、人物の動作を再現すること」に特化している印象を受けました。ここが大きな違いですね。
![](https://assets.st-note.com/img/1738704348-e8SXmkdHZGnYECqRPyboKBg5.jpg?width=1200)
LumaAI →「スマホで撮ったものを3Dにして動かす」
OmniHuman-1 →「写真の人物を勝手に動かしてくれる」
たとえば、「ペットの動画を3D化して遊ばせたい!」ならLumaAIがいいし、
「昔の写真の人を喋らせたい!」ならOmniHuman-1が向いています。
どちらもすごい技術だけど、使い道がまったく違うので、目的に合わせて選ぶのがポイントです!
↑参考にさせていただきました。ありがとうございます。
3. 使ってみた感想:Larkが支える情報整理の大切さ
まだOmniHuman-1は使ったことがないので、いまはnoteの記事や紹介動画をで情報収集しています。そんなときに役立っているのがLark。たとえば、Web上で見つけた資料を貼りつけたり、タスク化したりしておけば、後で「どこに保存したっけ?」と迷うことがありません。私のようなアナログ人材でも、ちょっと工夫すれば最新技術を追いかけられるんだなと実感しています。
4. 次のステップに向けたわくわくする展望
動画生成AIは広告やエンタメはもちろん、教育や研修にも応用できると言われています。私が触ったLumaAIは3Dスキャンが強いので、実際の物や空間を取り込んで説明するのに向いていますし、OmniHuman-1のようにフルボディで動きを作り出す仕組みなら、人を撮影しなくても自然な講義動画が作れるかもしれません。もしこの技術が一般向けに公開されたら、アナログ主婦でも驚くほど自由に動画コンテンツを生み出せる時代がくるかもしれませんね。
5. まとめ(.Ai カレッジで学んだ内容のアウトプットです)
今回は、バイトダンス社のOmniHuman-1がどんな特長をもつのかを中心に、私が試した他社の動画生成ツールとも簡単に比較してみました。Larkで情報をまとめているうちに、「あれもできる、これもできる」という技術の広がりを感じてワクワクが止まりません。
難しい内容のAI・DX関連記事を参考資料としてチェックしてみると、ますます世界が広がるはず。今日はこの資料からこんな学びがありました。明日もまた新しいAI・DXの世界を紹介しますね。
最後まで読んでくれてありがとうございました。
【補足】バイトダンス社の概要
バイトダンス(ByteDance)は、中国発の大手テクノロジー企業で、AIを活用したコンテンツプラットフォームの開発・運営で急成長しました。2012年に設立され、わずか10年余りで世界的な企業へと成長。現在では、ショート動画アプリ「TikTok」や、中国版TikTokである「抖音(Douyin)」を運営する企業として広く知られています。