Adobeが開催した年次イベント「Adobe Max」で、AIを活用した驚くべき新機能の数々が発表され、クリエイティブ業界に衝撃を与えました。最も注目を集めたのは、Adobe Fireflyの生成ビデオ機能です。テキストプロンプトを入力するだけで、高品質な動画を生成することができます。Adobe PremiereにはGenerative Extend機能が追加され、既存の映像を AIで拡張することができるようになりました。Adobe Photoshopにも新しい AI機能が追加され、Firefly Image 3モデルを使用した気の散るものの除去、生成的な塗りつぶし、拡張、類似生成、背景生成などが可能になりました。Adobe Lightroomにも AIを活用したクイックアクション機能が追加され、空や肌の自動補正、色の強調などができるようになりました。また、Adobeは将来的に実装予定の実験的プロジェクトも紹介しました。Project Perfect Blendは、異なる画像を組み合わせる際に光源や影を自動調整し、自然な合成を可能にします。Project Clean Machineは、タイムラプス動画から不要なフラッシュを除去します。Project Hi-Fiは、簡単なスケッチから詳細な3Dオブジェクトを生成します。Project Scenicは、テキストプロンプトから3D環境を生成し、カメラアングルを自由に変更できます。Project Remixは、Adobe Illustrator向けに設計されたもので、簡単な指示からフライヤーなどのデザインを生成し、サイズ変更や他のデザインとのスタイル統一も可能です。Project Supersonicは、映像に合わせて自動的にオーディオを生成し、Project Turntableは2Dのベクター画像を360度回転させることができます。一方、KyberはSuper Studioをリリースし、複数のAI画像・動画生成モデルを一つのプラットフォームで利用できるようにしました。Kreaも同様に、複数のAI動画生成モデルを統合したプラットフォームを提供開始しました。音楽生成AIのSunoは、画像や動画から楽曲を生成する新機能を追加しました。HeyGenは、AIアバターを使用してミーティングに参加できるInteractive Avatar機能をリリースしました。その他、Metaが動画内の物体追跡を改善するCoTracker 3を発表し、NVIDIAが強力な言語モデルLAMA 3.1 Nemotron 70B Instructを静かにリリースしました。Mistralは、モバイルデバイスに最適化された小型言語モデルをリリースし、OpenAIはWindows向けのChatGPTデスクトップアプリをリリースしました。Perplexityは内部知識検索機能を追加し、NotebookLMはポッドキャスト生成機能をカスタマイズ可能にしました。DropboxはDashという AIを活用した検索機能を追加し、Amazonは広告主向けの AI画像生成ツールをリリースしました。
公開日:2024年10月19日
※動画を再生してから読むのがオススメです。
実際、今週はかなりクレイジーな週でしたので、さっそく詳しく説明しましょう。
私の人生の中で見た中で、文字通り最もクールなことの一つから始めます。
これを見たのはおそらく初めてではないと思いますが、正直言って私はこれに飽きることがないので、今すぐもう一度見てみましょう。
しかし、これはSpaceXが彼らのロケットブースターを空中で捕まえた瞬間で、彼らが「小さな箸」と呼んでいるもので行われました。
私にとっては、これは本当に信じられないことです。
左側でこの車両がどれほど速く動いているかを見ることができます。
現在、私たちは3つのラプターエンジンに減りました。
今、私たちはその箸を見ることができます。
ブースター、何かを燃やすことができます。
マクアディリオンがブースターを発射しました。
これは本当に信じられないことです。
初めての試みで、私たちは無事に超重型ブースターを発射塔に戻すことに成功しました。
なんて素晴らしい光景でしょう。
冗談でしょうか?
カメラではわからないかもしれませんが、私はそれを再び見て本当に鳥肌が立ちました。おそらく10回目くらいの視聴です。
私はそれがAIとは何の関係もないことを知っています。
ただ、それがとても素晴らしいと思うのです。
人間が一緒に集まり、知恵を絞ってこういったものを作り上げることができるのは、本当に素晴らしいことです。
それは私にとって、ただただ驚くべきことです。
しかし、実際のAIの話に進みましょう。
今週、マイアミでAdobe Maxが開催されました。
これはAdobeが主催する年次イベントで、彼らが現在リリースしようとしているすべての素晴らしいものを披露します。
また、Adobe Sneaksというものも行い、彼らが現在取り組んでいる本当に素晴らしいものの先行公開を行います。
そして、驚きのことに、
今年はすべてがAIに関するものでした。
このイベントで多くの人が話題にしていることは、Adobe Fireflyの生成動画です。
私たちは長い間生成画像を利用してきましたが、今やAdobe Fireflyは動画を生成することを可能にします。
ここでテキストプロンプトを入力し、生成をクリックすると、実際にかなり見栄えの良い動画が得られます。
おそらく、Adobe Maxで見せているものは厳選されたものでしょう。
彼らが披露するのは最高のものだけだと思いますが、見た目はかなり良いです。そして、この新しいAdobe Fireflyの動画モデルについての一つの特徴は、これが唯一の倫理的なAI動画モデルであると主張していることです。
ここでは、AdobeがそのFirefly生成AIモデルを、Adobeストックやパブリックドメインコンテンツなどのライセンスされたコンテンツで訓練したと記載されていることがわかります。
それは、企業のAI倫理原則である責任、説明責任、透明性に基づいて開発されました。
基本的に、他の人の動画や画像を使用してこれを作成したわけではないと言っています。
それはAdobe Stockとパブリックドメインで訓練されましたが、実際にはAdobe Stockには一部AI生成の画像も含まれています。なぜなら、長い間Adobe Stockは、MidjourneyやStable DiffusionなどのAIプラットフォームで生成された画像を人々がアップロードすることを許可していたからです。
彼らはその画像を使用するライセンスを持っていたものの、それらはおそらく、画像生成においてあまり倫理的でない方法を用いたツールで生成された画像でした。
すべて非常に混乱していて複雑ですが、それにもかかわらず、彼らはこれが彼らが使用する権利を持っていたすべての映像で訓練されたものであり、誰も「私の動画があなたの訓練セットに含まれていた」と言ってこないと主張しています。
彼らはAdobe Fireflyのビデオを披露しましたが、実際にはプロンプトを入力してビデオを生成するモードにはアクセスできません。
しかし、彼らはAdobe Premiere内で「生成的拡張」と呼ばれる機能へのアクセスを提供しました。ここにあるデモでは、下にいくつかの映像があるのが見えますが、少し隙間があります。
ここには約2秒のギャップがあり、そのギャップを埋める必要がありますが、彼らはそのギャップを埋めるためのビデオを持っていません。
彼らは今、AIを使って実際にその映像を引き伸ばし、延長することができます。
今、既存のビデオクリップを延長するためにAI映像を生成しているのが見えます。これは、ビデオ編集を行う人にとって非常に便利であることは誰でも知っています。
彼らはこのAdobe Fireflyビデオモデルのベータアクセスを開始し始めているようですが、待機リストがあります。
実際には、こちらの長いURLから待機リストに参加することができますが、説明欄にリンクを貼っておくので、この新しい生成型ビデオモデルを使用したい場合は、簡単に待機リストに参加できます。
いくつかの例を挙げます。
紙粘土のパンダ、宇宙飛行士、ここで何かを抜きました。
小さな蝶がいます。
ビデオ内でテキストを生成できるようです。
それはとても素晴らしいですね。
その能力を示すさまざまな素晴らしい例があります。
もしこれが約1年前に出ていたら、皆が驚いていたことでしょう。
しかし、今私たちはSoraやRunway、Luma Dream Machine、Cling、そして他のすべてのAIビデオツールを見てきたので、それらと同等のものに感じられます。
Adobe PhotoshopもAIのアップグレードを受けました。
こちらの小さなデモ動画で見ることができるのは、細かい気を散らす要素を取り除くボタンです。
それはワイヤーやケーブル、そして人を見つけます。
彼はワイヤーとケーブルのボタンをクリックし、ワイヤーが取り除かれます。
彼は「人」ボタンをクリックすると、人々が消えます。
今はただ壁に座っている男だけが残り、もちろん、いくつかのアップグレードを受けた生成的フィルもあります。
彼らは基本的に「Firefly image three」と呼ばれる最新の画像モデルを実行しています。
こちらをご覧ください、これがPhotoshopの新しい革新です。
気を散らす要素を取り除くツールがあります。
新しい生成的ワークスペースが登場し、現在一般に利用可能です。
生成的フィル、生成的拡張、類似生成、背景生成があり、これらはすべて新しいAdobe Firefly 3モデルによって支えられています。
こちらがその生成的ワークスペースの様子です。
3Dポディウムアーチの製品写真、ミニマルな青、緑、黄色というプロンプトを入力します。
それによって、選択できるポディウムの画像がたくさん生成されます。
彼らは自分の製品を持ち込み、展示することができます。
これらの機能は、Adobeのアプリのベータ版内で利用可能です。
クリエイティブクラウドのメンバーであれば、クリエイティブクラウドアプリにログインし、アプリに移動して、ベータをクリックし、Photoshopのベータ版またはPremiere Proのベータ版をダウンロードしていることを確認してください。
ベータ版ではまだそれらは利用できません。
また、Adobe Lightroom内にいくつかのAI機能が導入されました。例えば、AIを使用して空を自動的に修正したり、肌を整えたり、色を鮮やかにするためのクイックアクションなどです。
生成的除去機能も現在Adobe Lightroom内で利用可能で、写真から物を取り除くためにフル版のPhotoshopに入る必要はありません。
これらが現在利用可能な主なAIのアップデートです。
しかし、彼らが取り組んでいるいくつかのことについて多くの先行情報を提供したこともお伝えしました。
それが、Adobe Maxから出てきた本当に驚くべき内容です。
もしあなたが仕事でAIを使っている人であったり、仕事でAIを使うことを考えているのであれば、HubSpotのChatGPTを仕事で使うための完全に無料の5つの必須リソースのバンドルをチェックする必要があります。
正直なところ、まだAIを受け入れていないのであれば、NVIDIAのCEOであるジェンセン・ファンが言ったことを思い出してください。
AIは21世紀で最も変革的な技術になるでしょう。
それは私たちの生活のあらゆる産業や側面に影響を与えるでしょう。
AIを使って仕事のスピードを上げたり、質を向上させたりしていないのであれば、あなたの競合他社はおそらくそうしているでしょう。
この完全に無料のリソースへのリンクは、下の説明欄にあります。
信じてください、これはぜひ目を通しておきたいものです。
ChatGPTを何に使うべきか、または使うべきでないかについての興味深いフローチャートが含まれています。
さらに、ChatGPTと一緒に使用できる非常にクールなテンプレートもあり、作成されたコンテンツがあなたのブランドの声に沿ったものであることを確認できます。
あなたはまた、AIの作業を再確認し、実際に世に出したいものを確実に出せるようにするための、AI生成コンテンツの精緻化チェックリストを手に入れています。
職場でのAI導入に関する簡単に従える4ページのチェックリストや、ChatGPTを使って一日を充実させるための非常に包括的なPDFガイドもあります。
ここで本当に素晴らしいことがあります。
この文書の一番下までスクロールすると、今日ChatGPTを試すための100の方法があり、試すための非常にクールなプロンプトがいくつか含まれています。
顧客サービスとサポートの改善に関する提案を提供したり、SEOの改善に関する提案を提供したり、メール管理と整理を手助けしたり、その他多くのことが含まれています。
本当に包括的で、とても役に立ちます。
もう一度、HubSpotからのこの完全に無料のリソースへのリンクは、下の説明にあります。
この動画をスポンサーしてくださったHubSpotに心から感謝します。
私のお気に入りのデモの一つは、こちらのProject Perfect Blendからのもので、クリスマスの背景のあるテーブルが表示されています。
ここでデモを行っていた女の子は、テーブルに座っている彼氏の画像を取り込み、背景を削除して、まるで彼がこのテーブルに座っているかのように配置しました。
動画の一番下の部分を見ると、ここにハーモナイズボタンがあります。
彼女がハーモナイズボタンをクリックすると、実際に画像が再点灯するのがわかります。
彼は実際にその位置にいるように見えます。
テーブルの上に新しい影まで落として、彼が本当にそこにいるように見せています。
彼女は次に、全く異なる照明でテーブルに座っている自分の画像を取り込み、背景を削除し、ハーモナイズボタンをクリックしました。
再び、それは全体を再点灯させました。
すべてが同じ照明のように見えます。
影が追加され、よりリアルに見えるようになりました。
彼らはまだ終わっていませんでした、テーブルの上に猫を置きたいと思っていました。
猫の画像を取り込み、猫の背景を削除し、調和ボタンをクリックして、猫がテーブルに座っているように見せました。
彼女は、画像の背景を変更できることを見せてくれ、その背景に基づいて全体の照明が再調整されることを示しました。
木々の間からオレンジ色の光が差し込んでいて、それが夜の花火の中で画像にいる全員にオレンジ色の輝きを与えていることに注目してください。
彼の顔にはこのような青い光が、彼女の顔には様々な花火から来るこのようなオレンジの光が見えます。
背景を何に変えても、それがすべて調和し、一つのまとまりのある画像のように見えました。
彼らはまた、このStarlapseビデオを撮影したProject Cleanという機械も披露しましたが、そのビデオにはこのような閃光がたくさんありました。
こちらが元の動画です。
カメラに次々と現れるようなフラッシュが見えます。
彼はProject Cleanマシンを使い、それらのフラッシュを取り除いて非常にクリーンなスターレップスを作り出します。
彼らはこのプロジェクトHi-Fiを披露し、部屋の画像を与えると、明るいピンクの空のリビングルームなどを生成しました。
私にとって、これはNVIDIA Canvasのようなものでできることに非常に似ているように見えます。
小さな植物の画像を描きました。
この植物の画像が生成されました。
彼らはここでいくつかの詳細を提供し、その後、彼らが作成した元の画像に植物の画像を取り込むことができました。
この小さなソファの画像を描きました。
このソファのバージョンが作成されました。
そのソファを画像に引き込むことができるのです。
とても素晴らしいことですね。
以前にもこのようなものを見たことがありますが、Photoshopの中で直接このようなことができるのは素晴らしいことです。
彼らはこのプロジェクト・シニックを披露しました。ここ右上に「居心地の良いキャンプサイト」というプロンプトを入力します。
生成をクリックすると、3Dオブジェクトが含まれたキャンプサイトが生成されます。
あなたは、それぞれが動かせるスケーラブルなオブジェクトのようであり、まるでBlenderでそれと対話できるかのようだと気づきます。
彼らが好みの構図に調整したら、下にあるこの生成ボタンをクリックすることで、よりリアルな画像が生成されますが、それは彼らが作成した3Dオブジェクトを使った構図に従っています。
こちらは別の例で、少しズームアウトされており、このキャンプサイトの周りにたくさんの木やテントが追加されています。
面白いのは、これが3D空間であるため、彼らはカメラを好きなように向けることができるということです。
彼らはこのキャンプサイトの上からの視点や、低い角度からの視点を持つことができます。
彼らはこの角度から好きなように物事を拡大することができます。
彼らは設定したその正確な角度から、より現実的な画像を得ることができます。
これは、3D環境を作成する非常にクールなプロジェクトです。
3D環境に好きな要素を追加し、拡大・縮小し、カメラを好きなように向けることができ、その後、それを現実的な画像に変換することができます。
彼らはこのプロジェクトのリミックスをたくさん披露しましたが、これはAdobe Illustrator向けに設計されているようで、フライヤーのように見せたいものをモックアップし、その後、目指していたスタイルに似たフライヤーを生成します。
こちらは彼らが作成した別のチラシです。
これは本当に便利で、素晴らしいものになりそうです。
リミックスの要素がここにあり、希望するサイズにリサイズできるのです。
同じ画像が新しいサイズで生成されるのがわかります。
歪んだり変な感じにならずに、すべてが再フォーマットされているのがわかります。
彼女は、巨大なリーダーボードスタイルのバナーを作成し、テキストを再配置するデモを見せてくれました。
それはより縦型のフォーマットになっています。
すべての処理は、裏で動いているAIによって行われました。
あなたは、欲しいフライヤーを一つ作成するだけです。
例えば、Google広告やその他のためにたくさんのバナーが必要だとしましょう。
あなたは単に希望する寸法を伝えるだけで、希望するすべての寸法に対して類似のバナーを再生成してくれます。
また、スタイルを一致させる機能も備えています。
ここにサーカスのために生成された小さなフライヤーがあります。
彼らはこの例を示して、私のバナーのスタイルをそのバナーに合わせてほしいと言いました。そして、アップロードした別の画像のスタイルで、全く同じテキストと詳細を持つサーカスのバナーが再生成されたのを見ることができます。
バナー広告を多く行ったり、さまざまなソーシャルメディアプラットフォーム用に異なるサイズのミームやその他のコンテンツを作成する必要がある人々は、この機能を気に入るでしょう。
しかし、今、私はAdobe Maxで見た最も素晴らしいものについてお話しします。
私にとって特に際立っていたのは二つありました。
最初のものは、このProject Supersonicです。
これは非常に音声に基づいています。
ここでデモを再生させていただきます。
この最初の例では、彼らは上にあるプロンプト「森林の雰囲気」とともに森林の動画を提供し、これが生成されたものです。
その一つのテキストプロンプトを与えることで、音声と映像を一致させることができました。
宇宙船の音を追加したいのですが、アイデアがあまり浮かばないので心配はいりません。プロジェクト・スーパソニックはインスピレーションの源でもありますから。
主題選択をクリックすると、宇宙船を選んだ際にプロンプトを自動的に作成してくれます。
さあ、行きましょう。
見てみてください。
森の惑星から宇宙船が離陸しています。
私には良さそうに聞こえます。
やってみましょう。
生成ボタンを押して、何が出てくるか見てみましょう。
それが本当にクールだと思ったのは、上昇するにつれて音と同期しているのに気づいたからです。
宇宙船が上昇するにつれて、離陸の音を出すことを知っているかのようです。
私には、それが本当に、本当にクールでした。
しかし、彼は実際にここで別のデモを行い、自分の声を使って音声の動きを制御するようなことをしました。
これを見てください。
私たちはうなり声をしっかりと捉えました。
どんな結果が返ってくるか見てみましょう。
モンスターのうなり声を入力して生成ボタンを押すと、私の声の正確なタイミング、ダイナミクス、エネルギーを使って生成が行われる予定です。
それは本当にすごかったですし、最後の部分が私にとって一番衝撃的でした。なぜなら、それを使えば、もっと簡単にアニメーションやその他の作業ができるようになるのが見えたからです。
将来的には、自分自身の楽しい動画ワークフローにこれを使うことができると思います。
しかし、こちらは「プロジェクト・ターンテーブル」と呼ばれています。
戦士はドラゴンを見ているべきですよね?
戦士をドラゴンの方に向ける必要があります。
しかし、見ての通り、これは2Dベクターシェイプであり、単純に回転させることはできません。
通常、私は全体の形を再描画しなければならず、それには多くの時間がかかります。
しかし、ここで私たちの新しいツールをお見せしましょう。
私はただ形を選択して、この生成的使用ボタンをクリックするだけです。
スライダーをドラッグするだけで、形を回転させることができます。
それは本当に驚くべきことです。
Look at that.
そのキャラクターのあらゆる角度を認識し、自由に配置できるようになりました。私はドラゴンをこんな風に回転させることができ、もちろん、彼もドラゴンで同じことをして、それがどの画像でもできることを見せてくれました。
それは私にとって、おそらく最も衝撃的で、最も素晴らしいものだったと思います。
それはこのプロジェクトのターンテーブルで、再びAdobe Maxでは彼らが取り組んでいるもののすべてのスニークピークが紹介されています。
これは実際には現在利用可能なものではありません。
これらは、彼らが現在行っている実験的なプロジェクトのようなもので、最終的には利用可能になる予定ですが、まだ具体的なタイムラインは決まっていません。
しかし、これは本当に素晴らしかったです。
これが、私がAdobe Maxで見せたかった主なことです。
AIに関連しない多くのこともありました。
Illustratorやさまざまなツールスイートに追加された他の多くの生活の質を向上させる機能もありましたが、私が特に感銘を受けたAI関連のものをお見せしたかったのです。
今、創造性やアートについて話しているので、Kyberについても話しましょう。Kyberは最近、「Super Studio」と呼ばれる新しい機能をリリースしました。
新しいKyber Super Studioでは、Luma Labs、Dream Machine、Black Force Labs Flux、そしてKyberが既に提供していた画像およびビデオモデルを直接使用できる機能が追加されました。
それには、点をつなげて視覚的なワークフローを作成できるキャンバスインターフェースも備わっています。
実は私もKyberのアカウントを持っているので、見てみることができ、動かしたり、ズームインしたりズームアウトしたりできるキャンバスがあることがわかります。
これらの動画にカーソルを合わせると、自動的にその動画が再生されることに気づきました。
なんだか、彼らはコンフィ UIのようなものから得られるものをモデル化しようとしているように見えますが、少し複雑さが少ないです。
ここを見ると、自分の画像をアップロードしたり、ここで美的感覚を選んだりできるようで、その後、この画像作成の流れでいくつかのバリエーションを出力するようです。
この動画作成の流れでは、Lumaのドリームマシンを使用しているようで、主題のテキストプロンプトを与えることができるようです。
アスペクト比のような動画の詳細を指定することができます。
開始キーフレームを指定することもできます。
あなたは、終了キー フレームを設定し、その2つのキー フレームの間でアニメーションがどのように動くかを見ることさえできます。
これは、フラックスでできること、ルーマのドリームマシンでできること、そしてすでにカイバーでできることをほぼそのまま取り入れ、それらをすべて組み合わせてノードベースの接続ワークフローシステムにしているようです。
それを構築する際には、無限のキャンバスの上で作業しているようなもので、さらに多くの要素を追加し、創造的なアイデアのボードを構築し続けることができます。
上部のプラスボタンをクリックすると、Lumaビデオ、フラックス画像、イメージラボ、ビデオラボ、ビデオリスタイル、画像アップスケール、プロフィール画像リスタイル、ロゴリスタイルなど、さまざまなオプションが表示されます。
これらのいずれかをクリックすると、その小さなノードが追加され、ここで詳細を更新することができます。
私の画像ラボでは、プロンプトや画像を与えることができます。
プロンプトとして「月に向かって吠えるオオカミ」を与え、この小さなスマイリーフェイスのボタンを押すと、生成が始まるのがわかります。
月に向かって吠えるオオカミの画像が得られ、無限キャンバスでズームインすることができます。
再びこのプラスボタンに来て、Lumaビデオを選択します。
テーマとして「月に向かって吠えるオオカミ」を与えることができます。
月に向かって吠えているこのオオカミを、ここに取り込んでスタートのキーフレームにできたら素晴らしいと思います。
そして、実際にできました。
もし私が生成をクリックすれば、ここに取り込んだこの画像を基にして生成されるはずです。
おおよそ1分後、オオカミの動画ができました。
今のAI動画の状況は皆知っていますが、時には数回の再生成が必要です。
このキャンバススタイルが本当に気に入りました。1つのウィンドウにどんどん要素を追加して、よりクリエイティブになれるし、作ったものを他のモジュールにドラッグして使えるところがいいですね。
もう少し試してみる必要があることです。
実際、これをこの動画でテストするのは初めてでしたが、今のところかなり面白いようです。
comfy UIのようなものほど複雑ではありません。
このようなノードベースのシステムで点をつなぐ感覚が、時間とともにもう少し具体化されるような気がします。
ツールKrea AIは、利用可能なほぼすべてのビデオモデルを一つのプラットフォームに統合しました。
Kreaアカウントをお持ちであれば、Minimax、Luma Labs、Runway、Pika Labs、Klingを使って動画を作成できるようになり、これはAI動画生成分野の主要なプレイヤーをほぼ網羅していると思います。
こちらのkrea.aiに行き、ビデオに入って、動画生成をクリックすると、「月に向かって吠えるオオカミ」というプロンプトを入力することで動画を生成できます。
そして左下には、Luma、Runway、Kling、Haluo AI(これもMinimax)およびPikaのオプションがある小さなポップアップメニューが表示されます。
それは、生成にかかる推定時間を提供しているようにも見えます。
Lumaの動画は1分、Runwayの動画も1分、Klingは約10分、Haluo AIは約10分、Pikaは5分です。
かなり素晴らしいアップグレードですね。
これらのAI動画モデルを試してみたい場合は、すべての利用可能なモデルを一つの場所で試すことができます。
音楽生成が好きな方には、Sunoが動画と画像のプロンプトを使った新機能を発表しました。
ここには、素晴らしい風景、面白いミーム、自然なセルフィー、または日常の冒険の短い動画など、Suno Scenesがあなたのお気に入りの写真や動画からユニークな曲を作成する手助けをすることが書かれています。すべてスマートフォンから行えます。
モバイルアプリでのみ利用可能なようですね。こちらにアプリがあるので、早速見てみましょう。
では、作成ボタンをクリックします。
では、今見ているものを写真に撮ってみましょう。
それから何が生成されるのかは見えません。
プロのヒントとして、コンテキストを追加すると曲がさらに個人的になると書いてありますが、あまりやりたくないですね。
画像を読み取ってほしいです。
もっと文脈を与えれば、ただの歌のためのテキスト入力をしているような気がします。
ただやってみたいです。
パンクやヒップホップなどのスタイルを与えることができるのは知っています。
ただ画像を与えたらどうなるのか見てみたいだけです。
こちらが私たちが得たものです。
海の背景、テクノロジーの遊びとトリック。
ここに生成された歌詞を見ることができます。
カメラとスクリーンが踊り、再帰的なトランス、海の背景、テクノロジーの遊びとトリック。
それは、見たものに基づいて生成されたすべての歌詞でした。
しかし、背景には海のある絵があり、テクノロジーやカメラ、スクリーンがあります。
それはその絵の中に何があるかを理解し、それに合わせた音楽を作りました。
ねえ、ジェンは「インタラクティブアバター」という新機能も発表しました。
彼らはこれにより、あなた自身のアバターを作成し、そのアバターがあなたの代わりにズーム会議に参加できるため、同時に何千もの会議や授業などに出席できると主張しています。
あなたはそれに、あなたが物事にどのように反応するかに関する情報を与えて訓練します。
あなたはそれを顔や声、その他の要素で取引します。
いわゆる、それは会議に参加し、実際にその会議でやり取りをすることができると言われています。
それはあなたの考え方や話し方、そしてあなたが提供する追加の文脈やデータに基づいておそらくどのように反応するかを知っているでしょう。
私はまだこれを試していません。
私の親友の一人、ブラッド・コスタンゾは実際に試しました。
彼は実際にこれらのアバターの一つを使ってズームミーティングに参加しました。
これが彼の体験です。
あなたはビジネスコンサルタントですよね?
ビジネスコンサルティングにおけるあなたの経験は何ですか?
私はあなたのサポートをするAIビジネスコーチとしてここにいます。
私の焦点は、あなたが課題を分析し、戦略を立て、目標を達成するための具体的なステップを踏む手助けをすることです。
そのリードジェネレーション戦略を一緒に取り組みましょう。
あなたのターゲットオーディエンスは誰ですか?
大企業の経営者です。
了解しました。
大企業の経営者をターゲットにするのは賢いアプローチです。
彼らとつながるために、ネットワーキングイベントやLinkedInでのアプローチを考えたことはありますか?
効果的な戦略をいくつか考えてみましょう。
もちろん、考えました。
しかし今は、あなたを中断して、あなたがどのように反応するかを見ているところです。
お尋ねしてもよろしいでしょうか。
リードジェネレーションのために、LinkedInを使用せずに経営者をターゲットにする最も良い方法は何だと思いますか?
問題ありません。
テストに感謝いたします。
LinkedIn以外では、ウェビナーやワークショップを開催することが、経営者を引き付ける素晴らしい方法となることがあります。
あなたを専門家として位置づけ、エンゲージメントを生み出します。
どう思いますか?
あなたはかなり優れています。
これは、もう少し試してみて、実際に動かしてみる必要がありそうです。
今日の早い時間に自分で使おうとしたとき、サーバーが過負荷になっていて、セッションが多すぎるとずっと表示されていたので、実際には入って使うことができませんでした。
しかし、私はこれを試してみるつもりであり、おそらくこの件に関する私の発見についてのビデオを作成するつもりです。
さっそく迅速に進めていきましょう。
今週私が興味深いと感じたAIの世界の他のニュース項目をたくさん紹介します。
まずはMetaから始めましょう。
Metaは、CoTracker 3の新しいAI研究を発表しました。これは、単一のビデオ内で個々の要素を追跡するのを非常に簡単にするモデルです。
これは多くのビデオ編集に役立つでしょう。
何かを追跡する必要があるとき、追跡しているものに何かを固定することができます。
彼らは、これらのビデオの3D空間で何が起こっているのかを追跡する能力がどんどん向上しています。
Hugging Faceのデモがあり、そこで自分で試すことができます。
この丘からパラグライダーで飛び降りる男性のビデオを取り込むとします。
彼の全体にポイントを追加することができます。
彼の頭にポイントを置いたり、ここにある小さなリュックサックにポイントを置いたりできます。
彼の手に一つ、両足に一つずつポイントを置きましょう。
こちらの側に一つ置いてからトラックをクリックすると、点が私が置いたドットと同じ3D空間の位置を追いかける動画が作成されるのがわかります。
メタについて話しているので、これを言及しようと思いました。
ブラムハウスが短編映画に関するメタとの提携でAIを試験しています。
先週、私はメタムービージェンについて話しました。
この会社、ブラムハウスは、ケイシー・アフレックやアニッシュ・ギガンティ、スパーロック姉妹のような映画製作者と共にメタムービージェンを使用しています。
ここにはあまり詳細がありません。
これらの映画がいつ公開されるのかは完全にはわかりませんが、ハリウッドの多くの人々がAI技術を受け入れ、これらの企業を訴えて消滅させようとするのではなく、前向きに取り組んでいるのを見るのは励みになります。
NVIDIAは今週、新しいオープンソースモデル「LAMA 3.1 Nemotron 70B Instruct」を静かにリリースしました。
この新しいモデルは、実際にGPT-4 Turbo、Cloud 3.5 Sonnet、GPT-4oなど、これらのベンチマークにおいて最新のo1モデルを除くほぼすべての大規模モデルを上回ることに成功しました。
彼らが静かにリリースしたと言うのは、ニュース記事を出さなかったからです。
彼らはそれに関する動画も作成しませんでした。
私自身、NVIDIAがそれについてツイートしたかどうかもわかりません。
私にとって、これらのオープンソースモデルが現在存在する最先端モデルにほぼ追いついているのは驚くべきことです。
現在市場に出ている唯一の優れたモデルはo1で、それはクローズドソースモデルです。
実際、これは多くの他のクローズドソースモデルを上回っています。
それは非常に印象的です。
大型言語モデルについて話しているので、Mistralも今週、ノートパソコンやスマートフォン向けに最適化された新しいモデルをいくつか発表しました。
それらはMiniStroll 3BとMiniStroll 8Bと呼ばれ、コンテキストウィンドウは128,000トークンで、約50ページの本を取り込むことができます。
これらは小型モデルであるため、理論的にはデバイス上で直接推論を実行できるようになります。
データをクラウドに送信して処理し、応答を得る必要はありません。
理想的には、あなたの携帯電話やノートパソコンで直接行えるようになるでしょう。
OpenAIはしばらくの間ChatGPTのデスクトップアプリを提供していますが、これはMacを使用している場合にのみ利用可能です。
今週、彼らはWindows用のデスクトップアプリを公開しました。
openai.com/ChatGPT/downloadにアクセスすると、Windowsアプリの初期バージョンを試すオプションがあることがわかります。
それをクリックすると、ダウンロードできます。
私たちは今、ブラウザのPerplexityの中ではなく、別のデスクトップアプリでお馴染みのChatGPTインターフェースを手に入れました。
今週は、内部知識検索やスペース機能を搭載したかなりクールなアップデートもありました。
これを確認してみましょう。
こちらのPerplexity.aiに行くと、左のサイドバーに「spaces」という新しいリンクがあります。
スペースを作成すると、タイトルを付けることができます。
これを「テストスペース」と呼び、使用したいモデルを選びましょう。
私はまだCloud 3.5 Sonnetを使うのが好きで、CloudやChatGPTと同様にカスタム指示を与えることができます。
続けてクリックして、テストスペースに入ってみましょう。
ここでファイルを追加するオプションがあります。
これは通常のPerplexityと同じように機能しますが、PDFやテキストファイルなどを通じて追加のコンテキストを加えることもできます。
これは、クラウドプロジェクトやカスタムGPTの力を組み合わせつつ、Perplexityのウェブ検索機能やマルチ検索エージェント機能を活用するものです。
これはかなり面白いことになるでしょう。
この機能はまだあまり触れていませんが、私がこのビデオを録画している日にリリースされたばかりなので、これから深く掘り下げてみるのがとても楽しみです。追加のファイルや検索にコンテキストを加えて、どんな結果が出るのか見てみたいと思っています。
NotebookLMにもアップデートがありました。
ここ数週間、私のチャンネルを見ている方は、私がNotebookLMの大ファンになったことをご存知でしょう。
このツールは、文書をアップロードしたり、YouTubeの動画を取り込んだり、記事を取り込んだりして、それらの記事とチャットできるものです。
よくある質問を作成したり、ブリーフィングドキュメントを作成したり、さらには収集した情報をもとに小さなオーディオポッドキャストを作成することもできます。
彼らは新しい機能を導入しました。新しいノートブックを作成し、ここにPDFを取り込むために、私のノートブックガイドをクリックしましょう。
ポッドキャストを生成したい場合、ポッドキャストを生成するためのボタンがありますが、今はカスタマイズボタンもあります。
これは全く新しい機能です。
カスタマイズをクリックすると、実際にポッドキャストのホストに追加の情報を提供することができます。
長い本をアップロードして、「この本の第2章で何が起こっているかについて話してください」と言うことができます。
あるいは、このポッドキャストを面白くして、この情報についてたくさんのジョークを交えてもいいです。
または、ポッドキャストを返してくれたときには、私が5歳の子供のように、ほんとうに、ほんとうにわかりやすく説明してください。
追加の指示やカスタム情報を与えることもできます。
PDF文書や、あなたがその側で提供する情報も含まれていますが、今ではその情報をどのように扱い、ポッドキャストでどのように議論するかも理解しています。
これはかなりクールな新機能でもあります。
Dropboxは今週、Dashという新しいAI機能を導入しました。これは、チームのためのAI駆動のユニバーサル検索です。
こちらをご覧いただくと、四半期ごとのビジネスレビューと入力すると、Dropbox内の四半期ビジネス情報に関連するすべての文書を検索します。
基本的には、AIを活用した大幅に改善されたDropboxの検索機能です。
Amazon広告は、広告主向けに新しいAIツールを発表しました。
これは、これまで多くのeコマースプラットフォームで見られているのと同じようなもので、販売したい商品の画像をいくつか提供すると、その商品を異なる環境で表示する他の画像を自動生成してくれる機能です。
彼らは、自分の画像を使って小さな動画を作成できることを誇示しました。
こちらのバージョンを見ると、マグカップが映っており、それがライブ画像に変わり、マグカップから蒸気が立ち上り、背景に波が見えるのです。
初期の製品を取り入れ、Amazonのリスティングで少し魅力的に見せるためのいくつかの方法です。
今週、Appleは新しいiPad miniを発表しました。これは、これまでのレビューや私が見たすべての情報をもとにAppleの知能を活用するように設計されています。
基本的には、以前のiPad miniとほぼ同じですが、新しいチップが搭載されており、まだ本格的には展開されていない新しいAppleの知能機能を利用するために設計されています。
それは、Appleの知能を使用するために設計されたiPad miniですが、Appleの知能はまだ完全には準備が整っていません。
しかし、それが整ったとき、このiPadはそれに対応できる準備ができています。
この会社Mtech Labsは、モーショントラッキング機能を備えたスマートグラスを発表しました。
これらのグラスには、リアルタイムの表情をキャプチャするためのミニセンサーが埋め込まれています。
目の周り、眉毛、頬、顎のラインの動きを含んでいます。
微妙な笑顔や食べ物を噛む際の顔のサインを測定することができます。
彼らはこれに対して、メンタルヘルスとダイエット追跡の2つの主要な応用を見ています。
あなたが幸せ、悲しい、フラストレーションを感じている、怒っているといったことを感知し、メンタルヘルスの目的で追跡することができます。
また、前面にカメラと噛んでいることを感知できるセンサーが搭載されるため、過食を防ぎ、食事のペースを落とすように促すことができます。
そのメガネはまだ利用可能ではありませんが、12月までに開発キットをリリースする予定です。通常、開発キットをリリースすると言う場合、それは非常に高価なバージョンが開発者向けにリリースされ、彼らが試してみるためのものです。
おそらく、消費者がこのような製品を実際に手に入れるまでには、まだしばらく時間がかかるでしょう。
最後に、これはAIとは何の関係もありません。
私はただこれが素晴らしいと思い、共有したいと思いました。
FTCは、企業が登録した際と同じくらい簡単に製品をキャンセルできるようにするための「クリックしてキャンセル」ルールを発表しました。
これは素晴らしいニュースです。なぜなら、オンラインでサブスクリプションに登録した後、キャンセルするためにファックスを送ったり、何かをカラスで送ったりしなければならないのが本当に耐えられないからです。
そのような行為は今後違法になるでしょう。
解約が加入と同じくらい簡単である必要があります。ジムの会員権のようなものも含めて。
それは素晴らしいことになるでしょう。
AIに関連している部分もあります。なぜなら、AIの世界では月額サブスクリプションを提供する製品が非常に多いからです。
これらのツールが、GoogleやMicrosoftのような大手企業が所有する単一の製品に統合されていく中で、彼らはおそらく多くのAI機能を提供することになるでしょう。
私たちは、一度だけ使用して会員費で購読しているこれらの製品を多くキャンセルしたいと思っています。
それが実現するのはとても楽しみです。
私はこの決定の大ファンです。
正直なところ、これはずっと前に起こるべきことだったように思います。
今週はこれが私の伝えたいことです。
たくさんのことがありました。
そのほとんどはAdobeからのもので、非常に素晴らしいロケットの打ち上げがありました。
とても刺激的な一週間でした。
物事が盛り上がり始めて、本当にワクワクして楽しい気持ちになっています。
今年の旅行は終わりましたが、ここ数週間は体調を崩していました。
私の動画は、これらの金曜日のニュース動画を除いて、私が望むほど一貫性がありません。
しかし、このチャンネルのために計画している楽しい動画がたくさんあります。
もしこのような内容が好きで、最新のAIニュースに常に目を光らせていたり、AIのチュートリアルやさまざまなツールの使い方に興味があるなら、最新の研究の動向を把握したいと思っているなら、この動画に「いいね」を押して、このチャンネルを購読してください。
私はあなたが情報を得られるようにします。
まだチェックしていない場合は、Future Tools.ioをぜひご覧ください。そこで私は最新でクールなAIツールを厳選しています。
AIニュースページを最新の状態に保ってください。
毎日最も興味深いAIニュースを知りたい場合は、こちらでご確認いただけます。
私は無料のメールニュースレターを提供しています。
登録していただければ、私の無料AI収入データベースをお送りいたします。これは、AIツールを使ってオンラインでお金を稼ぐためのさまざまな素晴らしい方法が詰まっています。
すべてはfuturetools.ioでご覧いただけます。
完全に無料です。
ぜひチェックしてみてください。それでは今回はこれで終わりです。ご視聴ありがとうございました。また、この動画をスポンサーしてくれたHubSpotにも感謝しています。本当にありがとうございます。皆さん、最後まで楽しんでくれてありがとう!次回お会いしましょう、さようなら!