【News! AIRS-Lab #113】　音楽生成AI「Suno AI」の威力、明日12/18のライブ講義、AIアートなど

2023年12月17日 22:21

皆様こんにちは、我妻です。

話題の「Suno AI」を使って、冬の曲を作ってみました。

話題の「Suno AI」を使って冬の曲を作ってみました。
作詞にはChatGPTを使用。
なかなかいい感じに仕上がりました。 pic.twitter.com/y65dL38igG
— 我妻幸長@12/13「生成AIプロンプトエンジニアリング入門」出版！ (@yuky_az) December 15, 2023

手軽にこんな本格的な曲が作れるなんて、音楽生成AIの発展は本当に著しいです。

今回は、明日12/18（月）のライブ講義、今週のAIニュース、制作したAIアート、Udemyコースの一部無料公開などについてお知らせします。
なお、この配信のバックナンバーは、noteの方で公開しています。

Udemyコース一覧はこちら。

GitHub Copilotを学ぼう！ Section3

明日12/18（月）の21時から、ライブ講義「GitHub Copilotを学ぼう！」 Section3が始まります。
GitHub Copilotを学ぼう！ Section3 【Live!人工知能 144】
YouTube Liveで配信します。

connpassの方でも参加者を募集しています。

Section3では、GitHub Copilotの様々な活用について学びます。
「GitHub Copilotを学ぼう！」は、人工知能（AI）でプログラミング作業を支援するツール「GitHub Copilot」の使い方を学ぶ講座です。
開発言語にVisual Studio Code、プログラミング言語に主にPythonを使用します。
Github Copilotは、AIを利用してコーディングの際にコードの補完や提案を行うツールです。
コードの文脈に基づいて、適切なコードを提案、生成することができます。
Python、JavaScript、TypeScript、Ruby、Go、C#、C++ など様々なプログラミング言語で利用可能です。
本講座では最初にGitHub Copilotの全体像を学んだ上で、環境設定、各機能、活用方法などについて、順を追って少しずつ学んでいきます。
AIの力を借りて、効率よくコーディングできるようになりましょう。

【今週のAIニュース】

直近のAI関連の話題に、我妻がコメントします。
Twitter（@yuky_az）、およびコミュニティ内での発言をまとめたコンテンツになります。

音楽生成AI「Suno AI」は、ユーザーが文章で歌詞や曲調を指定するだけで、瞬時に音楽を自動生成します。

多くのプロの音楽家からも驚きの声が上がっているほどの、高品質な音楽を作り出す能力を持っています。

米国に拠点を置くSunoが提供するこのサービスは、音楽家とAI専門家たちによって運営されています。
Google、Microsoft、Discordのアカウントを使用してアクセス可能で、現在はβ版が提供されており、1日に5回まで無料で音楽を生成できる他、有料プランも用意されています。
また、ジャケット写真の自動生成や動画、音声データとしてのダウンロード機能も備えています。

Suno AIは、X（旧Twitter）上でも話題になっており、多くのユーザーが作成した音源を投稿しています。
プロの音楽家からも高い評価を受けており、一部のアーティストは「少し手を加えればかなり売れる可能性がある」と評しています。

音楽は、「探す」時代から「生成する」時代へ移行中なのでしょうか。

最近のユーザーからのフィードバックによると、GPT-4のパフォーマンスに問題があるとされ、「怠け者」と表現されることが増えています。

これに対し、OpenAIは「修正を検討中」であると回答しました。

特にコード生成における問題が指摘されており、OpenAIのAPIプロダクトマネジャーは、これがバグであると認め、修正作業を進行中であると明かしました。
さらに、OpenAIはトレーニングプロセスについて詳しく説明し、同じデータセットを使用しても異なる性格や表現方法、さらには政治的偏見を持つモデルが生成される可能性があると指摘しました。

このような背景から、新しいモデルのリリースには、オフラインの評価指標とオンラインのA/Bテストを実施し、その後の改善をユーザーのデータに基づいて判断していることが明らかにされました。
このプロセスは、OpenAIによると「複数の人間による職人技のような作業」であるとのことです。

イーロン・マスク氏が立ち上げた「xAI」社から、新たなAI「Grok」が公開されました。
https://grok.x.ai/

このAIは、現在X（旧Twitter）のPremium Plusユーザー限定で利用可能で、特に長期間のユーザーから順に提供されています。

Grokとは？
Grokは会話が可能なAIで、リアルタイムの世界情報を持つとされています。
また、他のAIが避けるような質問にも回答するという特徴があります。
マスク氏は、以前OpenAIとの関係が決裂した後、批判的な立場からこの新たなプロジェクトを開始しました。

Grokの使用体験
ユーザーからは、Grokの発言が挑発的であるとの声もあります。
例えば、「僕をこき下ろして」というリクエストに対し、Grokは非常に辛辣な応答をしました。
一方、最新のAI関連情報についても詳しく反映しているとのことです。

言語対応と展開状況
Grokは日本語にも対応しており、マスク氏自身が日本語ユーザーへの重視を明言しています。
米国のX Premium Plusユーザーにはすでに利用可能で、他の英語圏ユーザー、そして日本語ユーザーへの展開が予定されています。

機能面の懸念
Grokの利用にはX Premium Plusへの登録が必要で、即時利用が可能かどうかは不明です。
また、ChatGPTなど他のAIが提供するコーディングやデータ分析といった機能についても、Grokでの対応状況はまだ詳しくわかっていません。

開発者向けAPIと今後の展望
Grok APIへのアクセスは、現在一部の開発者に限られています。
OpenAIやGoogle、Metaが行っているような広範囲なAPI公開の可能性は今のところ不明です。
また、AIの倫理面や人間への優しさについての議論も続いており、Grokを含めた各AIの今後の発展が注目されています。

人間の幹細胞から作られた脳オルガノイド（ミニ脳）を用いて、新しいタイプのコンピューティングシステム「ブレイノウェア」が構築されました。

インディアナ大学ブルーミントン校の、フェン・グオ氏らのチームによる研究成果です。

人間の脳は約860億個のニューロンと数兆個のシナプスで構成されており、それぞれが複雑に相互作用しています。
この複雑な構造に着想を得て、科学者たちは生物学的システムを模倣したハードウェアやアルゴリズムの開発に取り組んでいます。

ブレイノウェアでは、電極を通じて脳オルガノイドに電気信号を送ることで、情報処理が行われます。
このシステムは、日本語の音声認識にも対応し、8人の被験者の声を識別するテストでは、約78％の精度で成功を収めました。ただし、AIによる純粋なハードウェアベースのシステムと比較すると、まだ精度には劣ると指摘されています。

この研究は、将来のバイオコンピューティングの可能性を探る最初のステップとされています。
しかし、ジョンズ・ホプキンス大学のレナ・スミルノワ氏やブライアン・カフォ氏らは、この技術の高度化に伴う倫理的な問題にも注意を呼びかけています。
一方で、この研究が学習メカニズムや神経発達、神経変性疾患の影響に関する基本的な洞察を生み出し、新しい治療法の開発に役立つ可能性も示唆されています。

テスラは、ヒト型ロボット「Optimus」の第2世代モデル、「Optimus Gen 2」を公開しました。

この新モデルは前世代に比べて手足の動作がより滑らかで自然に見える特徴を持っています。

Optimus Gen 2の特筆すべき点は、手の部分に11DoFの自由度を持ち、10本の指をスムーズに動かし、細かい作業も可能になっていることです。
また、テスラ内製のセンサーとアクチュエーターの採用により、歩行速度が30%向上しました。
姿勢制御も改善され、屈伸運動の様子も確認できます。

外観においても約10kgの軽量化が図られ、より一般的なヒト型ロボットの形状に近づいています。
首部分には2軸のアクチュエーターが装備され、頭部の自由な動きが可能になっています。

しかし、現段階ではまだ、テスラが目指す「安全で、反復的または退屈なタスクを実行できる汎用の二足歩行ロボット」としての堅牢性には至っていないようです。
特に緊急時のバランス制御や衝撃吸収の面での改善が求められるでしょう。

さらに、人間のような作業能力を持つには、単に運動機能を強化するだけでなく、環境を分析・判断し適切な行動をとるためのAIやプログラムの進化も必要です。

デモ動画は大抵いいところだけピックアップされるので、実際の動作を目の前で確認したいところです。

果たして「超AI」の監視は誰が行うことになるのでしょうか。

OpenAIは、2033年までの10年間で人間を超える知性を持つ「超知性」AIの開発を推測しています。
この超知性の制御方法の研究に注力しており、スーパーアライメントチームを設立し、この分野での進展を報告しています。

特に注目されるのは、弱いAIモデル（例えばGPT-2）がより強力なAI（GPT-4など）をどのように制御できるかについての研究です。
GPT-2のパラメーター数は15億程度であるのに対し、GPT-4は約1760億と大幅に多いです。
この差異にもかかわらず、GPT-2がGPT-4の監督を行う実験が行われました。

結果として、GPT-4はGPT-2の指示に従いつつも、その性能を上回ることが明らかになりました。
これは「弱から強への一般化」と呼ばれ、強力なAIが、弱い監督者からの不適切な指示にもかかわらず、タスクを効果的に遂行できることを示しています。

しかし、この研究方法は概念的なものであり、ChatGPTのデータを用いた実験ではうまく機能しなかったとのこと。
スーパーアライメントチームはこの方法が超知性の制御に向けた第一歩であるとし、研究を進めるために1000万ドル規模の助成金制度を発表しています。

【今週のAIアート】

以下は、今週制作したAIアートです。
プロンプトの生成にはChatGPTを、画像生成にはMidjourneyを利用しています。

View this post on Instagram

A post shared by 我妻幸長 (@yuky_az)

審美眼とプロンプトのセンス、さらに磨いてきたいです。

【Udemy動画の一部無料公開】

Udemyコースの動画の一部は、YouTube上で無料公開されています。

【書籍】

AI関連の書籍を、これまでに何冊か出版してきました。

Amazonの著書一覧はこちら。

現在も、新しいAI関連の書籍を執筆中です。

今週のコンテンツは以上になります。
ご意見、ご感想、ご要望などがありましたら、ぜひ気軽にコメントをください。
AIコミュニティ「自由研究室 AIRS-Lab」、メンバー募集中です。

いいなと思ったら応援しよう！

よろしければサポートお願いします！いただいたサポートはクリエイターとしての活動費に使わせていただきます！