見出し画像

Aiニュース:IBM Granite LLMがLlama-3.1を上回り、ComfyUI V1デスクトップアプリケーションがリリースされ、LLMとAGIが変更点を語る”

LLM と AGI の進化

人々は、大規模言語モデル (LLM) とそれが汎用人工知能 (AGI) にどれだけ近づいているかに非常に興奮しています。2023 年には、もうすぐそこまで来ており、超スマートなシステムを作成するにはこれらのモデルを大きくする必要があるだけだと考える人もいました。しかし現在、専門家は、それはそれほど簡単ではないと言います。AGI を作成するには、モデルを大きくするだけでは不十分です。LLM が AGI に近づく前に、LLM を支援する追加のツールとシステムが必要です。

ComfyUI V1 デスクトップ アプリがリリースされました

ComfyUI がデスクトップ アプリの新バージョンをリリースしました。Windows、macOS、Linux のいずれでも、非常に簡単に使用できます。クリック 1 回で、PYTHON 含むすべてをインストールできます。最も優れている点は、技術に詳しくない人でも誰でも使用できるように作られているため、複雑なセットアップが不要であることです。詳細については、ComfyUI の発表をご覧ください。3

IBMのGranite LLMファミリーがリード

IBM は Granite LLM ファミリーの 3 番目のバージョンを発表し、新しい基準を打ち立てました。80 億と 20 億のパラメータを持つこれらのモデルは、さまざまなベンチマークで Llama-3.1 8B などの同様のサイズのモデルよりも優れています。これらはパワフルなだけでなく、エネルギー効率も高く、難しいタスクも簡単に処理します。最近の Twitter 投稿で強調されているように、IBM の WatsonX プラットフォームで見つけることができます。

Microsoft の BitNet b1.58: LLM にとって大きな一歩

Microsoft の BitNet b1.58 が大きな注目を集めています。特別な 1 ビット設計を採用しているため、はるかに高速でエネルギー効率に優れています。旧モデルに比べて 6 倍高速で、最大 82% のエネルギー消費を削減できます。この新しい設計により、LLM の動作が改善されています。

ZyphraAIの複合AIシステム

ZyphraAI は、長期記憶や強化学習などの特定のコンポーネントを改善することでモデルのパフォーマンスを向上させる高度な AI システムを立ち上げました。同社は、CPU のみを使用して、通常の LLM を最大 10 億のコンテキスト ウィンドウに拡張できるシステムも構築しました。

MASAI: ソフトウェアエンジニアリングのためのモジュール型 AI

MASAI は、ソフトウェア エンジニアリング用に設計された新しい AI ツールです。複雑な問題を小さなタスクに分割し、それぞれを専門の LLM エージェントで処理します。これにより、困難な問題を簡単に解決できます。rohanpaul_ai の投稿で詳細をご覧ください。

AIがコード開発の時間を節約

Claude や GPT-4 などの AI モデルは、開発者が困難なコーディング タスクや反復的なコーディング タスクを処理することで、時間を 20% ~ 30% 節約するのに役立っています。

AIが合成データを生成する

LLM は、 AI モデルの改善に重要な合成データを生成するスキルを披露しています。これは、検索拡張生成 (RAG) のようなシステムの構築に特に役立ちます。Elvis は、これがどのように機能するかを共有しました

がん検出におけるAIの成功

CHIEFと呼ばれる新しいAIモデルは、画像から腫瘍の特徴を予測する精度を96%達成しました。ハーバード大学の研究によると、これは癌検出における大きな前進です。

NVIDIA の Llama-3.1-Nemotron-70B がベンチマークで輝く

NVIDIA の Llama-3.1-Nemotron-70B-Instruct モデルは、Arena Hard ベンチマークで素晴らしい結果を記録し、最高性能の LLM の 1 つであることを示しています。

回転位置埋め込み (RoPE) は、LLM が単語の位置をよりよく理解し、よりスマートになるのに役立ちます。Jia-Bin Huang 氏は、これが LLM の将来をどのように形作っているかを説明しました。

CT Foundation: Google の新しい医療画像ツール

Google は、CT スキャンを小さくて有用なデータに処理する CT Foundation という新しいツールを開発しました。これは、医療用画像処理に革命をもたらす可能性があります。

Google の山火事予測が賞を受賞

Google の研究者は最近、機械学習を使用して山火事の広がりを予測する研究で、名誉あるハリー C. ビグルストーン賞を受賞した。ジェフ・ディーン氏が Twitter で詳細をシェアした。

新たな研究によると、トランスフォーマーベースのニューラルネットワークは、従来の検索方法を使用せずにグランドマスターレベルでチェスをプレイできるようになりました。これは、AI 能力の大きな前進です。

OccamLLMがNeurIPS 2024に合格

言語モデルによる演算処理を簡素化する新しい手法である OccamLLM は、その革新的なアプローチにより、NeurIPS 2024 での発表が承認されました。

xai API がリリースされました

Replit は、数秒でチャットボットを作成できる xai API をリリースしました。さまざまなビジネス プロファイル用のすぐに使用できるテンプレートにより、チャットボットの設定がこれまで以上に簡単になりました

ロボットシェフAI人形を開発

最近のハッカソンで、Team Yes Chef は会話音声インタラクションを披露する AI 駆動型ロボット シェフを作成しました。これは AI 駆動型ロボット工学におけるエキサイティングな一歩です。

AIとロボット工学の大きな進歩

NVIDIA、Boston Dynamics、OpenAI など、AI とロボット工学の大手企業は最近、大きな進歩を遂げています。これらの開発により、機械が実行できることの限界が押し上げられています。

https://twitter.com/adcock_brett/status/1848275585090363887

エージェント推論:仕事の未来

エージェント推論は、SaaS (Software as a Service) でタスクを自動化することで、仕事に対する考え方を変えています。Sonya Huang と Pat Grady が論じたように、この変化により 10 兆ドル規模のビジネス チャンスが生まれると予想されています。

新たな最大の素数が発見される

メルセンヌ素数として知られる新たな最大の素数が発見されました。数学の世界では今が興奮の時です!

https://twitter.com/hardmaru/status/1848386052328914961

Hugging Face の Arxiver データセット

138,000 件を超える arXiv 論文を含む新しいデータセットが Hugging Face に公開され、誰もが学術研究にアクセスしやすくなりました。

ドリューの AI ユースケース フレームワーク

Drew の AI フレームワークでは、AI ツールを 3 つのカテゴリに分類しています。gods (人間に代わるツール)、interns (特定のタスクを支援するツール)、cogs (単一目的のツール) です。このフレームワークは、各 AI ツールがどこに当てはまるかを説明するのに役立ちます。

Hugging Faceに統合されたBitNetアーキテクチャ

Hugging Face は、Microsoft の BitNet アーキテクチャをトランスフォーマー ライブラリに追加し、パフォーマンスと効率の両方を向上させました。

ステーブルコインにおけるブリッジとストライプのコラボレーション

Bridge と Stripe は提携してステーブルコインを裏付けとした金融商品の開発に取り組み、ステーブルコインがより多くのユーザーに届くよう支援します。

誤情報に対抗するためAI用語を明確にする

イーサン・モリック氏は、主要な AI 用語の明確な定義が欠如していることで、この分野で誤った情報が流れる可能性があると指摘しました。これは、今後 1 年間で注意が必要なことです

HuggingFace & Github: プロジェクトとオープンソース

こんにちは2

Hallo2 は、サウンドを使用してアニメーション ポートレートを作成することに焦点を当てたクールなプロジェクトです。オープン サイエンスとオープン ソースの考え方を推進しています。目標は、長持ちする高品質のアニメーションを作成することです。さらに、Accelerate フレームワークを使用して分散トレーニングを設定するためのサポートも提供しています。社会的リスクが伴いますが、責任ある使用を促進するための倫理ガイドラインも作成されています。

リブレFLUX

LibreFLUX は FLUX.1-schnell の Apache 2.0 バージョンです。完全な T5 コンテキスト長とアテンション マスクをサポートします。このバージョンは微調整が簡単で、見た目の美しさよりも実用性に重点を置いています。ユーザーは HuggingFace を使用してパラメータを調整および最適化できます。

大規模言語モデルとテクノロジー

ラマ-3.1-ネモトロン-70B-報酬

このモデルは、大規模言語モデル (LLM) からの回答の精度を予測するのに役立ちます。HuggingFace とうまく連携し、自動アライメント テストで優れた結果が得られます。このモデルを実行するには、少なくとも 2 つの 80 GB GPU と 150 GB のディスク容量が必要です。これは、これらの大規模モデルにどれだけのパワーが必要であるかを示しています。

Llama3-8B-1.58 モデル

これらのモデルは、LLM テクノロジーの大きな飛躍を示しています。BitNet 1.58b アーキテクチャで高度な量子化技術を使用し、1,000 億のトークンを処理しました。これは、量子化がパフォーマンスを高く維持するのにどのように役立つかを示しています。

テクノロジープラットフォームとツール

直接

Directus は、あらゆる SQL データベースをヘッドレス CMS に変換する無料ツールです。PostgreSQL、MySQL、SQLite などのさまざまなデータベースで動作します。Directus はすぐに使用できる API と最新のダッシュボードを提供するため、使用するのに特別なスキルは必要ありません。Directus Cloud を使用すると、わずか 90 秒で新しいプロジェクトを開始できるため、迅速かつ簡単に成長できます。

レディット

ComfyUI V1のご紹介

ComfyUI V1 は、Stable Diffusion でのワークフローのインストールと管理を簡単にする新しいデスクトップ アプリケーションです。ユーザーの声は次のとおりです。

ユーザー エクスペリエンスの改善:新しいインターフェイスには、テンプレート ワークフロー、ノードのあいまい検索、ナビゲーションを向上させるサイド メニュー バーが備わっています。

カスタム ノード レジストリ (CNR):公開されているノードは 600 個以上、バージョンは 2000 個以上あり、安全性を保つためにセキュリティ チェックが計画されています。

互換性とパフォーマンス:ユーザーは GPU のニーズと、A1111 などの他のインターフェイスと比較したパフォーマンスに興味を持っています。ユーザーは、より高速な速度を実現するために、ROCm サポートと xformers を望んでいます。

データプライバシーに関する懸念:一部のユーザーは、アプリが自分のコンピューターからデータを収集するかどうかを心配しています。彼らは、データの取り扱い方法の透明性の必要性を強調しています。

コミュニティからのフィードバック:ユーザーはワークフローのインストールと管理が簡単であることを高く評価しており、ワークフローのバージョン管理やクラウド バックアップなどの改善を提案しています。

https://www.reddit.com/r/StableDiffusion/


この記事が気に入ったらサポートをしてみませんか?