- 運営しているクリエイター
#Llama
Google Colab で LongWriter を試す
「Google Colab」 で「LongWriter」を試したのでまとめました。
1. LongWriter「LongWriter」は、従来のLLMが生成可能なテキスト長を大幅に超える、最大10,000ワードの文章を生成することが可能なモデルです。一般的なLLMが2,000ワード程度の出力に限られていたのに対して、非常に高品質な長文の生成能力を持ちます。
2. Colabでの実行Colabで
Llama3.1をローカルで動かしてみた。完全版
ローカルで動かすこともできる最新のオープンソースLLMを動かしました。
モデルは以下の
Llama-3.1-8B-Instruct-Q4_K_M.gguf
です。動かすことはできましたが、普通じゃない動きです。以下レポート。
Metaのサンプルコードを動かす。これが動かない。オリジナルのコードはモデルを自動ダウンロードしてくれないし、CLIでも落とせない。なぜなんでしょうね。他のモデルだと簡単
RouteLLM: LLM(大規模言語モデル)の使用コストを最適化するフレームワーク
本記事は、LLM関係の論文を紹介する記事になります。
LLMのルーティングを取り扱った論文先日、以下の記事を書きました。
LLM(大規模言語モデル)をまるでドラゴンボールの「元気玉」のようにみんなで協力し合って作るという論文「The Future of Large Language Model Pre-training is Federated」を紹介したものです。なかなか面白い内容でした。
GPT4 より性能がいいオープンソースのモデルについて
少し前までは Open AI の GPT4 が支配してた感じがする LLM 界隈も、状況が完全に変わって様々な LLM が跳梁跋扈する戦国時代になっています。
ここではその中でもオープンソースの LLM をメインにして解説してみます
GPT4 よりいいと言われているモデル以下は GPT4 より性能がいいと言われているモデルです(指標によっては同等以上ということです、GPT4 のバージョンによっ