となかい

学生、のんびりLLMとか機械学習とかの研究をしてます。 ブログ調の記事は読みづらいと思…

となかい

学生、のんびりLLMとか機械学習とかの研究をしてます。 ブログ調の記事は読みづらいと思ってるので箇条書きで淡々とした手順メモを目指します。

最近の記事

TeXで論文書くときの備忘録

Algorithm\usepackage{algorithmic} \usepackage{algorithm} \begin{figure}[!t] \renewcommand{\algorithmicrequire}{\textbf{Input:}} \renewcommand{\algorithmicensure}{\textbf{Output:}} \begin{algorithm}[H] \caption{} \label{} \begin{algorit

    • ABCI上でDeepSpeedを使ったLLMの学習を実行するまで

      7~8Bのフルパラメタチューニングは残念ながらA100 x 1枚(40GB VRAM)でも乗らない。 そこでDeepSpeedに頼ることに。 基本的にはこちらのnoteに従うと良い。 1. mpi4pyのinstallについて pip でinstallしようとするとwheel関係のエラーが生じた。元記事ではcondaでinstallしているが、ABCI上ではそうも行かない。 module load intel-mpi/2021.11 pip install mpi4p

      • Mixture of Agents(MoA) 実践!

        何かと話題の「LLMをたくさん用意して組み合わせる系」の研究。 Mixture of Experts(MoE)に続き。 AlpacaEval2.0ベンチマークでGPT-4にオープンソースの組み合わせで勝利したとか何とか。https://github.com/togethercomputer/MoA 論文:https://arxiv.org/abs/2406.04692, Together AI 概要論文中の図です。 実装異なるLLM(共通していても可)の出力をつなげな

        • lit-gptでLlama2を学習してみたい

          注)結局学習が上手く行ったわけではないです。悪しからず。 (参考記事) https://zenn.dev/if001/articles/6c507e15cd958b https://zenn.dev/syoyo/articles/52f1d0d62fcad5 ←似た取り組み https://github.com/OpenLLM-France/Lit-Claire/blob/main/pretrain.py#L245 (環境) NVIDIA A100 (80GB) 4台

        TeXで論文書くときの備忘録

          arXivへの論文投稿!

          手順arXivにログイン. Submission. Overleafの右上の「Submit」からarXivを選択し, 1. Download zipをクリック. zipファイルをarXivのページからアップロード いらないファイルはDeleteボタンで削除する. Macの場合, .DSStoreとかは児童削除される. 画像ファイル(PNGなど)がある場合は, 追加でアップロードする必要がある. そのまま進み, コンパイルが成功すればOK. 失敗した場合は「Faile

          arXivへの論文投稿!

          RetNetを動かしてみる

          まずはこちらのブログの再現を試みる. 環境はUbuntu, GPUは80GB VRAMのNVIDIA A100x4台(全ては使ってない) 学習(18時間程度)学習データはfairseqのwikiText-103. 2023-10-02 05:22:01 | INFO | fairseq_cli.train | done training in 65489.0 secondsEnd Time: 1696224124.1143923Training time in seco

          RetNetを動かしてみる

          ChatGPTに聞いてみた!究極の質問

          なんかグダグダ言ってますねーひとことで答えさせると…模範回答っぽいものが得られました。

          ChatGPTに聞いてみた!究極の質問

          【寝落ち電話】iPhoneで通話を自動で切る裏技

          寝る前のLINE通話….朝までつなぎっぱだと電池, 通信がもったいなかったり, 意図せぬいびきを恋人に聞かれたりします…そんな時の裏技。 1. 「ショートカット」アプリを開く iPhone(iOS13以上)に標準でインストールされているApp「ショートカット」を開きます。 下のタブの中央「オートメーション」をタップしてこのような画面を開きます。 「個人用オートメーションを作成」をタップ。 2. 時刻設定する時間指定で起動するオートメーションを作成します。 「時刻」を

          【寝落ち電話】iPhoneで通話を自動で切る裏技

          自作モデル/データセットをHuggingFaceにアップロードする手順の例

          このやり方は, huggingface-cliであらかじめloginしておいてからコード内でpush_to_hubを実行することでHugging Faceリポジトリにアップロードする方法(便利). 他にもブラウザでアップロードする方法とかもあるにはありそう. モデルのシェア手順 Huggingface上でリポジトリを作っておく. 自分のページ >「New +」 > Model > model_nameを入力 > 作成 Huggingface CLIでloginしておく.

          自作モデル/データセットをHuggingFaceにアップロードする手順の例

          論文管理ツールZoteroのインストール

          2023年時点, 論文管理ツールはZotero一択らしいので実際に使ってみる. 他のツールとの比較Zotero … ほぼ無料で使える. 事前設定がやや面倒. Mendeley … 2022.8に終了 Paperpile … 月額約3ドル Notion … 論文管理に特化されていない. 無料. 想定・ブラウザはSafari, PCはMacbook. ・iPadでも見たり, Goodnotesで書き込んだりしたい. PC2台もち. ・論文はTeXで書く. セットアップ手順Z

          論文管理ツールZoteroのインストール