
Open Interpreter - 自然言語でコーディングを実現するオープンソースツール
Open Interpreterは、自然言語でプログラミングができるようになる、興味深いオープンソースツールです。機能呼び出し型の大規模言語モデルを利用して、Python、JavaScript、Bashなどのコードをローカルで実行できるのが大きな特徴です。インストールと利用は簡単で、コーディング作業の効率化を図れそうなツールです。
Open Interpreterとは
Open Interpreterは、GPT-3.5やGPT-4またはCode Llamaなどの大規模言語モデルを利用して、自然言語でのコード実行を可能にするオープンソースのツールです。
コマンドラインインターフェース上で言語モデルと対話することで、PythonやJavaScriptなどのコードをローカルマシン上で実行できます。複雑なロジックのコーディングもステップごとに指示できるので、開発効率の大幅な向上が期待できます。
公式ドキュメントによると、写真/動画/PDFの編集、データ分析、ウェブブラウザの制御など、高度なタスクも自然言語で指示できるとのことです。
主な特徴
Open Interpreterの主な特徴は以下の通りです。
自然言語での操作が可能
GPTモデルを最大限に活用
ローカル実行なので制限が少ない
インターネットに接続可能
状態はセッション終了後も保持
ChatGPTのAdvanced data analysis(Code Interpreter)との比較
ChatGPTのAdvanced data analysisは次のような制限があります:
GPT-4の有料プランが必要で月額料金がかかります
インターネットアクセスが制限されています
アップロードできる容量が100MBに制限されています
実行時間に120秒の制限があります
一方、オープンインタープリターは以下のようなメリットがあります:
インターネットアクセスが可能で、制限がありません
パッケージのインストールに制限がなく、自由にできます
状態はセッション終了時にクリアされないため、履歴を保持できます
ストレージ機能があり、過去のプロジェクトと対話できます
GPT-4だけでなく、他のモデルも利用できます
このように、オープンインタープリターは自由度が高く、制限が少ないため、より高度なコーディングアシスタントとしての利用が可能だと言えます。ChatGPTのそれに比べて機能的に優れている点が示されています。
インストール&利用方法
公式リポジトリからCloneした後、Pythonで簡単にインストールできます。
※ Python 3.10以上が必要です。
pip install open-interpreter
OpenAI APIキーの設定
このステップでは、オープンAIのAPIキーを提供する必要があります。この場合、OpenAIのキーを使用しないのであれば、llamaを使用するだけで、ステップをスキップして先に進むことができます。
インストール後はinterpreterコマンドで対話的なセッションを開始できます。
interpreter
Pythonスクリプトからは、interpreter.chat()メソッドで利用できます。
import interpreter
interpreter.chat("自然言語でコーディング作業の指示")
このように、自然言語でコーディングの手順を指示することで、対応するコードが実行されます。
YouTubeで紹介している動画を見つけました。英語ですが参考にご覧ください。
安全上の注意
生成されたコードはローカル環境で実行されるため、ファイルやシステム設定と相互作用する可能性があります。
予期しない結果につながる可能性もあるので、Open Interpreter ではユーザーに事前の確認を求めます。
注意して使用するか、Google Colab や Replit などにより安全な環境で実行してください。
「interpreter -y」とフラグをつけると確認手順を飛ばして、全部任すこともできる。
Google collabには様々なタイプの例がたくさんあり、実際に実行するのはとても簡単です。
Replitでのインストール方法
1. Replitを開き、新しいPythonのリプリットを作成します。
2. 「Shell」タブを開きます(画面の右側にあるはずです)。
3. Shellに `pip install open-interpreter`と入力し、Enterキーを押します。
これにより`open-interpreter`パッケージがReplit環境にインストールされます。
その後、Pythonファイル内から以下のように利用することができます:
python
import interpreter
interpreter.chat("Plot APPL and META's normalized stock prices") # 単一のコマンドを実行
interpreter.chat() # 対話的なチャットを開始
実行するコードはReplit内で走りますが、結果はターミナルに出力されます。なお、コマンドをリアルタイムで承認する需要性があるときは、表示される指示に従ってください。
利用例:
Create a tic tac toe game. とプロンプトを入力して三目並べゲームを作ってもらいました。yキーを数回クリックしただけですw
https://appfav.net/games/tictactoe.html
有望なオープンソースツール
Open Interpreterは、自然言語インターフェースとGPTモデルを活用したコーディングを実現する有望なツールです。
ローカル実行なので制約が少なく、開発効率の向上が期待できます。興味のあるエンジニアはぜひ試用して、生産性の向上を体験してみてください。オープンソースプロジェクトなので、貢献することも可能です。
まとめ
どのような動作をするかをまず安全に試すなら、Google Colab や Replitで起動してみると良いが、本領を発揮するのはターミナルで起動です。docker使うと安心でしょう。
この記事が気に入ったらチップで応援してみませんか?