wakaba(keita) : 生成系AI好き

wakaba(keita) : 生成系AI好き

最近の記事

ClaudeでPDF support(deta)が便利

人工知能モデルのClaudeが、新たにPDFサポート(ベータ版)機能を導入してました。 この機能により、ユーザーはチャットボットを通じてPDFファイルの内容を理解・分析することができるみたいです。 PDFサポートの特徴多様なコンテンツの理解 ClaudeはPDF内のテキストだけでなく、画像、チャート、テーブルなどの視覚的なコンテンツも理解します。 使い方は簡単PDFをアップロード チャットボットのインターフェースから、解析したいPDFファイルをアップロードします。 質問を

    • GoogleのAIコードエディタProject IDXが開発で快適だった

      最近、Googleが発表したAIコードエディタ「Project IDX」を使ってみました。このツールは、開発者にとって非常に便利で、快適なコーディング体験を提供してくれます。以下に、その特徴と利点について詳しく述べていきます。 VS Codeに似たインターフェース Project IDXは、人気のあるコードエディタであるVS Codeに似たインターフェースを採用しています。 VS Codeに慣れている開発者にとっては、使いやすいツールになっています。 直感的な操作が可能で

      • AIの嘘(ハルシネーション)より人間のほうがハルシネーションしてる件

        はじめに 最近、AIの発展に伴い、「AIが嘘をつく」という話題が注目されています。 特に、AIの生成する情報が事実と異なる場合、これを「ハルシネーション」と呼びます。しかし、実際には人間も記憶違いや感情に基づいて嘘をつくことが多いのです。 AIの嘘(ハルシネーション) AIが生成する情報が誤っている場合、これは主に学習データやアルゴリズムによるものです。 AIは膨大なデータを基に学習しますが、その中には誤った情報や偏ったデータも含まれています。そのため、AIが生成す

        • Geminiで画像生成(imagen3)を利用できるようになった件

          Geminiで画像生成(Imagen3)が利用可能に2024年10月、GoogleのAIプラットフォーム「Gemini」に新たに画像生成機能「Imagen3」が追加されました。この機能は、ユーザーがテキストから高品質な画像を生成できるもので、特にクリエイティブなプロジェクトやデザイン作業において大きな可能性を秘めています。 ただし現状だと下記に注意が必要です 風景などの画像は作ることができるが、人物の生成はできません。(アニメ調のイラストでもダメみたいです) Imagen

          0から始めるAI生活:AI紹介第2弾

          テキスト生成天秤AI 無料で使えるチャット型のAIサービス Chat GPT、Gemini、Claudeの比較ができるようになっているので一度で複数の回答を得ることができるのも特徴です 3Dモデル生成AITripo AI for Web そこそこの高クオリティの3Dモデルが作れるサービスです。 画像からの生成をできますが、人のモデルなどはまだまだな感じですが、騎士は高クオリティに作ることができてました。 ルマAI Tripo AI for Webには及びませんがそこ

          0から始めるAI生活:AI紹介第2弾

          検索AIについてまとめ

          AIの紹介前にAIを使って作ったアプリがリリースできましたので紹介します Apple ios https://apps.apple.com/app/id6730124046 Google Android 検索AIについて 最近は、AI技術の進歩により、従来の検索エンジンを超える能力を持つ検索AIが登場し、情報収集の方法に革命をもたらしています。 ここでは、Genspark、Storm、Feloという3つの注目すべき検索AIについて解説します。 Gensparkh

          検索AIについてまとめ

          Dify公式がo1を再現したデモを紹介してた件

          okooo5kmさんがOpenAI o1 に搭載されているとする思考連鎖ワークフローを構築したとのポストをDify公式のXにて紹介されていましたので紹介します。 o1の思考連鎖フレームワークを使ったフレームワークを改造して日本語版を投稿している方もいます。 これらを行うことでDifyでもo1に近いものを使うことができるようになると思います。 筆者は、このフレームワークのモデルをGeminiに置き換えて作ってみました。 Gemini でも問題なく高性能に使えてると思います

          Dify公式がo1を再現したデモを紹介してた件

          オフラインのパソコンでAIを使う方法 : LM Studioの活用ガイド

          はじめに今回はある程度高性能なPCがある人に向けて作ります。 WEBサイトで使うAIは個人情報を送ると学習に使用されてしまう可能性があり、渡すことがためらわれます。 そこでPCで実行可能なAIを簡単に使うことができるソフトとしてLM Studioを紹介します。 LM StudioとはLM Studio(Language Model Studio)は、大規模言語モデル(LLM)をローカル環境で実行できるオープンソースソフトウェアです。以下の特徴があります オフライン環境での

          オフラインのパソコンでAIを使う方法 : LM Studioの活用ガイド

          初めての人でもわかるGPT(AI)ガイド:0から始めるAI生活編

          ChatGPTを使った生活を始めるためのガイドを以下に示します。このガイドでは、ChatGPTの基本的な使い方から、実際の活用方法までを詳しく解説します。 はじめに : ChatGPTとは?近年、人工知能(AI)の進化は目覚ましく、その中でもChatGPTはよく聞くなまえだと思います。 ChatGPTは、OpenAIが開発した対話型AIで、人間の言葉を理解し、まるで人と話しているかのような自然な会話が可能です。 しかし、「AIって難しそう」「どうやって使うの?」と感じている

          初めての人でもわかるGPT(AI)ガイド:0から始めるAI生活編

          高価な有名ソフトの無料代替品!オープンソース活用ガイド

          初めにオープンソースを選ぶ理由について、以下のように記事の一項目としてまとめました。 作者が実際に触ったソフトもありますが、専門外や、高価なソフトを持っていないため比較できないものもありますのでご了承ください このサイトを参考にして作りましたのでこのサイトにも顔をだしてみてください。 入れ替える時の使ったことのあるソフトの代わりが納得のいくものだったため、この記事を参考にしました。 オープンソースを選ぶ理由オープンソースソフトウェア(OSS)を選択する理由は多岐にわたり

          高価な有名ソフトの無料代替品!オープンソース活用ガイド

          Difyのはじめ方 ナレッジ編

          ナレッジとはDifyではナレッジ、一般的にはRetrieval-Augmented Generation (RAG:ラグ)といいます。 大規模言語モデルの知識を補完するための外部データのことです。 わかりやすく人間で例えるのなら、本や、資料を読みながら返答をしているようなものです。 Difyでは、ナレッジにドキュメント(PDFや、テキスト、オフィス系のファイル)を追加することで、AIアプリケーションの回答の質を向上させることができます。 ナレッジの利点最新情報の反映: 言

          Difyのはじめ方 ナレッジ編

          Flutter×o1-previewで試しにTODOリストを形にしてみた

          前回の記事で下地ができたTODOリストを発展させてある程度形にしてみました。 UIの部分の実装しかしていませんのでご了承ください。 TODOリストに求められる要素をperplexityに聞いて出力してもらってから内容を選別してo1に引き続き質問しながら作成しております。 ご注意見た目とUIの動きの部分を作った物のためコードを使ってもすぐにアプリとして使うことはできないかと思います。 • データの永続化: 現在の実装では、アプリを終了するとデータは消えてしまいます。データ

          ¥300

          Flutter×o1-previewで試しにTODOリストを形にしてみた

          ¥300

          Flutterコーディング比較第2段 o1 vs gpt4o vs GeminiAdvanced 編

          はじめに前回の比較実験の振り返り 前回はToDoリストの内容を詳細に決めてコーディングさせた比較をしましたが、コードでエラーが多発して実行できなかったのです!! 今回の比較実験の目的と方法 今回は、「flutterでTODOリストを簡単に作って」のシンプルなプロンプトでどこまでのアプリが作れるのか実行可能なのかを確かめてみます。 比較実験の設定使用するAIモデル: o1、GPT-4、Gemini プロンプト: "flutterでTODOリストを簡単に作って" 評価

          Flutterコーディング比較第2段 o1 vs gpt4o vs GeminiAdvanced 編

          0からはじめるAI生活:AI紹介

          AIを活用した生活の始め方:最新ツールで日常をアップグレードAI(人工知能)は、私たちの生活を劇的に変える力を持っています。 この記事では、AIを活用して日常生活を豊かにする方法と、それを可能にする最新のツールをご紹介します。 機能制限はありつつも無料で使うことのできるツールを選択しています。 サムネも紹介しているAIで作ってみました!! 1. 文章生成概要 AIによる文章生成は、自然な言語でテキストを作成する技術です。高度な言語モデルを利用することで、短時間で質の高い

          0からはじめるAI生活:AI紹介

          V0とは?使い方は?

          V0とはフロントエンド開発を加速するAIベースのUI生成ツール V0は、Vercel社が提供するAI駆動のツールで、特にフロントエンド開発者に向けた強力なサポートを提供します。このツールの最大の特徴は、自然言語での指示に基づいてReactコンポーネントやUIを自動生成できる点です。たとえば、「事業紹介のホームページをデザインしてください」と入力するだけで、UIが自動的に作成され、コードとプレビューを同時に確認することができます。 さらに、作成されたデザインに対して「少し硬

          GPT4o vs o1- preview vs o1-mini Flutterアプリコーディング比較

          今回はタイトルにあるようにGPT各種にFlutterアプリコーディングをしてもらって比較してみます。 *注意*  書くモデルの回答をそのまま貼り付けているため記事が相当長くなっていますのでご気をつけください。 結論「GPT4o」と「o1- preview」の生成スピード比べて「o1-mini」が倍速くらいで動いてくれていてめっちゃ早く感じます。 コードを書くなら公式の通りに「o1-mini」だと思います。 また、アプリ全体を通してのコーディングはハードルが高いようなので

          ¥300

          GPT4o vs o1- preview vs o1-mini Flutterアプリコーディング比較

          ¥300