AI ニュース for Engineers and Researchers 2023.01.06 -PM
機械学習の成功への鍵:正規化と標準化の理解
データのスケーリング:正規化と標準化の違い
データの前処理はデータサイエンスと機械学習において重要。transactions.csvを例に正規化と標準化の違いを説明。
正規化は0-1の間にスケーリングし、標準化は平均を0、標準偏差を1に変換。PythonでMinMaxScalerとStandardScalerを用いた実装可能。
どちらの手法を使用するかはデータの特性と使用するアル・・・・
【解説】データの正規化と標準化は、機械学習のパフォーマンス向上に大きく影響する重要なステップだ。特に異なる尺度のデータを比較しやすくする点はビジネスにおいて有用だろう。例えば、顧客データや売上データの解析に活用でき、より正確な予測や意思決定が可能になる。将来的にはマーケティング施策や在庫管理などで広く活用されると期待される。
模倣小規模言語モデルの問題点に対応したモデル Orca を解説する
https://qiita.com/kernelian/items/c6885dd51ec10b48b563
Orca: Progressive Learning from Complex Explanation Traces of GPT-4
最新の大規模言語モデル(chatGPT や GPT-4)によるAI学習が可能か?Orcaが解決策。説明チューニングで推論プロセスを学習。タスクと指示のスケーリングで学習データの多様性を確保。システムプロンプトでデータのラベリングを促進。Vicunaと比較してChatGPTと同等の性能を示す。Orcaの制限と今後の展望についても。小規模モデルに関する理解が必要。データセット作成にも示・・・・
【解説】大規模言語モデルは今後もビジネスや社会に大きな影響を与えると考えられます。Orcaのようなモデルは、小規模モデルの課題に対処することで、より高い性能を実現し、実際の利用価値を高めています。ビジネスでは、顧客対応やコンテンツ生成など幅広い分野での活用が期待されます。社会では、教育や医療分野での応用が考えられ、より効率的なサービス提供が実現される可能性があります。データセットの生成やモデルの学習に関心がある人にとっても、Orcaの手法は示唆に富んだものとなるでしょう。
【UiPath】Clipboard AI で遊んでみた。衝撃的に便利なので読んで損なし!!
UiPathのClipboard AIを紹介!請求書や発注書のデータを瞬時に転記。簡単な設定で、画像やテキストからの抽出も可能。使い方とともに、可能性を紹介。非常に便利なツール。無料版もあるので、興味がある・・・・
【解説】UiPathのClipboard AIは、請求書や発注書などのテキストデータをアプリケーションに自動転記することで、業務効率化に貢献する可能性がある。これにより、データ入力業務の省力化が期待できるだけでなく、画像からの文字列抽出も可能となり、さらなる活用が見込まれる。特に会計や事務作業などの業務において効果的に活用できると期待される。
AIでアニサキス識別
アニサキス識別アプリ開発の過程と学習モデル
アニサキスによる食中毒を防ぐため、AIでアニサキスを識別するアプリを開発しました。VGG16を使用した学習モデルによりアニサキスのいる画像といない画像を分類し、Flaskを用いたウェブアプリケーションとして実装しました。今後はCNNやYOLOを利用して精度向上・・・・
【解説】アニサキスを識別するアプリは、食品業界や飲食店などで活用される可能性があります。また、社会全体での利用も考えられ、食品安全を高めるために役立つと思います。また、アプリの精度向上に向けて、CNNやYOLOを用いた物体検出のアルゴリズムを導入することで、より高い精度が期待できるでしょう。今後は、より安全で安心して食品を摂取できる社会の実現に向けて、さらなる技術の発展が期待されます。
無料枠のGoogle ColabでGPT-3.5を超えるLLMを動かす!Mixtral offloadingについて
Mistral AIが新たなLLMモデル「Mixtral 8x7B」をリリース。MoEモデルを採用し8つのExpertから2つを使用して推論。キャッシュ保持、プリロード、量子化の3つの手法で効率化。キャッシュ保持ではアクティブなExpertをGPUメモリに保持し、プリロードでは次のExpertを予測。量子化ではExpertをHQQで量子化。これにより品質とサイズのトレードオフが改善。効果的な手法として注目される。(文・・・・
【解説】Mixtral 8x7Bの効率化手法は、GPU環境の制約を克服する可能性を秘めています。特に、キャッシュ保持とプリロードの手法は、大規模な言語モデルを限られたGPU環境で効果的に活用することができるでしょう。これにより、自然言語処理や文書生成などのビジネスにおいて、より高速かつコスト効率の良い推論が可能となります。社会的にも、オンライン教育やカスタマーサービスなど、様々な分野での利用が期待されます。
Azure AI-102/Azure AI Engineer Associate を年末の忙しい一週間で突破する方法
AI-102合格体験記:効率的な勉強法と注意点
昨年末合格したAI-102について、費用や勉強方法、試験の特徴などを紹介します。AzureのCloud Skill Challengeに参加し半額クーポンを入手。基礎を固めた後はUdemyの問題集で英語力も鍛えた。AWSとの違いや難易度、感想など・・・・
【解説】AI-102合格の費用を抑えたことがビジネスや社会にとって大きな影響を与える。企業はAI関連の技術力を向上させるために、このような取り組みを模索するだろう。特にクラウドサービス業界では、技術者の資格取得を奨励する動きが広がるかもしれない。また、AI技術の普及により、より高度なアプリケーションやサービスが社会での利用が進むだろう。
Chat GPTはサイトを作るのに優秀か?
https://qiita.com/Kaos_laboratory/items/704cac92aaac24f2c99c
AIの進化に不安を感じる人もいますが、AIは作業の効率化や単純作業のサポートをしてくれます。GitHub Copilotなどの活用もありますが、間違いも生じます。しかし、人間のセンスとAIのセンスを合わせれば、より良い成果が得られるかもしれません。チャットGPTやGoogle Bardを使ってみたり、AIの進化を見守りながら、AIと共存していく・・・・
【解説】AIの進化は確かにビジネスの効率化に貢献している。特に単純作業の自動化やプログラミングの支援は大きな力となるだろう。しかし、人間とAIが共存する未来が重要だ。AIの処理速度と人間の感性を組み合わせることで、より優れた成果が得られる可能性がある。ビジネスではクリエイティブなタスクや意思決定にAIを活用し、人間は判断力や感性を重視した方が良いだろう。
Pythonで〇×ゲームのAIを一から作成する その42 手番を入れ替えた対戦
AI対戦ゲームプログラム修正の手順
AI同士の対戦プログラムにおいて、修正が必要な箇所を解説。指定・記述方法に合わせてプログラムを修正することで、通算成績や比率表示の改善を行いました。また、AIの名前を表示することで、表示方法をわかりやすく変更しました。次回の記事では、本プログラムの改良点について更に修正・・・・
【解説】本記事ではAI同士の対戦を行うために、ai_matchの改良が行われました。手番を入れ替えた対戦を行うことで、AI同士の戦略の比較が可能になります。また、表示の改善も行われ、結果が分かりやすくなりました。この改良されたai_matchは、AI開発やゲーム開発において活用されることが期待されます。また、将来的にはAI同士の戦略比較だけでなく、学習のためのデータ収集やAIの進化にも貢献する可能性があります。
【第二回目】LLMを商用で利用して低コストでWebアプリと連携してサービスとして提供するための検討
Gemini Pro vs Replicate Llama-2: 比較検証方法と結果の要約
Gemini ProとReplicateのLlama-2の技術検証を行う。Gemini Proは引き続き高い性能を示し、Llama-2は日本語対応不足と学習が必要な点が見られた。API経由でのデータ取得やGemini Proの利用などが可能だが、Llama-2は英語翻訳の必要性があり、性能比較は限定的。処理速度や環境への影響を検証し、今・・・・
【解説】感想:
この記事を読むと、Gemini Proは文章を理解して適切な回答を提供する能力が高いと感じられました。特に、要約や予測のタスクにおいて、正確な結果を得られることが期待できそうです。これを活用して、ニュースアプリや情報提供サービスの開発に役立てられる可能性があります。一方で、ReplicateのLlama-2は性能が低く、特に日本語においては正確な結果を得ることが難しいように感じられました。今後はGemini Proを活用したWebアプリの開発や、GPU環境での検証が注目されるでしょう。
【第一回目】LLMを商用で利用して低コストでWebアプリと連携してサービスとして提供するための検討
MedTech企業でのLLMを利用したサービス提供についての技術検証の第1回目。主要ベンダーやOSSのモデル、APIホスティング環境について検討し、コストや性能の観点から絞り込む方針。Gemini Proが有力で、コスト的にも開発効率的にもアドバンテージがあり、ChatGPT-3.5 Turboも利用価値があると判断。GPU環境を用意するのは余裕があれば、HuggingFaceやReplicateを利用して・・・・
【解説】中小企業にとってLLMを利用した日本国内向けのサービス提供は有望で、コストをかけずにスモールスタートできる可能性がある。特にGemini ProなどのモデルはGoogleやMicrosoftのサービスと比べて開発効率的にも有利で、商用利用に向いている。また、OSSモデルの技術検証も重要であり、7Bの使用は普通のCPU環境でも可能なので、スモールスタートのビジネスやサービス提供に活用できる可能性がある。
GetGPTで関西弁変換アプリを作ろう
https://qiita.com/Jinnie/items/79f100a8f0cf791a73f9
「関西弁変換ウェブアプリの魅力」
GetGPTを活用した関西弁変換ウェブアプリは、標準日本語を関西弁に変換するサービスです。使い方は簡単で、日本語を話す人や文化に興味のある人に役立つでしょう。GetGPTの技術を活かし、新しい言語処理と変換の可能性を示すプロジェクトです。是非体験し・・・・
【解説】将来的には、この関西弁変換ウェブアプリは日本語学習者や日本文化愛好者の間で人気を集めることが期待されます。特に日本の方言に興味を持つ人にとっては興味深いツールとなるでしょう。さらに、観光やエンターテイメント業界での利用も考えられ、外国人観光客にとっても興味深い体験となるでしょう。日本の方言や文化に触れることで、相互理解が深まる可能性もあります。
AIの現況と未来:Perspectives on the State and Future of Deep Learning - 2023~日本語解説まとめ~
「人工知能技術の現在と未来についての深い議論」
著名な専門家とChatGPTが行ったディープラーニングに関する議論。「未解決の大きな問題」、「ディープラーニングの理解の深まり」、「解釈可能性」、「進化と将来の方向性」、「学問界の困難」についての質・・・・
【解説】人工知能の最大の未解決問題は、ディープラーニングの理解不足と解釈の難しさだ。解釈可能なAIが必要であり、そのための理論構築や実務への応用が求められる。ビジネスでは、解釈可能なAIを活用し、透明性や信頼性を高めることが重要だろう。社会では、医療や法律などでのAIの意思決定を理解しやすくし、倫理的な使用を促進することができるだろう。
Lee et al 2020 "Learning Quadrupedal Locomotion over Challenging Terrain"から紐解く四足ロボット強化学習の「秘伝のタレ」
"四足ロボットの強化学習:過去と未来"
シンガポールの実習生、湧仁渕岡が2023年12月までの研究を報告。2020年にScience Roboticsに掲載されたETH Zürich Robotic Systems LabとIntelの研究グループによる学習四足ロボットの論文を紹介。本論文は四足ロボットの強化学習分野に多大な影響を与え、今も価値がある。手法や実装、実験結果に対する個人的な見解も解説。強化学習や柔らかなロボットの関係性に・・・・
【解説】四足ロボットの強化学習は今後、多様な地形での活用が期待されます。例えば、災害救助や陸上運搬など様々な分野で利用が考えられます。この研究の手法は、他のロボット学習や人工知能への応用も期待され、ビジネスや社会に大きな影響を与える可能性があります。四足ロボットの利用がますます拡大していくことが予想されるため、今後の発展が楽しみです。
AIはパートナー?ライバル?ツール?
AIと仕事:競争と共存
AIの普及で競争激化し、不安が広がる中、AIが変える世界を考える。感情的な、パターン化できない仕事とは何か。AI活用成人物コンテンツ制作が唯一の収益源?オン・オフライン統合可能か。AI利用者増えず、何をAIに任せるか考える必要。人間とAIは循環構造で絡み合い、共・・・・
【解説】AIの急速な進歩と活用の容易さから、競争は激化し、不安を感じる人々も多い。しかし、感情的で毎回違う反応が得られる仕事やオフラインの体験価値はAIに取って代わられることはない。融合・統合能力を持つことが重要であり、AIを使いこなすことが行動する力、主体的に進化することにつながる。 AIとの関係を見つめなおし、必要なことを選択することが重要だ。
人工知能(Artificial Intelligence、AI)とは
AIへの注目度が高まる中、機械学習の仕組みを理解し、利用することが重要です。AIの代表的な技術や活用分野、モデルの作成手順などを知ることで、機械学習に関する知識を身につけましょう。また、XGBoostなどのアルゴリズムを利用し、AWSやAzureなどのクラウドサービスでの活用も視野・・・・
【解説】機械学習やAIの普及により、未知のデータから予測や判断を行うことが可能となります。製造業では品質管理や金融業では投資判断、医療分野では診断支援など、様々な分野での活用が期待されます。しかし、偏りや説明可能性の課題を解決しなければなりません。XGBoostやAWS、Azureなどのサービスにより、これらの課題に取り組むことが重要です。それにより、正確で公平な予測を行うことが可能になります。
【即席】自分だけのAI公式ラインbotを作ろう
「自分だけの秘書AIボットを作成してみた」
山の手線運休で考案し、Go言語を慣れるために作成。LINE Botに遅延通知機能を搭載した「ネオ・ミミコ」が完成。今後は個別機能要望に対応する予定で、AIボットの仕組みや構成も公開。電車の遅延や様々な情報通知に活用可能。友達追加してフィ・・・・
【解説】将来的には、このようなカスタマイズAIボットは個人や法人の多くのビジネスで活躍する可能性がある。例えば、特定の情報をリアルタイムで通知するための営業支援ツールや、顧客の問い合わせに24時間対応するカスタマーサポートなど。また、災害時の情報配信や地域コミュニケーションにも活用できる。人工知能の技術が進化する中、今後ますますAIボットの活用が進むと予測される。
ChatGPTの自動化
https://qiita.com/devtheworld/items/0418d971f880fe569b94
「ChatGPTプロンプディング自動化ツール」
ChatGPTのプロンプディングを自動化するツー・・・・
【解説】ビジネスでは、顧客サービスやマーケティングなどでChatGPTを活用し、効率化と顧客満足度向上に貢献できるだろう。また、教育分野では自動返信や学習支援に応用が期待される。社会では、高齢者や障害者のコミュニケーション支援や、言語の壁を感じる外国人へのサポートに役立つ可能性がある。
初見Databricks on GCPを使ってわかったこと 3 【GCSの連携の仕方】
GCP上でDatabricksを使用して学習データを参照する方法を詳細に解説。Service Accountの作成、Databricks CLIの設定、SecretとSerectScopeの作成、学習用instanceの設定などをステップごとに説明。最終的に、notebookで指定したinstanceがCloudStorageのdataを呼び出・・・・
【解説】DatabricksをGCP上で活用することで、学習データを参照する環境を構築できる。これにより、機械学習やデータ分析のビジネスで効率的なデータ連携が可能となり、より正確な予測や意思決定が行える。また、社会では医療や農業など様々な分野で、データを活用したソリューションやサービスの提供が期待できる。
ソフトウェア開発職の若手技術者が通算1年AI研究者(仮)をやり、社内転職もやったので色々まとめてみた
Fujitsu Advent Calendar 2023 23日目: Findyのキャリア面談からのビジネス教訓
今年の激動の年を締めくくる諸々の出来事を振り返ります。社内転職の経歴から話題の技術開発まで。研究職の苦悩、社内転職の経緯、AI研究開発の業務参入まで。6年間の経験を通して学んだことをまとめます。些細なことも積極的に投稿する社内のイベントや技術に対する友人との情報交換なども重要。これからも精進を怠らず、ロマンを・・・・
【解説】2023年は経歴に大きな転機があり、葛藤や苦悩を乗り越えながら、最終的に理想のキャリアに到達するまでの過程が描かれています。AI技術と研究開発に対する情熱や意欲が強く示されており、将来的にはその分野での活躍が期待されます。社内の制度や環境に対する不満や違和感も述べられており、今後は多様な組織や環境での活動、研究開発、執筆での Output を続けることで、自らの理想に向かって精進する姿勢が鮮明に感じられます。AI技術の研究開発において、熱意と積極的な取り組み方は、これからのビジネスや社会において活用される可能性が高く、新たな成果や発見が期待されます。
ユニケージで競馬予想AIの特徴量を生成する
競馬AIの開発方法-オープンソースとターミナルを用いた特徴量生成
競馬AI作成に機械学習データの処理速度で悩んでいた私が、ユニケージ開発手法を利用して特徴量を生成。データ収集から特徴量生成までの具体的な手法を解説。全ての処理を15秒で完了し、競馬予想マス・・・・
【解説】競馬AIの開発において、大規模なデータ処理の必要性が示されました。特に機械学習においては、膨大なデータを扱うため処理速度が重要です。ユニケージ開発手法を取り入れたことで処理速度を飛躍的に向上させ、大規模データの取り扱いが可能となりました。競馬予想の他に、株価予測など様々なビジネスに活用が期待できます。さらに、この技術は金融分野のデータ解析や医療データの収集、解析などにも応用が考えられます。
2023年末までのElixirができることを振り返る
「Elixirプロダクション開発の最新トレンド」
Elixir/Phoenix/LiveViewを使用したWebアプリ開発や、AI・ML向けのライブラリを活用した開発が注目されています。2023年には新たなライブラリやフレームワークが登場し、さらなる進化が期・・・・
【解説】ElixirのAI・ML開発は、将来的にビジネスでマイクロサービスやデータ操作に活用される可能性がある。AI・ML周辺のライブラリやフレームワークの進化も期待される。2023年には新たなライブラリやFWが登場し、ビジネスに革新をもたらすだろう。一方、社会ではAIを活用したサービスやシステムが拡大し、生活に豊かさと便益をもたらすことが期待される。
余暇の時間にAI自由研究やDL OSSへのContributionをするためのロマンPC設計書
PC自作への挑戦 〜思い描いたスペックを手に入れるために〜
GPU搭載マシンを新調しようと考えるも高額過ぎて手が出ないことから20年ぶり自作に挑戦。PC暦20年超の筆者が、第14世代Core i9 14900KとASUS ROG STRIX Z790-F GAMING WIFI IIなどのパーツを選定。不足するスペックを実現したいという思・・・・
【解説】PC自作は、需要に合わせカスタマイズ可能なため、ビジネスとしては顧客のニーズにマッチしたパソコンの提供が可能。また、自作PCの需要が増え、そのパーツ販売も増加。社会的には、AIやDLの研究者や開発者に対して、高性能なPCが提供できることで、技術革新や研究の推進に寄与する可能性。自作PCの需要とその活用は今後も拡大していくと予想される。