株式会社オープンストリームのエンジニアより、各社クラウドサービス・ビッグデータ・AI/機械学習・IoT・モバイル・アジャイル・セキュリティなどの先端技術情報や、ソリューションサービス情報、ビジネスコラム、各種勉強会、イベント情報を発信します。 ■株式会社オープンストリーム関連ブログサイト ・Keep Innovating! Blog https://www.opst.co.jp/keep_innovating_blog/ ■株式会社オープンストリームコーポレートサイト https://www.opst.co.jp/ ■株式会社オープンストリームサービス一覧 https://www.opst.co.jp/service/ ■オープンストリームホールディングスグループ共同運営note「OpeN.lab」 https://note.com/opst_hd/
寺田英雄(㈱オープンストリームCTO)
Visual-SLAMに関する研究活動について書きます。
2024-02-27にarXiv公開され,昨日(2024-02-28)あたりから日本のAI・LLM界隈でも大きな話題になっている、マイクロソフトの研究チームが発表した 1ビットLLMであるが、これは、かつてB-DCGAN(https://link.springer.com/chapter/10.1007/978-3-030-36708-4_5; arXiv:https://arxiv.org/abs/1803.10930 )という「1ビットGANのFPGA実装」を研究していた
ガウシアン・スプラッティングの「スプラッティング」とは、何らかの高次元オブジェクトを2次元平面に「投影する・貼り付ける」という意味。3Dガウス関数を画像投影面に貼り付けるから「ガウシアン・スプラッティング」という。
プログラムコードの解析をするとき、コールグラフがあると便利である。私は本気でやるときは、diagrams.net を使って手動で作る。書式は我流で、たとえば下図のような感じ。 もちろん、gprof とか pycallgraph とか、昔からコールグラフを自動的に作成ツールも色々あるのだが、個人的にはなかなかしっくり来るものがなく、結局はソースコードを自分で読んで上図のようなものを作っている。そのほうが理解が深まるし、知らない土地を探検しながら地図を作るような楽しさもあるから
この話は元ネタは私が思いついたのではなく、当社の若手エンジニアから聞いたものである。(もっと以前から思いついていた人もいそうな気もする。) 誰も褒めてくれない時代人は誰しも褒められると、まあ、嬉しいものである。(私は贅沢者なので、褒められたい人に、褒めて欲しい角度で褒められないと満足できないがw。) しかし、昨今のSNS化社会では、褒められるよりことよりもディスられないように気をつけるほうを優先しなければならないほど、殺伐といている。 また企業などのリアル空間ではコンプ
ベイズ理論をデータ解析やシステム開発で活用してみたいと思っても、最初はなかなかハードルが高いというプログラマー諸氏も多いと思う。そんな人におすすめしたい画期的な書籍がちょっと前に出版された。 それが『Pythonでスラスラわかるベイズ推論 「超」入門』(赤石雅典 著、須山敦志 監修/講談社)である。 この本の素晴らしいところは、タイトルにある通りPythonによる実例と数学的な説明とを対比させながら、とてもとても基本的な所からベイズ推論を解説してくれているところである。
春なので,新社会人さん向けにメッセージを書いてみます。 プロのエンジニアを目指して社会に出た方、この職種を選んでくれてありがとうございます。そして、おめでとうございます。 私自身は、AI/ソフトウェアをメインとして、機械、電子回路系も少々たしなむエンジニアですが、とにかくどの分野にせよエンジニアは良い職業だと思っています。少なくとも私はこの仕事が好きです。そして、この仕事を選んだあなたは幸福な人生となる可能性が高まったと思います。 なぜエンジニアという仕事が良い仕事と考
私たち技術創発推進室にて鋭意開発を進めてきた新しいMLOps系プロダクトをまもなくリリースします。開発リーダーの髙岡くんが紹介記事をアップしてくれました。 MLOps 分野に興味のある方は、ぜひ一読ください! よろしくお願いします。
# 今回はちょうど良いネタを思いつかないので、説教めいた話を書いてみた(なんでやねん!)。説教が嫌いな人は読まないことをお勧めする。 エンジニアを長年やっていると、いろんなタイプのエンジニアに出会う。ネットが普及した現在においては、リアルだけでなくネット空間上で様々なタイプのエンジニアの言動を目にすることが多くなった。 そうした中で、ときどき非常に悲しくなるというか残念なエンジニアを見かける。 その一つが、先人(せんじん)へのリスペクトがない(ように振る舞う)エンジニア
スライド系は、物理的なページの区切りに併せて話を区切らないといけないのが苦痛です。やはり頭を整理する文章の作成にはフラットなテキストやワード系が好みです。思いついたことは、止まらずバーっと書き出したい。
時間をかけてこねくり回した文章よりも、短時間で一気に書いた文章のほうが出来が良いことが多いな。
VSCode に rewrap という拡張をいれたら、Emacsの M-q と同じことができるようになって、快適! MarkdownやTeXの執筆におすすめ。
この記事はPythonプログラミングに関する超小ネタである。 Python(に限らず)システムを開発でパフォーマンス(動作性能)の問題が生じる場合がある。 パフォーマンス問題の解決においてよくやるのが、処理時間の計測である。line_profiler などのツールを使って計測する方法もあるが、そういった外部ツールを一切使わずにシンプルに計測したい場合もある。 そういう場合は、datetime や time ライブラリを用いてシステム時計にアクセスし、プログラム中の狙った
*この記事は自分の研究テーマに関連したメモです。SLAMやNeRFの知識がある人向けです。 元論文以下、文中の論文引用番号は上記の元論文に合わせている。 概要NeRF-SLAM は、単眼 Visual SLAM のマップ部分に NeRF を適用したもの。ローカライゼーション目的の単純な幾何学的マップとしてだけでなく、NeRFの特徴を活かして、視覚的(測光学的)にも精度の高いモデルを同時に獲得できる。また、最近の関連分野の研究成果を導入し、さらに独自の工夫を加えることで、従
ChatGPTのUIがまた変わった。プロンプトに対して、回答候補を2つ同時に示してくる。そして、どちらが好みか答えさせる。これを教師データにして、さらに回答の精度を上げるように学習させる狙いのようだ。賢い。抜け目のない緻密な戦略で動いているOpenAI。
今回は小ネタで、最近の失敗話である。 私は複数のGitHubアカウントと複数の開発マシンを使い分けている。一つの開発マシンの中から、プロジェクトに応じて、異なるアカウントでGitHubにアクセスすることもある。 最近、とある開発マシンのディレクトリを整理していたら、なぜかそのマシンだけ、特定のGitHubアカウントに限ってリポジトリから clone できなくなってしまった。'repository not found' などとエラーが出てしまうのだ。別のマシンではOKなのに
この記事を書いている2024-01-12現在、J-PlatPatで検索してみると”大規模言語モデル”のキーワードでヒットする国内特許(申請中・権利化ずみ)は50件ある。 すでに権利化(特許化)されているものは36件あり、そのうち2023年以降に出願されたものは30件ある。ちなみに出願者は大企業や大学の研究機関は少なく、どちらかというとスタートアップ的な企業が多い。これが意味する所を考えてみるのも面白いかもしれない。 全てを精査したわけではないが、特許化されたものの内容をざ