くすぐったがり

データ利活用まわりでサービス企画してるチーフなんたらサイエンティスト。 なおX/twi…

くすぐったがり

データ利活用まわりでサービス企画してるチーフなんたらサイエンティスト。 なおX/twitterもnoteも私個人の意見であり、所属する組織の見解ではありません。匿名垢のくせしてですが一応ww

マガジン

  • つぶやきとか雑感とか

    X/Twitter等から引越した記事をぶら下げていきます。 外部記憶装置の代用としてのマジメな情報源・記事ではないので、ちょっと雑に。

  • data scientist's memo

    データサイエンス関連の情報を外部記憶装置的に。 元々の執筆目的だったので整理した目次も作りますが、他のtweet的な記事なんかも書くようになったので、わかりやすくなるようにマガジンでも管理します。

  • 数学屋の憂鬱

    X/Twitter等から引越した記事をぶら下げていきます。 ちょっと数学屋的に、ちょっと雑に。昔そんなタイトルでブログしてたな…。

  • 生成AI関連の情報まとめ

    ChatGPTとか大規模言語モデル(LLM)関連の情報、分量が多すぎるので時々調べたものを外部記憶装置的に。進歩が急すぎて目次を丁寧に作るよりマガジンに放り込む管理にしました。

最近の記事

  • 固定された記事

仕切り直しで収集情報の整理・目次

初回の投稿として「はじめまして、の代わりに」を書いてから間が空いたのは、当初の目的を勤務先で業務としてやることになったから。もちろん秘密情報はないものの、業務上の扱いが少々ビミョウで。 再開したのは、その代わりの内容として、これまで参照してきたデータサイエンス関連のwebサイト等で有用なものを整理しておきたいと思い至ったから。いわば本人的には外部記憶装置(笑) このページは情報を整理した目次にします。新たな情報があれば随時加筆修正予定です。ちなみにデータサイエンス業界・業務

    • 懐かしくも面白いツールを見つけてメモ https://kpi-master.com/ その種の研究開発してた身としては加えたい機能が幾つかあるが、それを実装すると完全に車輪の再発明。どこで差異化してどう売るかは事業戦略もある、関連サービスの市場モニタリングも兼ねてウォッチしていこう

      • LLMで進展するマルチエージェント

        個人的に気になるのはLLMによるマルチエージェントシミュレーションの進展。 学生時代にゲーム理論をやって、そのビジネスへのアプリケーションを考えて、ゲーム理論のプレーヤーの数を増やすとマルチエージェントというのは短絡的だったかもだけど、当時の実務で若干使われるのを見かけるのはマルチエージェントシミュレーションだったから着目していた。 ビッグデータブーム以前の技術やニーズでは防災関連のソリューションがあるくらい。他主体が入り乱れるような状況(道路の混雑など)がどうなるか傾向を

        • 説明変数の作り方(特徴量、欠損値、標準化、縮約など)と選び方

          データの量や質、評価指標などのテクニックの一部としてこれまで記載していたのだけど、雑多なページになっていたので、特徴量の作り方など比較的ボリュームのあるテーマを括りだした。 なお時系列分析における特徴量の作り方などは時系列分析に関する応用的なトピックにある。 特徴量の作り方 対数変換や逆数変換、box-coxとか、時系列なら移動平均や移動標準偏差・最大値・最小値みたいな、当たり前のテクニックも良い記事があれば追加するとして、自分が疎かにしがちなところから。 特徴量の作成

        • 固定された記事

        仕切り直しで収集情報の整理・目次

        • 懐かしくも面白いツールを見つけてメモ https://kpi-master.com/ その種の研究開発してた身としては加えたい機能が幾つかあるが、それを実装すると完全に車輪の再発明。どこで差異化してどう売るかは事業戦略もある、関連サービスの市場モニタリングも兼ねてウォッチしていこう

        • LLMで進展するマルチエージェント

        • 説明変数の作り方(特徴量、欠損値、標準化、縮約など)と選び方

        マガジン

        • つぶやきとか雑感とか
          32本
        • data scientist's memo
          72本
        • 数学屋の憂鬱
          46本
        • 生成AI関連の情報まとめ
          34本

        記事

          結局いま強い政党はどこなのよ(power indexという考え方)

          個人的には「政権交代は手段、政策実現が目的」という国民民主党の考え方や姿勢は好きだが、政権交代と思われるマスコミの報道を見ると正直よくわからん状況やなぁと思う。 なので、議員数も踏まえつつ結局いま影響力が強い政党はどこなのかpower indexで見てみました。 power indexって何なの? 例えば3党21人で構成される議会(A党10人、B党1人、C党10人)を考えます。議員数で見ればACが圧倒的でBはたった1人しかいない。でも過半数11人で議決できるとしたら、AB

          結局いま強い政党はどこなのよ(power indexという考え方)

          AIやDXに関する政策とか市場の情報整理2024.11版

          Gartner曰く、エージェントAIをはじめ、このテクノロジーのトレンドは暫く発展的に続いていくのだろうな とすると政策的には、これまでも断片的に取り上げてきたけれど、以下の流れは続いていく訳で 民間企業も大手や先進的なところは進めていこうとする。

          AIやDXに関する政策とか市場の情報整理2024.11版

          大規模言語モデル(LLM)やそのツールの情報整理2024.11版

          Perplexityが、公開情報と社内のナレッジを統合する新機能を出して、また一歩進化した。詳細はIntroducing Internal Knowledge Search and Spacesにあるが、ザックリ解説は以下。 さらにgitub copilotでも使えるようにするPerplexityAI · GitHub Marketplace · GitHubが出て、個人的に最も気に入ってるPerplexityが競合を一歩リードするか、でもopenAIに対抗できるのはGoo

          大規模言語モデル(LLM)やそのツールの情報整理2024.11版

          ずっと教育経済学って何と思ってた。対象は経済でなく、手法も統計学だが経済学か?と。でも計算の順番がどうとかいうツイートを何度も見るに、教育学者が科学的アプローチをできるはずもなく、見かねた経済学が教育ドメインを科学的に分析する行為に名前が付いたとの仮説に至る(偽であってほしい)

          ずっと教育経済学って何と思ってた。対象は経済でなく、手法も統計学だが経済学か?と。でも計算の順番がどうとかいうツイートを何度も見るに、教育学者が科学的アプローチをできるはずもなく、見かねた経済学が教育ドメインを科学的に分析する行為に名前が付いたとの仮説に至る(偽であってほしい)

          制御工学の理論とツール

          制御の観点から最適化なりシミュレーションについて考える論文がいくつかあったのと、ツール面での調査も突発的にあったので、併せてまとめておく。ちなみにシステム思考とシステムダイナミクスについては以下で既に語っているけれど、制御工学はこれらの親にあたる。 理論 とりあえず参考になったものだけ乗せておく。後でより良いものが見つかれば追加する。制御工学における伝達関数とか正直いまだによくわからん。 ツール 有償ツールだとMATLAB/simulinkがその分野の方々の中では有名

          制御工学の理論とツール

          英語でAI、AIで英語、その前にビジョン…

          以前も翻訳とか通訳とかのAIが進歩してるのは取り上げたのだけど、 そこから2年も立たずに凄いことになったな、ここまでの機能が安く手軽に使えるなんて。英語の翻訳や通訳に特化したアプリを頑張ってた人たち、どうするんだろ。。。 とはいえ専門的な表現とかはたまにちょっと違うことはあるから英語による数学表現は知っておいた方が無難かな。 あとは文化的なところを踏まえた話の仕方はJapanese culture - Web Japan、多言語の基礎知識についての入り口を知るならこれ

          英語でAI、AIで英語、その前にビジョン…

          データ可視化の意義とダッシュボードの設計

          元々は以下のページにひとまとめだったのですが、より上流の部分を切り出したのが本ページ、ツール系で束ねたのが以下のページ、という感じです。 データ可視化の意義について私が良いなと思う記事を最初に挙げておきます。SoE (System of Engagement) vs SoR (System of Records) みたいな議論をもう少し主に持ってきたい、基盤・ツールに若干寄っている感はあるものの、その後のデータサイエンスまで念頭にあって考えるには良いかと(本業で書いてるので

          データ可視化の意義とダッシュボードの設計

          時系列分析に関する応用的なトピック

          このnoteで最もアクセス数が多い記事がコレなんですが その後も良い情報があると加筆修正してたんですが、1頁に収めるには情報量が多くなったので、上記を主、周辺的な話題をこちらに整理します。 生存時間解析・信頼性解析 は結果的に顧客の要件に合致せずPJで採用しなかったけれど、少なくともコンセプトはデータサイエンティストなら押さえておかないといけないものだと思う。もっと良い記事や論文があれ積極的に追加したい。 状態空間モデル は多少は使ったことがある。ただ、他の時系列モ

          時系列分析に関する応用的なトピック

          JR品川駅で間違って教えてしまった…

          やらかした当日にX/twitterで投稿してたのだけど、話の整理を兼ねて。 というか、こんなところで詫びても届かないけど、本当にすいません…。 CEATECの最終日、幕張からの帰途で山手線に乗っていた夕方、女性が乗って来たのは確か田町か高輪ゲートウェイ。ほんの少しの揺れで女性がよろけてぶつかって「すいません」とお互いに。 痛くも何ともないし別に良いのだけど、気になって見たら(恐らく経路を)携帯で検索しながら、かなり慌ててる。今時は下手に女性に声を掛けてもなぁ、、、と躊躇っ

          JR品川駅で間違って教えてしまった…

          インドの数学者ラマヌジャン、数学的な証明は苦手だったとも言われるが、残した数式の美しさ、その発想力が彼の天才性を示してくれる。それで十分だ! https://mathlog.info/articles/WpyJcz7DjhhvWArh214T https://gigazine.net/news/20241024-srinivasa-ramanujan-still-catching-up/ http://www.zeta-institute.org/

          インドの数学者ラマヌジャン、数学的な証明は苦手だったとも言われるが、残した数式の美しさ、その発想力が彼の天才性を示してくれる。それで十分だ! https://mathlog.info/articles/WpyJcz7DjhhvWArh214T https://gigazine.net/news/20241024-srinivasa-ramanujan-still-catching-up/ http://www.zeta-institute.org/

          周辺分野としてのIT的な知識とか

          基本コレなのよね。ただIT系や業種系のコンサルタントの大半は頭が悪いので理解できない。ソリューション系や戦略系が理解できるのは賢くないとこなせない仕事だから。 とはいえ、重要な隣接分野の1つとしてIT関連のことも知っておかないと何ですよね。 まずは要件定義から。データ利活用に関するパートについてはフツーのSEでは書ききれないので該当する部分を担務することはある。ので、どんなことをするかは知っておくべき。 そうするとバカなITコンサルタントが、要件定義の他の箇所も書かせよう

          周辺分野としてのIT的な知識とか

          このレベルの逃げが必要な人もいる。それが当前の環境にいると本人の感覚が麻痺してることがあるのが哀しい。 https://togetter.com/li/1645041 https://togetter.com/li/1845872 連絡取れないあの人、元気にしてるかな。このくらい逃げて欲しい。その資格はある人だった

          このレベルの逃げが必要な人もいる。それが当前の環境にいると本人の感覚が麻痺してることがあるのが哀しい。 https://togetter.com/li/1645041 https://togetter.com/li/1845872 連絡取れないあの人、元気にしてるかな。このくらい逃げて欲しい。その資格はある人だった