MITTI

認定理学療法士。Rはハーバード大学がMOOCとして提供しているデータサイエンスの講座、…

MITTI

認定理学療法士。Rはハーバード大学がMOOCとして提供しているデータサイエンスの講座、pythonは東京大学が提供するデータサイエンスの講座(GCI 2019 winter)を修了。臨床半分、データ分析半分(経営・人事)の働き方をしている。最近は病棟看護師の忙しさ指数を作成した。

マガジン

  • Rで始める統計・データ分析入門

    研究やデータサイエンスで使われるR言語について、未経験から脱初心者を目指す話をしていきます。 【対象者】 ・大学生や病院で臨床研究者している方が統計やグラフ作成が必要なんだけどどうやってすればいいかわからない!? ・職場でデータ分析に挑戦したい!でも周りにできる人が誰もいない... と悩んでいる方に刺さるような内容にする予定です 【Rに関して】 ・EdxのProfessional Certificate in Data Scienceを修了 ・LinkedInスキルテストに合格 ・病院の研究チームでRの使い方を指導している ・理学療法士の研修会で統計の講師の経験あり 【注意事項】 ・病院で臨床研究をしている理学療法士です。 ・kaggle的なデータサイエンスや機械学習・AIの情報が欲しい方に刺さる内容はあまり無いです。

  • Edx:ハーバード大学データサイエンス(R)

    無料で世界の大学の授業を受けることができるEdxの勉強記録。今回はハーバード大学の「データサイエンス:Rの基礎」です。

最近の記事

  • 固定された記事

医療統計で必要なtable1、集計からofficeに貼り付けるまでをgtsummaryパッケージで一気に行う

*更新日:2020/09/28 *記事を大幅に追加 *最終更新日:2020/09/30 *gtsummaryのバージョンが上がったことでインストールのコードを一部修正 医療統計に限らず、データを分析する時に集計表を出す場面は多くあります。 特に医療統計では表1(table1)として図表の最初に提示することが多いです。 ポスター発表だとPower Pointでしょうか。 論文であればWordを使うかもしれません。 このtable1を作る時は基本次のような作業が必要にな

    • 【3-2】代表的なグラフの選び方

      グラフといってもたくさんの種類のグラフがあります。 ここでは代表的なグラフの使い分けについて紹介します。 データの尺度から考えるまずはデータの尺度という視点で考える方法です。 連続尺度 身長・体重・年収など数値として扱う尺度です。 連続尺度はさらに+, ーで計算できる間隔尺度と+, ー, ✕, ➗ がつかえる比例尺度に分ける事もできます。 順序尺度 順位・ランキングやアンケートの5段階などの順序を使った尺度です。 5段階評価があったとしても2と3の差と3と4の差が

      • 【3-1】Rでグラフを作るために必要な考え方(ggplot2)

        Rはグラフを作ることがとても得意です。 こちらのサイトではいろいろなグラフの紹介や使い分け、Rのコードが載っています。中にはExcelでは作成が難しいものもあり、Excelではできないとメリットもあります。特にggplot2パッケージは有名です。 今回はRでグラフを作るための基本の考え方を紹介します。 グラフを重ねるグラフ作成に慣れていないExcelのグラフの作り方(ピボットグラフ・テーブル形式を使わない)は以下になることが多いです。 作りたいグラフを決める そのグ

        • 2章の知識を使った課題

          第2章ではtidyverse(特にdplyr)を使ったdata.frameの扱い方について紹介しました。 ここでは実際に架空データを扱ってみます。 今回は解法はいくらでもあります。人によってぜんぜん違うかもしれません。めんどくさく1つずつ手打ちする面倒くさい方法もあれば少ないコードで一気にしてしまう方法もあります。 今ならChatGPTやGeminiに相談すればすぐに教えてくれます。ただどう質問すればいいだろう?と質問するスキルもそれなりに必要だったりします。 質問スキ

        • 固定された記事

        医療統計で必要なtable1、集計からofficeに貼り付けるまでをgtsummaryパッケージで一気に行う

        マガジン

        • Rで始める統計・データ分析入門
          34本
        • Edx:ハーバード大学データサイエンス(R)
          5本

        記事

          【2-8】Rで集計を行う色々な方法

          `summarise()` has grouped output by 'group'. You can override using the `.groups` argument. はじめに今までの記事ではRの基本的な使い方やdata.frameを扱う方法、複数のファイルを繋げる方法を紹介してきました。今までの方法を組み合わせればある程度のデータの集計やグラフを作る下準備ができたと言えます。 今回はいよいよ集計する方法を紹介します。具体的にはグループごとの人数や合計、平

          【2-8】Rで集計を行う色々な方法

          【2-7】Rでwideデータとlongデータを変換する

          はじめにRで分析、集計、グラフを作成するときはlongデータとwideデータについての理解が必要です。 プログラミングやExcelのピボットテーブルで集計をしていないと左のwideデータが馴染み深いと感じると思います。これは人にとっても見やすい形式だと思われます。 しかし特にRで集計やグラフを作成するとなると右のlongデータの方が圧倒的に作業時間が少なくて済むことがあります。longデータとwideデータを自由に変換できることは分析する上で大切になりますので今回はpi

          【2-7】Rでwideデータとlongデータを変換する

          【2-6】複数のdata.frameを横につなげる(bind_cols, joinの使い方)

          はじめに【2-5】複数のdata.rameを縦につなげるではdata.frameを縦に繋げました。 今回は横に繋げる方法を紹介します。 例えば"基本情報"と"実際のテスト"という複数のcsvやExcelのデータがあるとします。ここでそれぞれにあるidを揃えてデータがつながると便利ですよね(ExcelだとVlookupです)。他にもデータの構造上行数が揃っている場合もあります(患者の入院時・退院時のような時系列データの場合など)。この場合はidなど気にせずそのまま繋げてもいい

          【2-6】複数のdata.frameを横につなげる(bind_cols, joinの使い方)

          【2-5】複数のdata.frameを縦につなげる(bind_rowsの使い方)

          例えば1月, 2月, 3月…と複数のcsvやExcelのシートがあったとします。 慣れない方はコピペでデータを繋げたりしますがRでは簡単につなげることができます。 もちろんExcelでもPower Queryを使えばつなぐことは可能ですが、今回はRを使って繋げてみたいと思います。 ちなみに今回の方法は列名の順番がバラバラでも大丈夫です! データの準備#pacmanパッケージがあるかを確認。なければinstall.packagesパッケージをインストールif (!requ

          【2-5】複数のdata.frameを縦につなげる(bind_rowsの使い方)

          【2-4】Rで列名を変更する方法

          はじめに第2章ではdata.frameの使い方について紹介しています。 csvやExcelなど外部データを読み込むときは列名を変えたいことはよくあります。 今回は列名を変更する方法について紹介します。 データの準備#pacmanパッケージがあるかを確認。なければinstall.packagesパッケージをインストールif (!require("pacman")) install.packages("pacman")#今回使うパッケージpacman::p_load(dply

          【2-4】Rで列名を変更する方法

          ChatGPTでPubmedの検索式を作ってみる

          この記事を読みChatGPTを練習しているところですが、先日のnoteのイベントがlogmiで読めるようになっていました。 この記事を参考にChatGPTでpubmedの検索式を作成してみました。更にChatGPTでその検索式の改善案も提案してもらいました。 Elicitで十分ですって!?そんなこと言わんといて下さい笑 ちなみに使ったのはChatGPT Mar 14 Version. Free Research Preview.です。 プロンプト案深津式プロンプト・シ

          ChatGPTでPubmedの検索式を作ってみる

          R 〜はじめの一歩〜

          先日シリア地震のチャリティー企画でR〜はじめの一歩〜という話をさせていただきました。その時の資料を公開します。 内容Rを始めるときのおすすめの書籍どれも初心者が学ぶ上で有用かつ辞書としても使えるような本ばかりです。 通称宇宙船本という代表的な書籍です。統計以外にもRでこういったことができるというイメージがつきやすいと思います。 個人的には前処理本と考えています。そもそもRを使って分析する前に手元のデータが分析できる形になっていないことが多いのですが、この本である程度の前

          R 〜はじめの一歩〜

          Rを使って3点の座標から角度を求める

          はじめにすぐに回答できなかったので数学の復習も兼ねて調べてみました。 基本的な考え方角度は2つのベクトルの内積を計算することで求めることができるらしいです。 データ#座標の指定o <- c(1,1)a <- c(3,3)b <- c(1,4)#一応可視化tibble(x = c(1,3,1), y = c(1,3,4), label = c("o", "a", "b")) %>% ggplot() + theme_classic(base_size = 20) +

          Rを使って3点の座標から角度を求める

          キーボード沼に足を突き刺した話

          #買ってよかったもの というタグがあったので1ヶ月前限定でキーボード沼に足を突き刺した話をしてみようと思う。普段はnoteでこんな記事を書かないので思いのまま好きなだけ書いてみたいと思う。 キーボードには沼があるらしいマツコの知らない世界だったかな。最初は意味がわからなかった。 だってキーボードが変わってパソコンの動作が速くなったり、画質が良くなったりしないじゃないですか。いや、確かに謎に湾曲して「人間工学的にフィットする」とかいうと体にいい気もする。 そもそもキーボード

          キーボード沼に足を突き刺した話

          【2-3】Rで列の追加や修正を行うmutate()の使い方

          はじめに第2章ではdata.frameの使い方について紹介しています。 今回は列の追加や修正を行うmutate()について紹介します。 mutate()のイメージExcelでは新しい列を作ったり、既存の列を一度に修正する作業と似ています。 パッケージと使うデータの準備#pacmanパッケージがあるかを確認。なければinstall.packagesパッケージをインストールif (!require("pacman")) install.packages("pacman")#

          【2-3】Rで列の追加や修正を行うmutate()の使い方

          【2-2】Rで特定の列や行を抽出するselect(), filter(), slice()の使い方

          はじめに Rで集計やグラフ作成を行う場面は多くあります。 その際、元の表から分析に使いたい列や行だけを抽出したり、「男性だけを取り出す」みたいに様々な条件にあった行だけを抽出することが必要になります。 今回はRで指定した列や行だけを取り出すselect関数、slice関数、filter関数を紹介します。 これらはtidyverseパッケージ内にあるdplyrパッケージの機能です。 パッケージとデータの準備#pacmanパッケージがあるかを確認。なければinstall.p

          【2-2】Rで特定の列や行を抽出するselect(), filter(), slice()の使い方

          RstudioのEditor font以外のフォントを変更する

          *2023.03.06に記事を修正しました。 はじめに最近RStudioを最新に変更したのですが、フォントが変わってしまって困っていました。日本語表示が急に明朝体になってしまったんですよね… 自分の環境は以下の通りです。 macのバージョン:MacBook Pro (Early 2015)R version 4.2.2 (2022-10-31)Rstudioのバージョン:2022.12.0+353 (2022.12.0+353) 個人的にも調べたのですが分からなくてR

          RstudioのEditor font以外のフォントを変更する