Rって素晴らしい①
○はじめに
以前の記事で私が、一般の人からすれば名前すら知られていないとても面白い分野に首を突っ込んでいることを述べたと記憶しています。
そして私はその中でも、Rとデータを用いて分析する研究を卒業論文のレベルでやっています。
このRという言語の扱い、非常に面倒くさい
私は日々、そんなことを感じながらキーボードを叩いています。
プログラミング言語というものにあまりなじみがなく、ここまで真剣になっているのも今回の機会が初めてということもあり、色々調べてその場で導入しても3日後に忘れる、というサイクルを繰り返しているので、
自分がどういうノリでこの問題に対処したのか??
といったことを、今一度纏めようと思い、この記事を書いています。
と言っても、自分が卒論で使っているデータをここでそのまま使う訳にもいかないため、自分が直面したデータと同じような形式のデータをこちらでこさえたうえで、直面した問題とそれの対処法を随時書いていこうかな、と思います。
なお、専門的なことは僕自身よく分かってないので、原因とかに関してはふわっとした解説になります。
なんかよくわかんないけど取り敢えずやりたいことは出来る状態にしたい
というノリの方向けになるかと思います。正直qiitaで書いた方が良い気がするけどこっちの方が馴染んでるのでこっちに書きます。仮に変更するとかなったらリンクこっちに貼る形でお知らせします。
というわけで今日は第一回として、R導入時のハウトゥーを書いていこうと思います。
○Rって何よ??
ここでは、そもそもRってなんでしょうか、といった説明をします。
端的に言うと、Rは「データ分析向けのプログラミング言語」と言えます。
近年、世の中には様々なタイプのプログラミング言語が溢れています。
それぞれのプログラミング言語というものは、それぞれが向いている作業というものがあります。
例として、最近注目されている、pythonは、機械学習やAIの分野での開発、C#はゲーム開発など、といった形になっています。
Rの場合はそれがデータの分析になるわけでございます。
なので、そもそもデータ分析をすること自体あまりないですよ、って方はそんなに無理して使うこともないかなって思っています。
以上がRという言語の説明になります。
○Rを導入しよう
Rを導入する際には、基本的にRとR-studioというものを、インストールすることになります。
R-studioは、表現が難しいのですが、R単体だと画面操作とか複雑になるんだけど、R-studio上でRを動かすと、色々操作が楽になるもの、と思ってくれれば幸いです。
さて早速ですが、Rを導入する前に、確認してほしい箇所が一か所あります。
それは、皆様のパソコンのユーザーフォルダー名になります。
確認事項としましては
「ユーザーフォルダー名が英語で書かれているか」
といった点になります。詳しいことについては最後の方におまけとして書きますが、これが英語じゃないとR君が想定外の挙動をすることがあるため、(実際私もこいつが原因っぽいことで動作がおかしくなった経験あり)
これが英語になってない場合は、新しく英語のユーザーアカウントを作るなりして、ユーザーフォルダ名が英語になっている状況にしてください。
さて、以上の確認を踏まえていよいよRをインストールしましょう。
Rの導入は次のリンクから
このリンク先で、上の方にダウンロードのためのリンクがあるので、
windowsユーザーなら Download R for Windows、
macユーザーならDownload R for mac
から、
install R for the first time.のリンクを踏み、最新版のRのインストーラをDLして、
インストーラを起動して最新版のRをDLすればおけです。
R-studioについては以下のリンクから
自分のOSにあったインストーラをDLして、そこからR-studioをインストールして終わりです。
インストール後はR-studioを起動して、Rの基本的なコマンドを入れて問題なく動く用だったら大丈夫でしょう。
お疲れ様でした。
以上で第一回の内容を終わります。
データが準備出来次第2回目以降も解説していければと思います。
※補足:何で英語のユーザーフォルダ名じゃなきゃいかんの??
補足です。ユーザーフォルダ名の扱いについて触れましたが、これはR側の使用が大きく影響しているようです。
僕自身あまり理解していないのですが、RはR内で作ったプログラミングのコードを保存する際に、widowsの場合、初期設定で、ユーザーフォルダ上のドキュメントフォルダに保存するようになっているらしいです。
この際、R内では恐らく、このPCのユーザーフォルダ内のドキュメントファイルに保存します!!!みたいな処理がなされています。
この際にRの特性が悪さすることがあります。
というのもRは、ニュージーランドで開発されたこともあり、規格が日本語の規格に対応することを想定していないっぽいです。
これは言い換えると、ユーザーフォルダ名が日本語とか漢字になっていると、R側が想定している規格での処理が想定通りにならないことが発生するっぽい、といった感じなります。
これにより、思いもよらない不調が発生したりします。
だから、ユーザーフォルダ名を英語にする必要があったんですね。
この記事が気に入ったらサポートをしてみませんか?