言語処理100本ノック2020に挑戦中
今日で、 #100DaysOfCode 6日目です。Twitterで、#100DaysOfCodeのメッセージを上げると、ボットがすぐに拾いに来てリツイートしてくれます(*^^*)さすが!
いろいろな人がQiitaやご自分のブログなどで解答例を書かれているみたいなので、それを頼りによくわからないのに安易に初めてみたけれど、やっと解答を見つけても、Google Colaboratoryの環境で解答を書いている例が少なく、あっても途中の章で終わってたり(笑)で、また解答例探し。。毎日、エラー出しながら少しずつ学んでいます。
とりあえず、第1章から第6章まで、超特急で解答のありかを見つけて、コピーして動くかどうか確かめました。第5章のCaboCha以外のライブラリはGoogle Colaboratoryの中にあるようなので、Pandasなども、importだけですみます。これで、環境設定の時間を大幅に短縮して中身に集中できると思います。
6章までで、困った点としては2点……
1.Google ColaboratoryにCaboChaをインストールする方法がいまいちわかってない。これは今のところコピペで動きましたが、もう少し簡単な方法がありそうな気がするので、また私が理解した時点で書いてみたいと思います。(MeCabともう一つのインストールがあらかじめ必要なようですが、そのことを書いてないサイトもあり、その点はまだ私の中で不明確です)
2.Google Colaboratoryのどこに自分がアップロードしたファイルが入ったのかわからない。
Google Colaboratoryでは、ファイルをGoogle Driveに入れてそれを料理するため、解答例のコードをそのままペーストしても、その人がファイルを置いた場所と違う場所にあるので、エラーが出ます。ファイルがどこにあるか正確に教えてあげないと、ちゃんと料理すべきファイルをダウンロードしてアップロードしてここに見えてるのに、「存在しません」なエラーがきます。。。
パソコンの中のパスなら、なんとなくわかっているのですが、通常使っているGoogle Driveのファイル構成よりも、Google Colaboratoryで使っているファイル構成に慣れていないため、自分がアップロードしたファイルがいったいどこに入るのか、その時々で違う場所に入るので、、、さっぱりわからない状態でした。次の日には、アップロードしたファイルも自動的に消滅していますし、、、007か?(笑)
すべてのマニュアル読まずに進めている自分が悪いんだけれど、すごい簡単な方法を発見しました。Google Colaboratoryの左のほうにあるファイルフォルダの中にある自分が操作したいファイルを右クリックしたら、正確なパスがわかります。
たとえば、45txtというファイルを右クリックして、「パスをコピー」をクリックしたら、必要なところに貼り付けて、
/content/45.txt
のようなパスが得られます。
簡単なことなんですけど、これで2日も流浪の民になったので、メモしておきまする。φ(・・*)