GPA2.4の怠惰大学生がAIにハマった話
こんにちは,普段はリーピッピという名前でTwitterで活動をさせていただいてます。
ちなみに最近アイコンを変えました。彼女が書いてくれました、似てるところは髪型と片目が二重なところくらいです、、、
テックブログも書いてみたいと思っていたのでその練習がてら、自分の今年1年の振り返りnoteを投稿してみようと思います。
GPA2.4の自分が1年間AIにハマった結果,今は3社でAI関連の長期インターンに参加させてもらっています。
AIにハマる前の自分(2021~2023)
部活ガチ勢(運動系の部活で授業を切りまくって練習しまくってました)
バイトは家庭教師で8人の生徒を持っていて,それで貯めた金は春休み,夏休みに旅行をしまくって全部使い切っていました。
4年生になると他の人は単位を取り切っているのが普通ですが,自分は14単位ほど足りてなくて卒業もちょっと危うい感じでした。(2,3年の必修を落としていたのでそれをまた落とすと即留年決定,まだ卒業は確定してない,,,)
つまり典型的な怠惰な大学生です
AIにハマったきっかけ(2024年1月初期)
去年の冬ごろから自分の全く知らない分野の本を読むのに謎にハマっていて、株,麻雀,将棋の本だったりをメルカリで買って読みあさっていました。
その時の流れで初めてのディープラーニングという本を興味本位で購入し読んだのがきっかけでした。この時は大学の授業も適当に受けていたので線形代数,微積, 統計の知識が無さすぎて2割くらいしか理解できませんでした、、、。
この時単純にディープラーニングというなんかカッコいい文字面が気に入ってここからAI関連の本を読み漁る日々が始りました。
またこの頃部活の練習中に足を骨折してしまい,全治3ヶ月で部活の大会に一つも出れない事が確定してしまい,失意の中何かハマれるものを探していました。
この怪我がなかったらそこまでAIにハマっていない気がします。
AIの本を読み漁る期(2024年1~3月)
部活の予定が丸々暇になり、さらに足を骨折していたので外にも行けず、完全に家で暇だったのでアニメやら映画を見ながらAI関連の本を適当に読み漁る時期が始まりました。
色々読み漁った中で一番おすすめな本を挙げときます。オライリー系の本を買ったりもしましたがこの時期は線形代数の行列がわからなすぎてすぐに挫折しました。
スッキリとわかるpythonによる機械学習はAI勉強したての人にマジでめちゃくちゃオススメです!
これを読んで漠然とカッコいいと思っていた単語の意味がどんどん分かってめちゃくちゃ楽しかったです。
この時はpythonのライブラリーという概念すら知らなかったので,numpy,pandasが何か統計とかの教科の名前かと思っていました笑
この時にかっこいいと思っていた単語
numpy,pandas,matplolib,サポートベクターマシーン,ランダムフォレスト
GCIどハマり期(2024年4月~7月)
kaggleの挫折
AIの初学者のあるあるで機械学習とかpandasに少し慣れてきたタイミングでkaggleに手を出し始めると思います。
自分もまさにそれでkaggleのコンペに参加してメダルを取るぞと意気込むものの見事に挫折しました。ノートブックを見ても何を書いてるのかちんぷんかんぷんでした。(今思うとこの時のノートブックがpandasではなくてpolarsで書かれているものがほとんどでこの時の自分にはハードルが高かったですね、、)
この時titanicコンペが初心者の登竜門と知り、ブログのコードを丸パクリで初めてkaggleにスコアを投稿できて喜んでました。
GCIいざ受講
この時に見ていたブログでGCIの存在を知り受講することを決意しました。
この時はモチベーションに溢れていたのでGCIの優秀性になる気満々でした。
GCIについてはかなり調べて受講前からコンペが2つとどうやら無茶苦茶重い最終課題があるらしいぞくらいの認識でした。
GCI受講中にやったこと
GCIの授業自体はすっきりとわかるpythonによる機械学習とかなり似ていたので授業は結構流してました。
その分コンペにはめちゃくちゃ時間を注ぎ込みました。
この時にコンペを通してブログなどを読みまくったことにより機械学習周りの知識がめちゃくちゃ付きました。
最終課題も7月は四六時中パワポをいじったりしていてかなりの時間を使いました。
GCIとは別でやってたこと
機械学習をやり始めると統計が必要そうだぞということになり、4月の中旬から統計検定準1級を目指して統計の勉強をはじました。
統計検定2級は統計webを読み込んで大体理解し、統計検定準1級に関してはワークブックが難しすぎたので大学の図書館で多変量解析、ベイズ、時系列分析、確率分布の入門書をそれぞれ何冊かを読んで概要くらいは理解できました。
ただ一通り概要を知るとこれを極める気が急に起きなくなりそこからは統計検定準1級の受験を諦めてしまいました。
まとまった時間が取れればリベンジしたいなと思ってます、、、
時期的には4月中旬から5月末くらいまでやってました。
途中コンペにハマりすぎてそれに伴って勉強時間が少なくなり辞めてしまいました。
またこれ以外にはSQL,AWS,8月末の院試に向けて線形代数,微積をちょこちょこやってました。
1つ目のインターン キー局のデータ分析インターンを始める
研究室の機械学習に詳しい先輩がいて、その先輩が求人を教えてくれてダメ元で申し込んみました。
面接ではGCIのコンペをめちゃくちゃやりこんでそこそこの順位をとりました!的な事を言ったら受かりました。(1回目のコンペは42位?くらい)
業務的にはpythonでpandasさえ扱えればできるような感じなのでこれくらいの実力でも合格できたのだと思います。
ガチガチのAI系なら100%受からなかったと思います。
大学院入試期(7~8月)
この時期はひたすら大学院入試の勉強をしていました。もともと大学でまともに学んだことがほとんどなかったのでめちゃくちゃ1から勉強しました。
線形代数,統計,微積,アルゴリズム,AI関連を満遍なく勉強しました。
この時にちゃんと数学をやっていたのは後々かなり効いてきたので頑張ってよかったなと思います。
過去1伸びたツイート,この頃からフォロワーが増えすぎて困惑しました
大学院入試と並行でサマースクール
GCIが良かったので勢いで松尾研のサマースクール3つの受講も同時に始ました。
この時の状況としてコンペを頑張ったおかげで機械学習に関する知識はかなり自信がありました。ただディープラーニング方面は何も分かっていませんでした。
このサマースクールの受講条件がディープラーニングの基礎知識があるというものだったので受講条件は全く満たしていなかったのですが、GCIで自信がついて背伸びをして申し込みました。
結果的は生成AIと強化学習は全て受け切って修了証を受け取れました,金融は途中で辞めてしまいました。
毎回の授業を聞いても何もわからなかったので1回の授業のレジュメが出るたびに5,6時間かけてChatGPTに聞きまくって紙にまとめるということをひたすら繰り返していました。
今思えばこれのおかげでディープラーニング,強化学習,生成モデルについてはかなり理解が深まったと思います。
サマースクールやり込む期と2つ目のインターン(2024年9月)
無事大学院入試に終わりそのままサマースクールをやりこんでいました。
大学院入試終わりにみんなで打ち上げをして夜に家に帰った後にサマースクールの復習をするくらい熱中してました。去年の自分なら考えられない、、、
ここら辺でGCIの結果が帰ってきて優秀性にはなれなくて結構凹みました。今思うと優秀性にはなれるとは思えない最終課題だけどあの時は自信がありました。
この時にEpicAIの方にTwitterで誘っていただいて入らせてもらいことになりました。技術も経験もなかったのでこのお誘いは嬉しくて本当にあるがたかったです。
(読んでる本のチョイスが良かったので誘ってくれたらしいです笑)
EpicAIにのめり込む期(10月)
インターン開始の1ヶ月目は誘っていただいた方に色々教えていただきながら3つのエキスポ用のデモを作成しました。
最初は全く作れるイメージがわかなかったものの丁寧に教えてもらえたのでやり切る事ができました。
この経験が今思うとすごく大きな1歩になったと思います。
研究と部活をやり込む期(11月)
実は4月くらいから部活は再開していてずっと平行してやっていたものの引退が近づき本腰が入って練習していました。
また研究も論文が出せそうなレベルで良い結果が出せました。
また10月に作ったものを使って松尾研の共同研究インターンにも入れました。
これから
後半から疲れて雑になってしいましたがこれからはインターンで目の前の仕事を全力でやって色々なことを吸収して行きたいなと思います。
世界が広がってさまざまなすごい人に出会えたのでその方達と方を並べられるレベルまで成長していきたいなと思います。