![見出し画像](https://assets.st-note.com/production/uploads/images/95641534/rectangle_large_type_2_b9fdd8f737b16d77d320ccd28ff6eaea.png?width=1200)
Photo by
touma_daidai
仕事を辞めたニートがAI人材になるまで(6)
作者経歴:
2020年6月に国際基督教大学を卒業。
卒業直前に内定取消しを受け、2年間Webライターとして活動。
コロナが落ち着いてきた2022年6月、キャリアチェンジを目指して離職。実家に帰省しPythonの学習を開始。
独学に限界を感じ始めた10月に、キカガクさんのAI人材育成長期コースの受講を決意。2ヶ月間の予習を経て、2023年の1月から本格的に受講開始。
TOEIC980点。
今日の記録です。
DataCamp
Introduction to Importing Data in Python
今日はフラットファイルやリレーショナルデータベースからデータを読み込む方法を学びました。
実務では必要になる知識だろうな、という印象です。
やっぱりSQLも面白そうなので、少しずつ手を出して行きたいです。
キカガク
MeCabを用いた文章からの名詞抽出とベクトル化
単語の解析は結構面白いです。TfidfVectorizerを今日初めて使いました。CountVectorizerとの使い分けはまだ習ってないので、今後調べていこうと思います。
つまずいた点として、次に単語の辞書について理解が足りていませんでした。
![](https://assets.st-note.com/img/1673702367804-0US6vPRGBP.png)
この辞書について、Keyに対応する値がVectorizeした結果であるリストの要素番号ということに気づいていませんでした。(伝え方が分かりにくく、すみません。)
おわりに
ゴリゴリ勉強を無心で進めるのはDataCampの方が良いかも知れません。
ただ、道中で何度も立ち止まりながら疑問を解消しながら成長を感じるのはキカガクさんです。
理想的には両方を同時並行がいいのかな、と考えてます。