
AI2nd#9ふりかえり(MicrosoftAzure)
01 質問回答

A1:データそのものが間違っているということはあまりないです。データにバイアスが多くかかっていたり、欠損値が多くてが分析困難な場合を示すことが多いです。

A2:集める側と出力する側のデータが異なっても変換する手段はあります。質問で挙げられたソフトは十分対応可能だと思います。

A3:自動化ボタンですべて一度に集められるわけではないです。自動化して分析可能な形式がどのようなものなのかは、人間が決めることになります。どんなタイミングで収集するのかについても人間が決める必要があります。

A4:最初から狙い通りのデータを集めるのは非常に難しいので、少しずつ段階を踏んでデータを集めていくのがいいと思います。段階的に顧客に対して価値提供をできれば、続けやすいと思います。価値提供するものに優先順位をつけて細かく進めていくのがいいと思います。

A5:技術的には、一度ETLを構築してデータレイクとして元データをとっておけば再構築の際にも利用可能なので手戻りが少なくなると思います。
最初にたくさんのデータを一生懸命集めることに奔走するのも大事ですが、データごとにETLを構築してつぎはぎのように作っていく事例が多いです。(いずくね先生)
02 クラウドサービスとは?
PCを使う際には2種類あります。
1つめは自分自身のPCを使うこと、2つ目は世界のどこかのPCを少し借りて作業することです。
例えば、GPTではOpenAIのPCを使ったクラウドといえます。
Azureサービスではどのようなことをするかというと、まだ世の中にないサービスを新しくカスタムしてAIを構築します。
なお、その料金についてはサーバーレスによる【従量課金制度】(使った通信量だけの負担)です。そのことによって、一度構築したものを作り直すことが上記の仕組みから非常に安価でできます。
(従来であれば数百万円するようなサーバー機器買ったりするとちょっとやめるなんてできませんよね)
03 Azure実践編
それでは、先生たちが用意されたアカウントに入っていきます。


ここでいう、リソースグループが一般的には「プロジェクト単位」で作られます。その方が予算管理上も管理しやすいためです。
本講座では一人1つのリソースグループとします。
今日はまず自分のリソースグループを作ります。
そのあと、第8回の最後で触れたETLの簡単な実践編をやってみます。
そのまえに、データを外部からとってくる仕組みのカギがAPIです。

天気予報APIから実践編を始めます。

天気情報を定期的に情報を取得してくる作業を自動化してみます。
作業手
順を聞きながらやってみると・・・
どうやら同時作業の上限に達してしまったためデプロイ失敗。

(アカウント数の話なので時間が解決しないタイプ)
このような機能もあることを知ることができたのが収穫です!
たくさん機能がありそうなので、公式サイトにも入っていきます!
03 同期のみなさまの記事紹介
凄い人ばかりなのでぜひ読んでください!