
23年5月16日 Coursera google data analyst 日誌38日目
①Coursera data analyst講座
進捗管理>ステップ1~8
現状>
ステップ1-5/1-5 4月9日まで 3月23日完了!
ステップ2-4/2-4 4月14日まで 4月6日完了!
(ただし、ステップ2>一部演習が未完了)
ステップ3-5/3-5(一部スキップ)4月27日完了!
ステップ4-3-1+2(演習残り)/4-6 6月11日まで
③Open stax statistics (english)学習
実施内容
動画視聴
解説→演習→考察
テスト
学習内容①
SQL ou feuille de calcul ?
En fin de compte, l’endroit où se trouvent les données décidera de l’outil que vous utiliserez.
Si vous travaillez avec des données qui se trouvent déjà dans une feuille de calcul, c’est probablement là que vous effectuerez votre analyse.
Et si vous travaillez avec des données stockées dans une base de données, SQL sera pour vous le meilleur outil à utiliser pour votre analyse.
En tant qu’analyste de données junior, il est important de savoir qu’il existe de légères différences entre les dialectes. Mais en maîtrisant le SQL standard, qui est le dialecte que vous utiliserez dans ce programme, vous serez prêt à utiliser SQL dans n’importe quelle base de données.
========================
Les analystes de données peuvent utiliser les fonctions SUBSTR et TRIM pour nettoyer les variables de chaîne.
LENGTH peut être utilisée dans le processus de nettoyage général pour vérifier si les données sont telles que prévues, mais cela ne nettoie pas réellement les chaînes.
Clause DISTINCT qui supprimera les entrées en double de la colonne nom
trier les résultats par ID de playlists.
SELECT DISTINCT name
FROM playlist
ORDER BY playlist_id
fonction LENGTH qui renverra tous les titres d’album de moins de 4 caractères
SELECT *
FROM album
WHERE LENGTH(title) <4
la fonction SUBSTR pour récupérer les 3 premières lettres de chaque nom de pays et d’utiliser la commande AS pour stocker le résultat dans une nouvelle colonne appelée new_country
SELECT
customer_id,
SUBSTR(country,1,3) AS new_country
FROM customer
ORDER BY country
振返り
最近、統計の土台のための学習ができず終い。先回はスプレッドシート、今回からはSQLでデータベースからのデータクリーニングを演習しているので、学習ペースが落ちても仕方ないとは思う。Alex data analystのほうもみて復習するべきだと感じている(頭に定着させるため)
SUBSTRやORDERBYなど、再度ビデオを見直してまとめ直す必要あり。