見出し画像

Googleデータアナリティクス認定資格【データ分析とR 言語】

 ウィークリーチャレンジ1

1.データアナリストは、言葉や記号を使ってコンピュータに指示を出します。その言葉や記号は何として知られているでしょうか?

A シンタックス言語
B コード言語
C プログラミング言語
D 関数言語

正解:C

2.多くのデータアナリストがプログラミング言語の使用を好む理由は、以下のうちどれでしょうか?当てはまるものをすべて選んでください。

A 時間を節約できるため
B 分析ステップを明確化できるため
C 分析結果を簡単に再現・共有できるため
D 分析テーマを選ぶため

正解:A・B・C

3.自由に利用でき、使う人が変更、共有できるプログラミングコードを何というでしょうか?

A データセントリック
B オープンソース
C オープンデータ
D オープンエンド

正解:B

4.多くのデータアナリストが R を選択する理由は何でしょうか?当てはまるものをすべて選んでください。

A 大量のデータをすばやく処理できる
B データ指向型のプログラミング言語である
C 質の高いデータビジュアライゼーションが作成できる
D クローズドソースのプログラミング言語である

正解:A・B・C

5.空欄を埋めてください:あるデータアナリストが、すばやくビジュアライゼーションを作成し、チームメンバーと共有したいと考えています。この場合、_____を分析に使用することができます。

A SQL
B ダッシュボード
C R 言語
D データベース

正解:C

6.RStudio の統合開発環境に含まれるのは、以下のうちどれでしょうか?当てはまるものをすべて選んでください。

A コマンドを実行するためのコンソール
B ロードしたデータを管理するための領域
C コードスクリプトを書くためのエディタ
D 動画を再生するためのビューアー

正解:A・B・C

7.RStudio では、以下のうちどの部分でコードを実行できるでしょうか?当てはまるものを 2 つ選んでください。

A Plots(プロット)ペイン
B Environment (環境)ペイン
C R Console(R コンソール)ペイン
D Source Editor(ソースエディタ)ペイン

正解:C・D

8.空白を埋めてください:RStudio では、_____に現在ロードしているすべてのデータが表示され、簡単に整理・保存できます。

A Environment (環境)ペイン
B Source Editor(ソースエディタ)ペイン
C Plots(プロット)ペイン
D R Console(R コンソール)ペイン

正解:A

ウィークリーチャレンジ2

1.空欄を埋めてください:R で変数を作成する場合、変数名は _____ で始める必要があります。

A 数字
B 演算子
C 文字
D アンダースコア

正解:C

2.ここでは、値 43, 56, 12 の順に並べたベクトルを作成したいと考えています。変数を指定した後、どのような R のコードチャンクを使えばベクトルを作成できるでしょうか?

A c(43, 56, 12)
B c(12, 56, 43)
C v(12, 56, 43)
D v(43, 56, 12)

正解:A

3.あるアナリストが、データセットに文字列として表示された日付December 10th, 2020 を見つけました。この文字列を日付/時刻型に変換するためには、どの関数を使用すればよいでしょうか?

A mdy()
B now()
C datetime()
D lubridate()

正解:A

4.あるデータアナリストが、RStudio で以下のコードを入力しています。 sales_1 <- (3500.00 * 12) このコードに使用されている演算子は、以下のうちどれでしょうか?当てはまるものをすべて選んでください。

A 代入演算子
B 算術演算子
C 関係演算子
D 論理演算子

正解:A・B

5.以下のうち、一般的に用いられている命名規則に従った名前を持つ変数はどれでしょうか?当てはまるものをすべて選んでください。

A 1_plum_total
B *totalplums*
C plum_total_1
D total_plums

正解:C・D

6.R のパッケージにはサンプルデータセット、再利用可能な関数、関数の使用方法に関するドキュメントが含まれています。 この記述は正しいでしょうか、誤りでしょうか?

A 正しい
B 誤り

正解:A

7.Base R にないパッケージをインストールしたい場合、R のどこからパッケージを呼び出せばよいでしょうか?

A CRAN
B tidyverse
C Python
D RStudio のウェブサイト

正解:A

8.あるデータアナリストが、あるデータに対して複数の処理を実行する一連のネスト関数を過去に R で作成しました。同じ処理を再度実行できるよう、またステークホルダーが理解しやすいコードにしたいと考えています。この場合、以下のどれを使用すればよいでしょうか?

A パイプ演算子
B コメント
C ベクトル
D 引数

正解:A

ウィークリーチャレンジ3

1.あるデータアナリストが、基本的なデータフレームの代わりに tibble を使用することを検討しています。tibble の制約にはどのようなものがあるでしょうか?当てはまるものをすべて選んでください。

A tibble では変数名を自動的に変更しない
B tibble では行名を作成することはできない
C tibble ではコンソールに負荷がかかる
D tibble では入力するデータの型を変更することはできない

正解:A・B・D

2.あるデータアナリストが、大きなデータフレームを扱っています。そのデータフレームには非常に多くの列が含まれており、一度に画面に表示できません。そこで、データの中身を把握するために、すべての列名をすばやくリストアップしたいと考えています。この場合、どのような関数を使用すればよいでしょうか?

A mutate()
B str()
C colnames()
D head()

正解:C

3.ここでは、ToothGrowth というデータセットを使用しています。head() 関数を使用して、データセットのプレビューを取得したいと考えています。このプレビューを得るためのコードチャンクを以下に記述してください。

head(ToothGrowth)

問題:ToothGrowth のデータセットの列の名前は何でしょうか?

A len, supp, VC
B VC, supp, dose
C len, supp, dose
D len, VC, dose

正解:C

4.あるデータアナリストが、penguins のデータセットを扱っています。すべての列名が一意かつ一貫性があり、文字、数字、アンダースコアのみを含むことを確認するためには、どのようなコードチャンクを記述すればよいでしょうか?

A rename(penguins)
B drop_na(penguins)
C select(penguins)
D clean_names(penguins)

正解:D

5.あるデータアナリストが、R で penguins のデータセットを扱っています。どのようなコードチャンクを使えば、データを bill_length_mm という変数で並べ替えられるでしょうか?

A arrange(=bill_length_mm)
B arrange(bill_length_mm, penguins)
C arrange(penguins, bill_length_mm)
D arrange(penguins)

正解:C

6.ここでは、penguins のデータセットを扱っています。summarize() と mean() 関数を使用して、変数 body_mass_g の平均値を求める場合のコードを以下に記述しています。

penguins %>%
drop_na() %>%
group_by(species) %>%

ここに、変数body_mass_g の平均値を求めることができるコードチャンクを(上記構文に続く部分のみ)記述してください。

summarize(mean(body_mass_g))

問題:Adelie species の平均体重は何 g でしょうか?

A 5092.437
B 4207.433
C 3706.164
D 3733.088

正解:C

7.あるデータアナリストが、salary_data というデータフレームを扱っており、standard_wages 列と overtime_wages 列のデータを合計する total_wages という新しい列を作成したいと考えています。 total_wages 列を作成するためには、どのようなコードチャンクを記述すればよいでしょうか?

A mutate(salary_data, total_wages = standard_wages * overtime_wages)
B mutate(salary_data, total_wages = standard_wages + overtime_wages)
C mutate(salary_data, standard_wages = total_wages + overtime_wages)
D mutate(total_wages = standard_wages + overtime_wages)

正解:B

8.あるデータアナリストが、stores というデータフレームを扱っています。データフレームには都市 (city) と州 (state) を表す別々の列があり、これら 2 つの列を結合して city と state をコンマで区切った location という名前の 1 つの列にしたいと考えています。location 列を作成するためには、どのようなコードチャンクを記述すればよいでしょうか?

A unite(stores, “location”, city, state, sep=”,”)
B unite(stores, “location”, city, state)
C unite(stores, city, state, sep=”,”)
D unite(stores, “location”, city, sep=”,”)

正解:A

9.あるデータアナリストが、データの理解を深めるために統計的な手段を用いています。2 つの変数がどの程度強く関連しているかを判断するためには、どのような関数を使用すればよいでしょうか?

A bias()
B sd()
C mean()
D cor()

正解:D

10.あるデータアナリストが、bias() 関数を使用して予測値と実測値を比較し、モデルに偏りがあるかどうかを判断しました。その結果、0.8 というスコアが得られました。これは何を意味するのでしょうか?

A バイアスの断定ができない
B モデルにバイアスがかかっている
C モデルにバイアスはかかっていない
D バイアスの断定ができる

正解:B

ウィークリーチャレンジ4

1.ggplot2 で実行できる操作は、以下のうちどれでしょうか?当てはまるものをすべて選んでください。

A 散布図や棒グラフを作成する
B プロットにタイトルとサブタイトルを追加する
C プロット作成前にデータを自動でクリーンアップする
D プロットの色やディメンションをカスタマイズする

正解:A・B・D

2.空欄を埋めてください: ggplot2 では、プロットにレイヤーを追加するために_____を使用します。

A パイプ演算子(%>%)
B アンパサンド(&)
C イコール記号 (=)
D プラス記号(+)

正解:D

3.あるデータアナリストが penguins のデータセットで、体重( body_mass)とフリッパーの長さ(flipper_length)の相関関係の分布図を作成するために、以下のようなコードチャンクでプロットを作成しています。

ggplot(data = penguins) + geom_point(mapping = aes(x = flipper_length_mm, y = body_mass_g))

問題:コードチャンク内の変数は、以下のうちどれでしょうか?当てはまるものをすべて選んでください。

A flipper_length_mm
B y
C x
D body_mass_g

正解:A・D

4.ggplot2 において、変数と点とのマッピングに使用できるエステティック属性は、以下のうちどれでしょうか?当てはまるものをすべて選んでください。

A ファセット
B 大きさ
C 色
D 図形

正解:B・C・D

5.データアナリストが多くのデータ ポイントを含む散布図を作成しており、プロット上のいくつかの点を他の点よりも透明にしたいと考えています。この場合、どのようなエステティックを使用すればよいでしょうか?

A alpha(アルファ)
B color(色)
C fill(フィル)
D Shape (図形)

正解:A

6.あるデータアナリストが penguins とのデータセットで、体重( body_mass)とフリッパーの長さ(flipper_length)の相関関係の分布図を作成するために以下のようなコードチャンクでプロットを作成しています。

ggplot(data = penguins) +
geom_point(mapping = aes(x = flipper_length_mm, y = body_mass_g))

それぞれのペンギンの種類をプロットの形で区別するため、エステティックの図形(shape)を変数 species に対応させるためのコードチャンクを記述してください。

geom_point(mapping = aes(x = flipper_length_mm, y = body_mass_g, shape=species))

問題:このコードチャンクで作成されるビジュアライゼーションには、どの種類のペンギンが表示されるでしょうか?

A Adelie, Chinstrap, Emperor
B Adelie, Chinstrap, Gentoo
C Adelie, Gentoo, Macaroni
D Emperor, Chinstrap, Gentoo

正解:B

7.あるデータアナリストが、以下のようなコードチャンクでプロットを作成しています。

ggplot(data = penguins) +
geom_jitter(mapping = aes(x = flipper_length_mm, y = body_mass_g))

問題:geom_jitter() 関数は、プロットされる点に対してどのような処理を実行するでしょうか?

A それぞれの点のサイズを変えてプロットする
B それぞれの点にランダムな細かいノイズを加えてプロットする
C それぞれの点の色を変えてプロットする
D それぞれの点の形を付けてプロットする

正解:B

8.あるデータアナリストが diamonds のデータセットで棒グラフを作成するために、以下のコードを記述しています。

ggplot(data = diamonds) +
geom_bar(mapping = aes(x = color, fill = cut)) +

このデータのサブセットを条件ごとに表示するために、facet_wrap() 関数を使用したいと考えています。ダイヤモンドの変数、cut に基づいてグレードごとにプロットを分割表示するためのコードチャンクを記述してください。

facet_wrap("cut")

問題:このコードチャンクで作成されるビジュアライゼーションには、サブプロットがいくつ表示されるでしょうか?

A 3
B 4
C 5
D 6

正解:C

9.あるデータアナリストが annotate() 関数を使用して、プロット用のテキストラベルを作成しています。annotate() 関数の引数にコードを追加することで変更できるテキストの属性は、以下のうちどれでしょうか?当てはまるものをすべて選んでください。

A テキストのサイズ
B テキストをプロットのタイトルに変更する
C テキストの色
D テキストのフォント

正解:A・C・D

10.あるデータアナリストが penguins のデータセットで、体重( body_mass)とフリッパーの長さ(flipper_length)の相関関係の散布図を作成するために、以下のようなコードチャンクでプロットを作成しています。

ggplot(data = penguins) +
geom_point(mapping = aes(x = flipper_length_mm, y = body_mass_g)) +

このファイル名を "penguins" にして pdf ファイルとしてプロットを保存するには、どのようなコードチャンクを追加すればよいでしょうか?

A ggsave(penguins.pdf)
B ggsave(=penguins)
C ggsave(“penguins.pdf”)
D ggsave(“pdf.penguins”)

正解:C

ウィークリーチャレンジ5

1.あるデータアナリストが、チームのアナリストが自身の分析プロセスを再現できるように、クリーンアップ プロセスに関するドキュメントを作成したいと考えています。実行可能なコードチャンクを記載したレポートの作成に役立つツールは何でしょうか?

A ダッシュボード
B インラインコード
C コードチャンク
D R Markdown

正解:D

2.空欄を埋めてください:R Markdown Notebook は、HTML や PDF、Word 文書やスライドプレゼンテーション、_____に変換することができます。

A YAML
B ダッシュボード
C テーブル
D スプレッドシート

正解:B

3.あるデータアナリストがヘッダーテキストの横にハッシュタグを 2 つ追加しました。この場合、Rmd ファイル内のヘッダーフォントはどうなるでしょうか?

A フォントが中央揃えになる
B フォントの色が変わる
C フォントサイズが小さくなる
D フォントサイズが大きくなる

正解:C

4.空欄を埋めてください:分析結果に至った説明をコードで直接参照できるようにするためには、R Markdown Notebook に_____を含めます。

A YAML
B インラインコード
C Markdown
D ドキュメント

正解:B

5.あるデータアナリストが、R Markdown ドキュメントに箇条書きのリストを追加したいと考えています。この場合、どの記号を入力すれば箇条書きを追加できるでしょうか?

A 区切り文字
B ハッシュタグ
C アスタリスク
D ブラケット

正解:C

6.あるデータアナリストが Rmd ファイルにコードチャンクを埋め込みました。これによって他のユーザーは何ができるようになるでしょうか?当てはまるものをすべて選んでください。

A Rmd ファイルから直接コードを実行する
B Rmd ファイルから直接オリジナル プロジェクトのコードを元に戻す
C Rmd ファイルで直接コードを修正する
D Rmd ファイルから直接コードをコピーする

正解:A・C・D

7.空欄を埋めてください:区切り記号とは、_____の先頭または末尾を示す文字です。

A データ項目
B セクション
C 分析
D ヘッダー

正解:B

8.空欄を埋めてください:同じようなドキュメントを何度も作成したり、最終的なレポートの見た目をカスタマイズしたりする場合、_____を使えば時間を節約することができます。

A Rmd ファイル
B テンプレート
C コードチャンク
D フィルター

正解:A

コースチャレンジ

合格するには80% 以上

ここから先は

5,498字 / 1画像

¥ 300

この記事が気に入ったらチップで応援してみませんか?