マガジンのカバー画像

Rによる二次的データの分析

51
社会的データについてRStudioを使ってグラフを作成したり統計学的分析をおこないます。
運営しているクリエイター

2021年5月の記事一覧

転出入人口比率の高い市町村(福岡県)

転出入人口比率(OutOverIn)について。```{r,echo=FALSE,include=FALSE}for (i in 1:60) { cat(dat$X2[i],"--",dat$OutOverIn[i],"\n")}``````{r}# データフレームを転出入人口比率の降順で並び替える# 新しいオブジェクト名: OutOverInd <- arrange(dat,-OutOverIn)``````{r}# 上位20を抜き出すtop20 <- d[1:20,]t

転出入人口比率(福岡県)

### 4.7.2 転出入人口比率(OutOoverIn)```{r, include=TRUE, echo=FALSE}library(ggplot2)ggplot(fukuoka_map)+geom_sf(aes(fill=OutOverIn))+labs(x="東経",y="北緯",title="転出入人口比率",fill="OutOverIn",caption = "2015年")+theme_minimal(base_family = "HiraKakuProN

ggplot2で作図

第1波から第2波へ

産業別就業者数の推移

感染症死亡率の推移

```{r}library(tidyr)dat_ <- dat %>% gather(Y2012:Y2019,key="key",value="value",-X1,na.rm = TRUE)library(ggplot2)ggplot(dat_,aes(x=key,y=value,group=X1))+ geom_line(size=1, aes(col=X1))+labs(y="死亡率(人口10万対)",col="凡例",title="感染症死亡率の推移",captio

専門的技術的、管理的職業の動向

long formatでデータを作成。```{r}dat_ <- gather(work,"key","value",-code)``````ggplot(dat_,aes(x=key,y=value,group=code))+ geom_line(size=2,aes(col=code))+labs(x="year",y="percent",fill="legend",title="専門的管理的職業の動向",caption = "国勢調査",subtitle = "19

昼夜間人口比率の高い市町村(福岡県)

昼夜間人口比率(A6108)について。```{r,echo=FALSE,include=FALSE}for (i in 1:60) { cat(dat$X2[i],"--",dat$A6108[i],"\n")}``````{r}# データフレームを昼夜間人口比率の降順で並び替える# 新しいオブジェクト名: dd <- arrange(dat,-A6108)``````{r}# 上位20を抜き出すtop20 <- d[1:20,]top20[,c(1,2,28)]``````

昼夜間人口比率

地図データと統計データの結合 ### 4.7.1 昼夜間人口比率(A6108)<div style="text-align: left;"><image src="ss2020-09-15 11.24.23.png"width="300" height="300"></div>```{r}library(ggplot2)ggplot(fukuoka_map)+geom_sf(aes(fill=A6108))+labs(x="東経",y="北緯",title="昼夜間人口比率

出生率、婚姻率、離婚率の推移

## 2.3 2020年公表データ```令和元年上巻 総覧 第3.2表-2 年次別にみた人口動態総覧(率)注:1) 1944年(昭和19年)~1946年(昭和21年)は戦災による資料喪失等資料不備のため省略した。1947年(昭和22年)~1972年(昭和47年)は沖縄県を含まない。1948年(昭和23年)・1949年(昭和24年)の*印は概数による率である。2) 新生児死亡の1943年(昭和18年)以前は1か月未満の死亡である。また、新生児死亡の1943年(昭和18年)は

合計特殊出生率

合計特殊出生率のグラフをRのggplot2で作成する。 ## 2.2.1 合計特殊出生率```{r,message=FALSE,warning=FALSE}library(readr)library(dplyr)mb010000 <- read_csv("mb010000.csv")birth <- mb010000head(birth,3)tail(birth,3)df <- birthdf$fertility_rate <- as.numeric(df$fertilit

死因別死亡率

## 1.4 死因別死亡確率(生命表による)死因別死亡確率(令和元年)死因別死亡確率は、生命表の上で、ある年齢の者が将来どの死因で死亡するかを計算し、確率の形で表したものである。 ```{r,message=FALSE}library(readr)mortality_probability_2019 <- read_csv("mortality probability-2019.csv")mortality <- mortality_probability_201

雇用形態別雇用者数の推移

## 雇用形態別雇用者数```[詳細集計] 長期時系列表9 (1)年齢階級(10歳階級)別就業者数及び年齢階級(10歳階級),雇用形態別雇用者数 - 全国 (男女計)[Detailed Tabulation] Historical data 9  (1) Employed person by age group (ten-year group) and Employee by age group (ten-year group) and type of empl

ある町内会の単年度収支の推移

```{r}ggplot(dat_,aes(x=会計年度,y=value,group=key))+ geom_point(size=1.5)+ geom_line(aes(linetype=key))+ geom_hline(yintercept=0,size=1,linetype="dashed")+labs(col="凡例",x="会計年度",y="金額",title="単年度収支の推移",caption="○○町内会", subtitle="2014-2020 単位:円