マガジン

最近の記事

【書評】Pythonによる経済・経営分析のためのデータサイエンス~分析の基礎から因果推論まで

今回ご紹介する書籍はこちら。 かなり辛口な内容になっているので、そういうのが苦手な方は読まないで欲しい。 「経営分析のためのデータサイエンス」というフレーズで興味をもったので買ってみたのだが、私自身には何も役に立たなかった。 著者が経営の実務者ではなくアカデミックである事と、対象読者を見ると、あまり真面目でない学生や社会人向けのようなので、それは仕方がない。Pythonの逆引き辞書もあるので、対象とされているプログラミングやデータ分析と無縁であった初心者には、読みやすいのか

    • YouTube「にじさんじ」ライブ配信アーカイブのチャットをGoogle Cloud Text-to-Speechを使って読み上げてみる

      前回は、RでYouTubeのライブ配信アーカイブのチャットのデータを抽出して可視化を行った。 今回は、チャットデータを、Google Cloud Text-to-Speechを使って読み上げてみる。 Google Cloud Text-to-Speechの設定に関しては、以下のサイトを参考に行った。 https://blog.apar.jp/web/9893/ 上記を参考に設定を行い、以下のシェルスクリプトを作成しておく。 ここでは、exec_text_to_speec

      • Clubhouseをやってみて思ったこと

        今流行のClubhouseをやってみたので、思ったことを雑に書いてみる。 Clubhouseに関して知らない方は、上記の記事が詳しく解説されているので読んでみてほしい。 第一印象としては、現時点では有名人やインフルエンサー、またはそれらを目指している人がビジネスするための新しいフィールドになっているという事であった。SNSを活用したビジネスやマーケティングなどは、既存のものである程度確立しており飽和状態であった所に、新しいフィールドが出てきたのでこぞってやり始めているよう

        • セルフマネジメントについて書いてみる

          リモートワークでのセルフマネジメントの必要性 リモートワークになって、従来よりもセルフマネジメントが求められている。 職場に出勤すれば、上司や同僚がいて基本的に業務を行うのだが、リモートになると、出勤という概念もなく、そばに上司や同僚もいない。サボり放題である。「ベッドの誘惑に勝てない」とか「ついついサボってしまう」などの声もよく聞く。 上記以外にも、家にいることで、家事や育児など、仕事だけをしているわけにも行かない、という現実もある。リモートワークは、普通に出勤するよりも時

        • 【書評】Pythonによる経済・経営分析のためのデータサイエンス~分析の基礎から因果推論まで

        • YouTube「にじさんじ」ライブ配信アーカイブのチャットをGoogle Cloud Text-to-Speechを使って読み上げてみる

        • Clubhouseをやってみて思ったこと

        • セルフマネジメントについて書いてみる

        マガジン

        • R
          6本
        • その他
          3本
        • 書評
          6本

        記事

          【R】Amazon 商品レビューの抽出

          前回は、RでAmazonの売れ筋ランキングから情報を取得する方法を紹介した。 今回は、その続きとして、任意の商品に関して、レビュー情報を取得する方法を紹介したい。 レビューの最初のページは、以下のようになっている。 https://amazon.co.jp/product-reviews/<商品識別番号> 商品識別番号は、書籍の場合は「ISBN」、それ以外は「ASIN」である。 https://www.amazon.co.jp/gp/help/customer/dis

          【R】Amazon 商品レビューの抽出

          【R】Amazon 売れ筋ランキングの情報を取得する

          RでAmazonの売れ筋ランキングの情報を取得する方法を紹介する。 URLの構造URLは、以下のような構造になっているので、取得したいカテゴリを実際にアクセスして確認する。 1ページにつき50件となっており、50位以降を取得したい場合は、pgでページ数を指定する。 https://www.amazon.co.jp/gp/bestsellers/<カテゴリ>/?pg=<ページ> 例えば、本-ビジネス・経済のURLは、下記のように作成する。 category <- "bo

          【R】Amazon 売れ筋ランキングの情報を取得する

          【Amazonレビュー分析vol.1】売り筋ランキング[本-ビジネス・経済](2021-01-28)20位 嫌われる勇気―――自己啓発の源流「アドラー」の教え

          売れている商品のレビューのコメントを見ることで、普段の生活では分からない、世の中の価値観や感覚を知ることが出来るのではないだろうか? そんな事を思いついたので、不定期にAmazonの売れ筋ランキングから、レビューの多い商品をピックアップして、レビュー分析してみる事にした。 最初にやってみるジャンルは、「本/ビジネス・経済」。 Amazon 売り筋ランキング[本 - ビジネス・経済](2021-01-28) 2021年1月28日の「ビジネス・経済」のAmazon売り筋ランキ

          【Amazonレビュー分析vol.1】売り筋ランキング[本-ビジネス・経済](2021-01-28)20位 嫌われる勇気―――自己啓発の源流「アドラー」の教え

          雑談の大事さについて

          コロナ禍でテレワークになって一年近くになる。 テレワークになって気付かされた事は多いが、その一つに雑談の大事さがある。 私は、ここ一年ほど、あまり成長出来てないと感じている。振り返ってみると、日常の雑談から刺激を受け、自分自身の考えを整理して昇華させ、それを実行に移すという事をやってきたように思う。 雑談という形で、細かくアウトプットしてフィードバックをもらい改善する、というPDCAを高速に回してたのだ。 テレワークによって、雑談によるPDCAが回っていない。雑談のために

          雑談の大事さについて

          【R】YouTube「にじさんじ」ライブ配信アーカイブのチャットデータを可視化してみる

          前回の続き。 配信全体でのチャットのコメントの傾向を見てみる取得したチャットのコメントをワードクラウドで可視化してみる。 まず、下準備としてチャットのコメントをファイルに保存する。 video_id <- res_live$items$id$videoId[1]write_lines(chat_df$comment, sprintf("%s.txt", video_id)) 次に、{RMeCab}パッケージのRMeCabFreqを使って、形態素解析を行い、名詞と形容詞を

          【R】YouTube「にじさんじ」ライブ配信アーカイブのチャットデータを可視化してみる

          【R】YouTube 「にじさんじ」のライブ配信のチャット(配信終了後)を取得してみる

          「にじさんじ」は、ライブ配信を結構やってるので、配信の時のチャットの内容の抽出をしてみる。 結論からいうと、思ったより難しい。APIでサクッと取れると思ったのだが、終了した配信のチャット内容を得るAPIは存在しない。 仕方ないので、スクレイピングで抽出することにした。 前提前回の記事で作成した関数を使う。 「にじさんじ」のライブ配信した動画の取得 検索のAPIで、eventTypeで、検索対象をブロードキャストイベントに制限出来る。 completed:完了したブロード

          【R】YouTube 「にじさんじ」のライブ配信のチャット(配信終了後)を取得してみる

          【R】YouTube Data APIを使って「にじさんじ」でランキングを作成してみる

          前回は、YouTube Data APIを使って、にじさんじのデータを取得してみた。 今回は、視聴回数とレイティングでランキングを作成してみる。 準備APIキーなどをベタ打ちするのは良くないので、api_key.txtに保存し、それを読み込む処理に変更。 library(tidyverse)api_key <- read_lines("api_key.txt")keyword <- "にじさんじ" APIのURIの作成と実行を関数にする。 genApiUrl <-

          【R】YouTube Data APIを使って「にじさんじ」でランキングを作成してみる

          【R】YouTube Data APIを使って「にじさんじ」のデータを取得してみる

          YouTubeは、実は様々なAPIを提供しており、結構いろんなデータ取れる。 例えば、こちら。 チャンネルや動画の情報や、検索結果を取得することが出来る。 今回は、このAPIを使ってデータを取得するところまでを紹介したい。 APIキーの取得まず最初に、APIキーというものを取得する必要がある。 取得していない方は、こちらを参考に取得して欲しい。 検索結果の取得APIキーが入手出来たら、あとは取得したいデータのAPIを叩くだけだ。 Webに詳しくない方のために、簡単に説明

          【R】YouTube Data APIを使って「にじさんじ」のデータを取得してみる

          【書評】分析者のためのデータ解釈学入門 第3章 データに含まれるバイアス

          今回は、こちらの本の第3章について紹介する。 この章では、バイアスの種類とその発生原因について解説されている。 測定基準に起因するバイアスまず、1つ目のバイアスとして紹介されているのが、測定基準に起因するバイアス。定義が異なる場合と、基準が時間的に変化してしまう場合について解説されている。 定義が異なる例として、同じ「弁護士」という職業でも、諸外国では、日本で言う弁理士、税理士、司法書士、行政書士対応する職業も「弁護士」の定義に含まれるため、それらを含まない日本の弁護士数

          【書評】分析者のためのデータ解釈学入門 第3章 データに含まれるバイアス

          【書評】億を稼ぐ勉強法

          雑感全体的には良くある自己啓発本の内容ではあるが、著者の経験とそれによる成長が書かれているので、対象読者には刺激になる一冊だと思う。 そして、この本の対象読者は、私が思うに「過去の著者」だ。過去の自分(著者)に向けた指南書のようなもので、「なぜ成功しないのか?それは○○だからだ。こうすれば上手くいく」といった内容になっている。 では、過去の著者とはどんな人物か。本書で度々出てくるキーワードとして「知識メタボ」というものがある。勉強して知識だけは膨大にあるが、結果が出せない

          【書評】億を稼ぐ勉強法

          上場企業のおかしなIRグラフについて

          面白いものを発見したので紹介したい。 上場企業のIRグラフについて、分析者から見て変なグラフ、分かりにくいグラフを紹介しているようだ。 なんと、2015年から毎年やっている。 2015年2016年2017年2018年2019年 各企業の広報も、頑張って良く見せたり、悪い印象が出ないようにあえて分かりにくくしてたり等苦労しているんだろうなと想像してしまう。 ちなみに、グラフについては、やろうと思えば簡単に印象操作出来るので、出てきたものを鵜呑みにせず、ここで紹介されてい

          上場企業のおかしなIRグラフについて

          【書評】徹底的に数字で考える。

          全体的には良くあるビジネス書にあるような内容ではあるが、個人的に面白いなと思ったところを紹介したい。 仮説を立てられない人に足りないのは「ひとつに決める勇気」です。 原因と結果をそれぞれ1種類の数字で表現し、その2者を仮の因果関係として結び付ける。こうするとこで次にするアクションが1種類になり、実際に行動に移せます。 本書でも書かれてるが、こう言った話をすると、「世の中そんなに単純じゃない」という反論が出て来る。 そりゃそうだろう、としか言いようがない。そんな事誰でも知

          【書評】徹底的に数字で考える。