見出し画像

GASでスクレイピングしようとしたら、スプレで十分だった話

これは、失敗でしょうか。目的を果たしているなら成功でしょうか。
でも、ぼくは進歩したと思ってます!

GASでスクレイピングに挑戦するぞ!

前回の記事で、何を目的にGASで組み立てるか考えてみました。

いろんな記事を見ていて、仕事でも使うことがあるスクレイピングに挑戦しよう!と考えて作業を開始。できたら世界が広がるんじゃなかろうかと!

ということで、日経の株価検索でアクセス急増銘柄を毎日取得してみようかなと思いました。

やることが決まったので、ステップを考えます。

GASでぶつかったのは・・・

プログラムの組み立ては下記の通り

  • 各種使用変数の宣言

  • 毎日18時にスプレッドシートにYYYYMMDDのシートを作成

  • 該当ページURLからテキストを抽出

  • 抽出テキストから該当する反復データをYYYYMMDDのシートに記載

こんな感じ!

しかし、、、、躓きまくりでした!

シートの作成がうまくいかない

なんだかテキストの型がうまくいかないのか、シート作成時にエラーになってBard(ChatGPT使ったら解決できたかな。。)に聞いてもうまく対応できず。

テキストを抽出して50社の行だけを記載したいができない

スクレイピングで該当のHTML箇所とforでリピートさせたかったけど、これもうまく該当箇所を抽出できませんでした。

結局、作成できず、一夜漬けてみた。
そして翌月、気持ちを新たに、検索したら。。。。
noteの記事がヒットして、なんと?!スプレッドシートの関数でだいたい同じことができるではないか!

ということで、スプレだけでいったん仮完了としています。

学びまとめ

初めてのGASでの作業ですが、学びたくさん!

  • GASスクリプトの基本を学ばなきゃ

  • GASでできることとスプレでできることをうまく使ったほうが良い

  • たぶん制約がそれぞれあるので理解すべし

  • スクレイピングはページによるけどスプレで結構対応できそう

  • 毎日時間を定めてトリガー起動させて正常稼働を確認するのはきちんとプログラムが動いてからしかテストできない

ふー。noteの記事ネタがたくさん生まれました。
また記事書きます!では良い自動化ライフを!

いいなと思ったら応援しよう!