見出し画像

noteのエクスポートxmlをテキストデータだけの表に変換する方法 | ノンプログラマー with Chat-GPT |

一年の締めくくりに、noteをエクスポートしました。

noteのエクスポートは期間指定ができないので、管理しやすくするには、年末のダウンロードがピッタリ。

というわけで、今日中にサクッと終わる、簡単な方法をご紹介します。

noteのエクスポートは「自分の記事」から

インポートもできるんだね

noteの投稿記事のエクスポートは、これまでに投稿した記事を一括でダウンロードできる機能です。

「自分の記事」ページ、記事の一覧の右上のボタンから実行できます。

公式のヘルプに方法が載っていたので早速実行したのですが、
出力されるのはxmlファイル

そのまま閲覧するには、とても見にくい状態でした。

エクスポートしたファイルの落とし穴

ダウンロードしたzipを展開すると、現れるのは画像が保存されたassetsフォルダと記事データが保存されたxmlファイルがあらわれます。

assetsに「みんなのフォトギャラリー」で借りた画像は入っていません。
常用している方は、要注意かも。

assetsに画像がまとめて保存されているのはよいとして、文字情報がコードにビルトインされているため、ファイルを開いてもどんな記事がどんな内容で書かれていたか、わかりにくい状態です。

文字だけ欲しいのに…

ブラウザで開いてみても、改行が入ってちょっとマシになっただけで、狙った結果は得られません。

参照するための位置関係を保持してサーバーにアップロードする的なことしないと無理っぽい。

エクスポートファイルのテキスト化をAIに頼んでみた

でも、今年は2024年。こういうときには頼もしい助っ人がいます。

Chat-GPTです。

早速お願いしてみましょう!

おねがい! Chat-GPT!

早速、テキストファイルにまとめてくれました。

しかし…、

…もっと読みにくい

一部のコードが取り除かれ、ファイル形式が変わっただけでした。

プログラマはpythonで一発解決

調べてみると、pythonを使えばテキスト部分だけ抽出できるという神情報ををシェアしている記事を見つけました。

あなたがプログラマーなら、ここで下記記事をクリックすれば問題は解決
おめでとうございます!良いお年を!!

↓↓↓↓↓↓

ノンプログラマーのための解決方法

しかし、下記記事(↓)で白状した通り、わたしは3度「プログラマーになる!」とコミットして行き倒れた人間です。


書いてあることはなんとなくは分かるものの、些細なつまづきで何十時間も浪費した苦い思い出から、コピペであれ、もうダイレクトでは可能な限り触りたくないと思っています。

ノンプログラマーの文系note民はどうすればよいのでしょうか?

そうです。

Chat-GPTです。

今こそ彼を、もう一度召喚しましょう。

Chat-GPTにコピペでマジック

先に掲載した記事から、ありがたくもシェアしてくださっているコードをコピペして、作業をChat-GPTにお願いしましょう。

すいません!お借りします!!
このお礼は初詣の折、神さま経由でお返ししますんで!

すると、Chat-GPTは、この指示をもとに、自分で先に出力したファイルのエラーの修正をはじめました。

そして、完成!

ものの1分を待たず、修正バーションをcsvで出力、完成です!

ちいさな失敗には目をつぶって手作業

左の列がTitleで、右の列がContent
右列が空欄なのは、タイトルを詩に、コンテンツが写真のみの投稿
左列には改行なしの状態で、本文が格納されています。

ファイルを開いて確認すると、文字情報だけが閲覧できる状態でバッチリ取り出せました。

しかし、よくみるとタイトルとコンテンツの対応が一行ずれています。

理由は、ノンプログラマののわたしにはわかりません。

なぜか見落とされた情報のせいで、ずれているよ
プロンプトの漢字が間違っているせいだったらごめんなさい、わたしのせいです。
(追記:今見ると、2つ上の画像でChat-GPTに「タイトルが1件多い」とカウントされ、
調整されたのが原因ぽい)

 拙い日本語で修正を指示しましたが、再出力してもらってもずれたままでした。

プログラムに聡い方であれば、的確な指示を出せるのでしょうが、目視で確認して、手作業で直した方が早いでしょう。

ちょっとしたほころびなら、ミシンより手縫いが早い、みたいなもんです。

ちゃんとキャプションにつけたコメントも拾っています
(この画像の下の部分が、下記画像部分のテキスト)
比較すると、改行と行間はカットされていることがわかりますね

note仕事納めに、ちゃちゃっとエクスポートしよう

というわけで、簡易的な表形式でタイトルとテキストの全記事一覧が完成しました。

これで、「このネタ書いたっけ?」

っていう日々の確認から、

「自分が使いがちな単語ってなんだろう?」

っていう自己分析まで役に立つはず。

それらの作業にも、Chat-GPTをはじめとしたAIが助っ人になってくれるでしょう。

今年も更新した、たくさんの投稿。

年の締めくくりに、あなたも一覧をエクスポートしてはいかがでしょうか?

ドント・ウォーリーさん、Chat-GPTさん、ありがとうございました!
最後までよんでくれたあなたさまも、どうか穏やかな年末年始をお過ごしください!

↑ 年末の救世主、ドント・ウォーリーさんのnoteはこちら


いいなと思ったら応援しよう!

ゆっか
自分の書く文章をきっかけに、あらゆる物や事と交換できる道具が動くのって、なんでこんなに感動するのだろう。その数字より、そのこと自体に、心が震えます。