![見出し画像](https://assets.st-note.com/production/uploads/images/74169943/rectangle_large_type_2_7d97641b4f41d4690660eab813fb0828.png?width=1200)
Photo by
otspace0715
WordとExcelで特許情報のテキストマイニング(英語)
「知財情報を組織の力に®」をモットーに活動している知財情報コンサルタントの野崎です。
過去に本noteやイーパテントYoutubeチャンネルでもテキストマイニングについて取り上げています。
無料で利用できるテキストマイニングツールとしては、KH CoderやユーザーローカルのAIテキストマイニングがありますが、今回はWordとExcelで英語特許情報のテキスト分析を行う方法について解説します。
1 WordとExcelによるテキスト分析の基本
まずは分析対象となる英語の特許リストを準備します。
今回はコーヒーマシンなどで有名なデロンギ(DELOGHI)の出願にしました(特に深い理由はありません)。
PatbaseからダウンロードしたCSVリストは
![](https://assets.st-note.com/img/1646963455761-EVtXHDy4Ed.png?width=1200)
のようになります。Patbaseではタイトル(TI)や要約(AB)に[EN]や[MT]が入っているので、あらかじめ除外しておきます。
一気に除外するのであれば [*] で置換すると、*がワイルドカードなので、[EN]や[MT]を一気に除くことができます。
これで前処理が完了です。
![](https://assets.st-note.com/img/1646963546943-S2tpfZ6jnS.png?width=1200)
ここから先は
1,916字
/
17画像
¥ 1,000
期間限定!Amazon Payで支払うと抽選で
Amazonギフトカード5,000円分が当たる
Amazonギフトカード5,000円分が当たる
よろしければサポートお願いいたします!いただいたサポートは情報収集費用として有効活用させていただきます!