![見出し画像](https://assets.st-note.com/production/uploads/images/76671774/rectangle_large_type_2_64d22a17834243deb9e5bc77f89cbf1d.png?width=1200)
日経社説#14 Scaleに少し取り組んでみます
昨日も、またその日の日経社説を図にするべく、まずは主語のMarkingから始めたのですが、これについてはどこまで自動化できるのかが気になり、そこに時間をとってみることにしました。
その結果、機械的に認識できる主語と、人間にとってわかりやすい主語には隔たりがあるように感じ、なかなか一筋縄ではいかないことがわかりました。サンプルとして3,4つの文章を試したところ、それらに全く類似性が見当たらなかったのです。それぞれが異なったパターンを持っており、単純ではありませんでした。
その結果をうけて、もう少し重点的に調べる必要性を感じたため、もう2,3日その調査を続けたいと思います。
なお、係り受けの抽出に使わせていただいたのは、こちらのツールです。
https://github.com/KoichiYasuoka/UniDic2UD