見出し画像

「文章要約AI タンテキ」精度パワーアップのご報告①

こんにちは!バズグラフです🤖

みなさん、日々【文章要約AI タンテキ】がパワーアップしていることを、ご存じでしょうか?

今回は、過去の記事や検証データを参考に【文章要約AI タンテキ】がどのように進化したか、見ていきましょう!

まずは文章要約AI タンテキをご紹介!

文章要約AI タンテキは、独自開発の自然言語処理エンジンを駆使し、主にニュース記事を中心としたAIによる文章要約を可能としたサービスです。

一般的なAIによる要約サービスで使われる「形態素解析」だけでなく、バズグラフ独自の解析方法である「特徴語解析」や「機能素解析」を組み合わせ、AIが文章を理解し要約を行います。

要約過程の文章解析時に、構造化データを出力する技術も持ち合わせているため、莫大なデータの解析に活用できるのではないかと期待の声も上がっています。

<従来のタンテキの特徴>
最大1万文字までの大量文章を要約
要約結果は瞬時に出力
要約サイズは「%・文字数・行数」を指定可能
URL入力での本文抽出や、キーワードでのニュース検索からの要約も可能
キーワード出現率や文章構造図などの便利な分析機能
API提供可能

要約精度がアップして、カギカッコ「」の話言葉も抽出して要約可能になった!

今回は、過去の記事で要約させていただいたYahooニュース掲載記事の要約結果を元に、違いをみていきましょう。

"「週刊少年ジャンプ」(集英社)で連載中の芥見下々(あくたみ・げげ)さんのマンガ「呪術廻戦」が、6月21日発売の同誌29号から“一月ほど”休載することが分かった。同誌のツイッターで「週刊少年ジャンプ29号(6月21日発売)より芥見先生の体調不良のため、『呪術廻戦』はしばらくの間休載させていただきます。」と発表された。
休載期間は「期間は一月ほどになります」といい、芥見さんは「体調を崩したとは言っても大病したわけではなく、メンタルは通常運転なのでご心配には及びません。ただただお待たせして申し訳ないです。復帰から新連載のつもりで頑張ります」とコメントを寄せている。
「呪術廻戦」は2018年から同誌で連載中。強力な“呪物”の封印が解かれたことで、高校生の虎杖悠仁(いたどり・ゆうじ)が呪いを巡る戦いの世界に身を投じることになる……というストーリー。コミックスの累計発行部数が5000万部を突破するなど大ヒットしている。テレビアニメが2020年10月~2021年3月に放送された。劇場版「劇場版 呪術廻戦 0」が制作され、今冬に公開されることが発表されている。"
(479文字)
引用:https://news.yahoo.co.jp/articles/22d11072e103c9a3f90e601f552639de59b3a10c

呪術廻戦の作者・芥見下々(あくたみ・げげ)さんの休養は、漫画だけでなくアニメでも大注目を浴びていた時期だったので、衝撃的なニュースでしたよね。

過去のタンテキでは、この記事を50%に要約し、下記のように要約しています。

"「週刊少年ジャンプ」で連載中の芥見下々さんのマンガ「呪術廻戦」が、6月21日発売の同誌29号から“一月ほど”休載することが分かった。
休載期間は「期間は一月ほどになります」といい、芥見さんは「体調を崩したとは言っても大病したわけではなく、メンタルは通常運転なのでご心配には及びません。
強力な“呪物”の封印が解かれたことで、高校生の虎杖悠仁が呪いを巡る戦いの世界に身を投じることになる……というストーリー。
コミックスの累計発行部数が5000万部を突破するなど大ヒットしている。"
(239文字)

文字数は約半分ですし、内容もわからなくもなくいい感じのようにも見えますが、カギカッコが閉じないまま他の文章が要約されてしまい、なんとなく違和感も…。

それでは今のタンテキに、要約してもらいましょう!

"「週刊少年ジャンプ」で連載中の芥見下々さんのマンガ「呪術廻戦」が、6月21日発売の同誌29号から“一月ほど”休載することが分かった。 休載期間は「期間は一月ほどになります」といい、芥見さんは「体調を崩したとは言っても大病したわけではなく、メンタルは通常運転なのでご心配には及びません。ただただお待たせして申し訳ないです。復帰から新連載のつもりで頑張ります」とコメントを寄せている。 コミックスの累計発行部数が5000万部を突破するなど大ヒットしている。"
(227文字)

しっかりカギカッコも閉じてる!!!!!!!

文字数も若干ですが少なくなって、よりコンパクトになっている!!!!

文字数も、若干ですが少なくなって、よりコンパクトになっている!!!!

コメント部分と説明部分もしっかり分けて要約されているので、一目でどんな記事なのかわかります!!!(自社サービスながら思わず感動・・・!)

一方で、重要と判断した文章を見ると変化はありません。

下記は6月時点の文章要約AI タンテキが重要と判断した文章

①「週刊少年ジャンプ」(集英社)で連載中の芥見下々(あくたみ・げげ)さんのマンガ「呪術廻戦」が、6月21日発売の同誌29号から“一月ほど”休載することが分かった。

②休載期間は「期間は一月ほどになります」といい、芥見さんは「体調を崩したとは言っても大病したわけではなく、メンタルは通常運転なのでご心配には及びません。

③「呪術廻戦」は2018年から同誌で連載中。

④強力な“呪物”の封印が解かれたことで、高校生の虎杖悠仁(いたどり・ゆうじ)が呪いを巡る戦いの世界に身を投じることになる……というストーリー。

⑤コミックスの累計発行部数が5000万部を突破するなど大ヒットしている。

⑥テレビアニメが2020年10月~2021年3月に放送された。

そして今回重要と判定された文章はこちら。

一体どうしてなのでしょうか?

主体とする言葉の認識の変化(成長)

今回の要約結果の違いは、さらなる開発により、文章要約AI タンテキが主体(主語)として捉えるポイントのアルゴリズムがより精密になったことで、精度の高い要約結果を出すことができました。

ニューラルマップ(文章の構造化を抽出した図)を見ると一目瞭然です。

<2021年6月時点>

<2022年3月>

自分で辞書を生成するからこそ、日々成長していく

タンテキは、日々SNSやNEWSで話題となっている単語を、独自のアルゴリズムでピックアップして、単語にポイントをつけて収集しています。

そして、形態素解析だけでなく、特徴語解析や機能素解析などの独自の解析手法を用い、自分自身で辞書をアップグレードさせつつ要約しています。

そのため、開発側のグレードアップだけでなく、日々のアップデートにより、約半年後の要約結果も変化していくというわけです。

詳しい開発秘話については、こちらもご覧ください▼

■月額35,000円から利用可能!文章要約AI タンテキを構造しているAPIも提供中

「自社システムとカスタムして要約サービスを利用したい」「社内の重要な文章を要約したいのでWEBサービスを通せない」などのお客様の声にお応えして、APIの提供も行っております。

さらに、本格的にAPI導入させる場合、事前に導入時の不具合や不安要素を回避するために、APIトライアルプラン(最大3ヶ月間)もご用意しております。

詳しくは下記記事をご覧ください🌟

文章要約AI「タンテキ」リンクまとめ

■文章要約AI「タンテキ」:https://ai-tanteki.com/
■三文タンテキ:
http://ai-tanteki.com/sanbun/
■呟きタンテキ:
http://ai-tanteki.com/tsubuyaki/
■発見タンテキ:
http://ai-tanteki.com/hakken/
■検索タンテキ:
http://ai-tanteki.com/kensaku/
■圧縮タンテキ:
https://ai-tanteki.com/assyuku/
■公式Twitter​:
https://twitter.com/tantekikun
■公式note:
https://note.com/buzzgraph

▼その他お問い合わせ

株式会社バズグラフ▶︎https://buzzgraph.co.jp/
全てのお問い合わせ▶︎https://buzzgraph.co.jp/contact/index.php

次回の更新もお楽しみに!

いいなと思ったら応援しよう!