
『朝日新聞Playground』のあそびかた
こんにちは、メディア研究開発センター(M研)の浦川です。
先日、M研の技術やアイデアをつかったデモであそべるサイト『朝日新聞Playground』が公開されました。
これはいったいどんなもので、なにができるのか。
こちらの記事でご紹介します。
朝日新聞Playgroundとは
朝日新聞Playgroundとは……のそのまえに、
そもそもPlaygroundってなんでしょう。
これは、「遊具の置かれた公園」を指す言葉です。
M研でつくったものが、ブランコやすべり台のように置いてある。
そして、そこへすぐ駆け寄ってあそべる……。
そんな場所になれば、とつくられたのが
この『朝日新聞Playground』なのですね。
さて、上のリンクを開けば、公園の入口に立ったも同然です。
地図やルールの書かれた掲示板をじっくり眺めてみるのもよいですが、気の向くままにとりあえずあそんでみるというのも、こういった公園「ならでは」という気がします。
ということで、さっそくあそんでみましょう。
さっそくあそんでみましょう
いま『朝日新聞Playground』には、2つの遊具=デモがあります。
AIによる自動要約API「TSUNA」と、校正支援API「TyE」です。
まずは「TSUNA」のほうから、あそんでいきましょう。
要約生成API「TSUNA」であそぶ

「TSUNA」では、入力したテキストの見出しや要約文を自動で生成することができます。
現在、以下のテキストがデフォルトで入っていますね。
ここから見出しをつくってみましょう。

利用規約(ご確認ください)に同意して……生成!

すると、こんな見出しが生成されました。

いかがでしょう。
たしかに、入力したテキストをうまく要約しているようにみえます。
さてここで、見出しの中に太字になっている部分があります(「転職」と「創作」)。
これは、要約に含めたい文中のキーワードです。
記事中に含めたい語を、ここで設定することができるのですね。

こちらに、先ほどとは別の単語……たとえば「権威、新聞」など入れてみるとどうなるでしょう。

ちゃんと、指定した語を含んだ見出しが生成されました。
これは、記事中の注目したい単語、地名・人名に商品名といった固有名詞に、また月日や価格といった数字など、見出しに入れたい内容があらかじめ決まっている場合などにつかえそうな機能です。もちろん、何も入れなくても生成が可能です。
また、入力フォームに要約の文字数というパラメータがあります。
ここでは、13文字・26文字・70文字と、出力されるテキストの長さの目安を指定できます。


いかがでしょう。指定した文字数によって、たしかに長さが変化していますね。
同じ記事でも、それがスマホなのかタブレットなのか、それとも紙面なのか。メディアによって長さを変えたりする際に、便利そうです。
さらに、生成する要約の数というパラメータがあることに気づかれたかもしれません。ここでは、生成する要約の数を1つ(精度優先)と3つ(バリエーション優先)の2つから選択することができます。
ためしに「3つ」で生成すると……

3つの生成結果が出力されました。ひとつひとつ表現が異なっていることも分かりますね。見出しのアイデアなどがほしいときに、アドバイスとして使うことができそうな機能です。

さて、ひと通りできることを試してみました。
もうひとつの遊具「TyE」のほうもみてみましょう。
画面上部に表示されている「TyE」を選択してみます。

校正支援API「TyE」であそぶ

「TyE」にやってきました。これは、テキストの誤っていそうなところを自動で検知するAPIです。挿入・削除・置換の3つの修正タイプを色で表示しながら、結果の自信度合いをグラデーションで表現することができます。
ためしに、あらかじめ入れられているテキストでやってみます。

色鮮やかな結果が返ってきました。これはどう読み解いたらよいか……。
ここで、説明をちょっとじっくり見てみましょう。

なるほど、黄色が挿入(したら修正できそう)、赤が削除(したほうがよさそう)、青が置換(することでよくなりそう)な誤り、ということですね。また、色の濃さが異なる箇所があるとか。これは、濃いほうが(きっとまちがっている!)というAIの自信の現れだそうです。
実際にさっきの例をみながら、文章を直してみようとおもいます。

この入力では、グラデーションのちがいは特になさそうですね。どれも自信満々の検出結果のようです。さて、まずはじめの文「出力の例こちらですう。」は……「出力の例」のあとに助詞の「は」を挿入したら良さそう。「ですう」の「う」は余計なので、削除しちゃいましょう。と、それぞれマーカーに教えてもらったところを直していくと……

おお。指摘がなくなりました。ただしい文章に直せました。

もうすこし、いろんな文章をいれて遊んでみたいと思います。

おわりに
おっと、
何度か試しているうちに、結果が返ってこなくなってしまいました。

30回を超過しました?
なるほど、1日にあそべる回数が決まっているのですね。
説明にもそういえば……ああ、たしかに書いてありました。

ちなみにモデルも軽量なデモ用で、商用版とは挙動が異なります。
あくまで「おためし」ができる場所としての、公園なのですね。
あそんでいるうちに、陽が落ちてきたような気がします。
そろそろおうちに帰って、また明日、Playgroundでお会いしましょう。
(メディア研究開発センター・浦川 通)