プロジェクトオーガナイザの吉田聖書です。
8月26日に、東大の松尾研究室から誕生したスタートアップ企業ELYZAが、日本語の文章を要約するAIを開発して、デモサイトを公開したというニュースを取り上げます。
プレスリリースはこちら
https://prtimes.jp/main/html/rd/p/000000011.000047565.html
最近では、議事録の作成を省力化しようということで音声データを文字データに変換するためのAIが出回っています。実際に使ってみると最初は精度がいまいちで使い物にならないんですけれども、AIなのでどんどん専門用語を学習していくことで精度が上がっていくという特徴があります。ただ実際には学習させるという作業が必要なので、それなりに根気が必要です。仮に、そうやって精度の高い文字起こしができたとしても、例えば2時間の会議の議事録であれば、相当の分量になるわけです。みんなそれを頑張って読むのでしょうか。
議事録が議事録として機能するためには、ただ誰が何を言ったかということが分かれば良いのではなく、そこで何が決まり、何が持ち越されたのかが明確である必要があります。文字起こしのAIではそこは対応しきれないため、そこで今回取り上げる「ELYZA DIGEST」が威力を発揮するのではないかと考えられます。既に存在する要約文作成のAIはニュース記事のような整った文章を得意とするのに対し、「ELYZA DIGEST」の特徴としては、難易度の高い対話型テキストも対象としているということです。ただ、デモサイトとして公開された「ELYZA DIGEST」では、作成する要約文の文字数が決まっているようなので、そのままでは議事録のまとめには向かないと思いますが、将来的に決定事項が何で、未決事項が何であるということがパッと分かるような要約文を作成するような可能性を感じさせてくれるニュースです。
公開された「ELYZA DIGEST」デモサイト
https://www.digest.elyza.ai/
私も実際に試してみました。ぜひ皆さんも試してみていただきたいです。今回試したのは残念ながら会話文ではなく、私が「IT Engineer Radio」と称して配信している音声コンテンツの書籍のコーナーの原稿を使いました。内容としてはリーダブルコードの第14章「テストと読みやすさ」についての感想と気付きをまとめたものですが、それを「ELYZA DIGEST」にかけてみました。要約した結果を転載します。
テストコードを読みやすくするコツを解説している。テストコードの品質を担保するためにもレビューをすべきだと筆者。テストコードを安心して修正したり追加したりしやすいようにすべきとも。
要約文なので、長い文章のどこを切り取るかというところがカギになるんですが、細かいニュアンスは気になるものの、全体をざっくり掴むには十分と言えるのではないでしょうか。
※ この記事は、先日公開した以下の音声コンテンツを基に編集したものです。
この、要約文の作成という分野は英語圏では既に実用化が進んでいるようなのですが、日本語はやはり言語として難しいらしく、なかなか実用レベルに至っていなかったそうです。先ほど「切り取る」と書きましたが、実は「切り取る」方式では会話文の要約は難しいのだそうです。「ELYZA DIGEST」のアプローチは全く異なる発想で、オリジナルの文章から抜き出すのではなく、一から要約文を生成する方式を採用しています。この方式のアドバンテージは、音声認識の精度が多少低くても、生成する要約文にはほとんど影響がないということです。
ただ一方で、この方式もデメリットがあって、他の方式と比べると計算量が多いので、それなりのコンピュータが必要だということと、場合によっては原文の意味とは異なる要約文を生成してしまうことがあるのだそうです。まあ、この辺りは今後の研究開発によって克服できるだろうと思いますが、デメリットよりもメリットの方がはるかに大きいので、引き続き注目していきたいと思います。プレスリリースにはもっと詳しい情報が掲載されていますので、興味のある方は是非ご覧になってください。
関連記事
プロマネの右腕
プロジェクトマネジメントの支援を行っています。
新サービスの企画を任されたけど どう進めていいか悩んでいる担当者、
部下に新しい企画を任せたけど このままで大丈夫か不安な管理職の方、
以下のサイトをご参照ください。
https://www.crossidea.co.jp/services/right-hand-pmo.html
YouTubeにて動画配信中!
プロジェクトマネジメントのノウハウをYouTubeで配信しています。
ブログと併せてご活用ください。