手書き文字を認識してテキスト化してくれるAIが無償公開されました

プロジェクトオーガナイザの吉田聖書よしだみふみです。

今回は6月28日にユーザーローカル社によって発表された手書き文字を認識するAIについて取り上げます。

これはもしかしたら今や珍しくはない部類に入るのかもしれませんが、AIというと手書き文字認識って割と教材に使われることが多いと感じています。まあ手書きと言っても英数字がほとんどだったりするのですが、それが漢字やひらがな、カタカナにまで範囲が広がるとなると期待が高まります。


※ この記事は、先日公開した以下の音声コンテンツを基に編集したものです。


先月6月28日に、ユーザーローカルというAI(人工知能)の開発を専門とするベンチャー企業が、手書き文字を含む画像から深層学習(ディープラーニング)によって文字を読み取る機能を無償で提供開始したということです。

手書き文字認識AIの公式サイト
https://ocr-ai.userlocal.jp/

私もちょっと上記のデモを試してみましたが、なかなか使えそうな雰囲気があります。ただ、ビジネス的にこれをWeb APIとして無償で提供するという意図がちょっと理解できませんでした。開発会社は画像認識だけではなく、自然言語処理をはじめとしたさまざまなデータ処理用のAIを開発してリリースしているので、もしかしたらそれらの製品と組み合わせて使ってもらうための入り口として位置付けているという可能性もあります。いずれにせよ魅力的なソリューションであることは間違いないと思います。

OCR(Optical Character Recognition 光学文字認識)という技術は、それ自体は20年以上前からあります。もちろん当時の技術では認識率というか読取の精度が低くて、活字であってもところどころ人の手で補正してあげる必要がありました。スキャナの解像度もそれほど高くなかったですし、その影響も多少はあるかもしれません。活字でさえそのような状態でしたので、手書き文字なんてまず読取は不可能でした。

そういう状況を一変させたのが深層学習の登場なんですが、これは手書きだろうが何だろうが、サンプルを使えばどんな文字でも認識できるようになるということなのでしょうか。特に、このユーザーローカル社の文字認識AIでは崩し字とか略字でもちゃんと認識するというのが特徴のようです。
あの、個人的にいつも思うのですが、東南アジアとか中東地域の文字って、全然知らない私が見るとそもそも文字と文字の境目がどこか分からなかったり、どの文字も同じように見えたりするんですが、それでも正しく判別できるようになるんでしょうかね。日本語でも、毛筆の縦書きの崩した文字は読めないことが多いですが、そういうのもそのうち判別できるようになるのか、気になるところです。

今では入学試験や資格試験など様々なテストでマークシート形式の答案をOCRで読み取って採点する方式が一般的に行われていますが、そのうち、学校などで行われるテストの、手書きの答案をそのまま読み取って採点するような時代もやってくるかもしれませんね。論文試験も、まずはテキストデータに起こしてから採点を始めるという時代も来るかもしれませんね。



関連記事

プロマネの右腕

クロスイデアでは、新サービス・新ビジネスの 立上げや計画を中心に
プロジェクトマネジメントの支援を行っています。

新サービスの企画を任されたけど どう進めていいか悩んでいる担当者、
部下に新しい企画を任せたけど このままで大丈夫か不安な管理職の方、
以下のサイトをご参照ください。
https://www.crossidea.co.jp/services/right-hand-pmo.html

YouTubeにて動画配信中!

プロジェクトマネジメントのノウハウを
YouTubeで配信しています。
ブログと併せてご活用ください。

Comments are closed.