ICTコラム

第1回 RPAと一緒に語られる、AI-OCRとは?

現在、“業務の効率化”“働き方改革”を、ICTにより解決する手段として「RPA」とともに注目されているのが、「AI-OCR」です。今回から始まる新連載は、このAI-OCRがもたらす業務改革について解説していきたいと思います。

1.RPAとのシナジーを生む「OCR」

前回までの連載コラム“RPA(ソフトウェア型ロボット)によるオフィス業務改革”を読んでもお分かりのように、生産年齢人口が減少する中で「いかに業務を効率化していくか?」、「働き方改革をどの業務で実現していくのか?」が、各企業にとって、ここ数年における非常に大きな取り組み事項となっています。そのような環境の下、RPAとセットで語られることが多くなってきたのが「OCR(Optical Character Recognition= 光学文字認識)」です。

注文書、申込書、請求書、アンケート、変更届、日報、報告書などなど、種類を挙げればきりがありませんが、業種業態を問わず、さまざまな部署で書類を見ながらの入力業務は必ず存在しています。一方で、商慣習や文化、紙特有の使い勝手の良さから、業務で利用する紙をゼロにすることは難しいと思われていることも事実です。RPAを導入して直面するハードルがまさにここにあります。

「当初の目的は自動化できたが、業務フローの初めに発生する入力作業はなくならない」

「そもそも入力業務の工数ボリュームが大きい」

これらの課題を解決するものがOCRです。OCRは、RPAだけでは自動化の対象にできなかった領域=紙というアナログデータを、デジタルデータに変換するソリューションとして注目を集めています。

本連載では、「OCRやAI-OCRとはそもそも何か?」からスタートし、導入障壁や効果、さらには今後どのように発展していくのかをご紹介することで、OCRの過去から未来をお伝えしていきたいと考えています。

2.OCRとはそもそも何か?

OCRとは、書類などに書かれた手書きや印字文字を、コンピューター上に表示可能なテキストデータに変換する装置です。これにより、従来は人の手で行われていたデータ入力業務をOCRが代替し、業務の省力化を実現することが可能となります(図1参照)。

▲図1)AI-OCRによる業務変革

昨今、注目度が増してきているOCRですが、歴史を振り返ると、世界的には1900年前後から文字認識技術の開発が始まり、1950年頃にはすでに製品化されています。日本で最初に製品化されたのは1960年代。当時の郵政省が集配業務の効率化を実現するため、郵便事業自動化の一環として郵便番号の読み取りのために活用したのが最初だと言われています。

それから50年以上の歴史の中で、OCRはどのような進化を遂げてきたのでしょうか。

3.OCRからAI-OCRへ

弊社によるOCRに関する調査結果(図2参照)では、読み取り精度が低い」という声が最も多く、この声こそが進化を語る上でのポイントだと考えます。「読み取り精度が低い」というイメージは従来型OCRによるものが大きく、AIを用いたOCRがこの現状を変えています。ではOCRにおける“AI”とは何でしょうか。

▲図2)OCRに関する調査結果

従来型OCRは、あらかじめ定義されたデータベースに基づいた読み取りを行う仕組みであり、データベースにない未知の文字を読むことは難しい、という制約がありました。

具体的には、対応フォントは印字が主であり、かつゴシック、明朝、メイリオといった指定フォントに限られる、文字サイズや解像度に制限がある、といったものが挙げられます。

また、手書きについても、一文字ずつ分割して読み取りを行う性質上、一文字ずつ決められた枠の中に、ある程度決められた形の文字を記入する必要があります。従って、枠がないもの(=枠の中に何文字入ってくるか分からない未知のもの)を読み取ることは困難でした。これが読み取り精度の低さを印象づけている所以だと考えています。

これに対し、AI-OCRは、「データベースとのマッチング」ではなく、「深層学習による推論(=教育されたAIが判断すること)」により、未知のフォントの読み取りが可能となったことでブレイクスルーを起こしました。

AI-OCRは、アンケートに利用されるような1枠1文字という制約が難しいフリーピッチの文章や、あらゆる癖の手書き文字も読み取り可能となりました(図3参照)。そして現在、AI-OCRは次のステージを迎えていると考えていますが、これについては、連載の後半でお伝えできればと思います。今回は、OCRの歴史の中で、AIを用いたブレイクスルーの側面からAI-OCRについてお伝えしました。

▲図3)従来型OCRとAI-OCRとの比較

次回は、RPA市場やAI-OCR市場を深堀りし、「AI-OCRブーム」の背景に迫ります。

PDF版はこちら

梅田 祥太朗氏

AI inside 株式会社
執行役員 CRO
事業開発本部長

関連記事

入会のご案内

電話応対教育とICT活用推進による、
社内の人材育成や生産性の向上に貢献致します。

ご入会のお申込みはこちら