画像データから文字を抽出!ビジネスを変えるOCR技術の現在地とは
画像や紙面に書かれた文字情報をデータ化するには、これまでは人の手を介して手打ちでテキスト化する必要がありました。しかし最近では画像や紙面から文字を認識し、直接データ化できる 「OCR」(Optical Character Recognition/Reader・光学文字認識) という技術が発展しています。
目次
日本語独特の縦書きや特殊フォントにも対応できるようになったOCR
ビジネスのペーパーレス化やデータ管理の効率化を目的として、様々な企業で導入されつつあるOCR。入力の手間が省ける、できあがったデータの保管場所に困ることがない、データの共有も簡単に行える、などの利点がある一方で、日本語特有の縦書き表記や多種多様なフォントが、正確な読み取りを困難にする要因となっていました。
そんな中、広告クリエィティブの事前効果予測を行う「極予測(キワミヨソク)シリーズ」を展開する株式会社サイバーエージェントでは、広告制作に特化した独自日本語OCRモデルを2023年に発表。もともと「極予測シリーズ」は広告内の文字の検出と解析にOCR技術を取り入れ、クリエィティブ制作および効果予測フローに組み込んでいました。
広告効果予測を高精度で行うためには、クリエイティブ内の文字をレイアウトやフォントに影響されずに正確に読み取る必要があります。しかし、従来の「極予測シリーズ」のOCRでは縦書き表記や特殊なフォントは正確に読み取れない場面も。そこで独自OCRモデルの開発によって、縦書きや複雑なレイアウトであっても広告内の文字を正確に認識することが可能に。事前効果予測に反映させることで、より高い精度が期待できるようになりました。
出典:サイバーエージェント、広告クリエイティブに特化した独自日本語OCR(光学文字認識)モデルを開発
AIによって効果の出せるランディングページを予測・制作する「極予測LP」にはすでにこの独自OCRが実装されており、今後ほかの「極予測シリーズ」へも順次導入される予定です。
印刷物の校正・校閲にもOCRが活躍
おすすめ記事
おすすめエントリー
同じカテゴリから記事を探す
カテゴリから記事をさがす
●Webマーケティング手法
- SEO(検索エンジン最適化)
- Web広告・広告効果測定
- SNSマーケティング
- 動画マーケティング
- メールマーケティング
- コンテンツマーケティング
- BtoBマーケティング
- リサーチ・市場調査
- 広報・PR
- アフィリエイト広告・ASP
●ステップ
●ツール・素材
- CMS・サイト制作
- フォーム作成
- LP制作・LPO
- ABテスト・EFO・CRO
- Web接客・チャットボット
- 動画・映像制作
- アクセス解析
- マーケティングオートメーション(MA)
- メールマーケティング
- データ分析・BI
- CRM(顧客管理)
- SFA(商談管理)
- Web会議
- 営業支援
- EC・通販・ネットショップ
- 口コミ分析・ソーシャルリスニング
- フォント
- 素材サイト
●目的・施策
- Google広告
- Facebook広告
- Twitter広告
- Instagram広告
- LINE運用
- LINE広告
- YouTube運用
- YouTube広告
- TikTok広告
- テレビCM
- サイト制作・サイトリニューアル
- LP制作・LPO
- UI
- UX
- オウンドメディア運営
- 記事制作・ライティング
- コピーライティング
- ホワイトペーパー制作
- デザイン
- セミナー・展示会
- 動画・映像制作
- データ分析・BI
- EC・通販・ネットショップ
- 口コミ分析・ソーシャルリスニング