日本語手書き文字の完璧読取りAI(Stream Realtime)

  • 投稿日:
  • by
  • カテゴリ:

1月のセミナー受講生から質問がありました、と清水産業情報プラザの御担当から連絡をうけました。内容は「Geminiの読み取り機能について」ということなので、Stream realtimeを試してみました。

動画はこちらです。 今まで、OCR(光学文字認識)についてのご質問をよく受けます。
神社のお札を用意して読ませます
神社のお札を用意して読ませます。
いままでの生成系AIは①日本語が苦手、②漢字が苦手、③手書き文字が苦手(今回は筆文字)という弱点がありました。
そこで、図のような神社のお札を「Stream Realtime」へ読ませます。

大井神社
駿府鷹匠壱丁目一加番稲荷神社商売繁盛・厄除守護


と完璧に読んでいます。
おなじことをChatGPT4oでやってみました。

誤読するChatGPT
誤読するChatGPT 0点です。使い物になりません。
ではコンテストの応募要項を読ませてみましょう。長いため要約をお願いしました。以下が結果です。
応募要項

動画部門: 静岡県南アルプスで撮影された動画。実写・CG・アニメ等、表現方法は不問。

Instagram部門: 静岡県南アルプスで撮影された写真・動画
応募方法
写真部門: 静岡県電子申請システムで応募。ファイル形式はJPEG、1ファイル40MB以内。 動画部門: YouTubeで限定公開動画を投稿し、URLを静岡県電子申請システムで応募。 ファイル形式はMP4、解像度はフルHD (1920x1080)、アスペクト比は16:9。

Instagram部門: 公式Instagramアカウントをフォローし、指定のハッシュタグを付けて投稿。 同一作品の複数部門への応募は不可。

応募期間 日本時間で令和6年7月1日から令和6年10月31日まで

審査
主催者及び主催者が依頼する審査員が行う令和6年12月初旬を目途に結果を通知

その他
応募作品は未発表であること 応募作品の著作権は応募者に帰属
入賞作品の利用権は主催者に帰属 その他詳細な注意事項は応募要項に記載


特選、準特選、入選、審査委員長特別賞など 賞品は、各部門ごとに商品券
問い合わせ先 静岡県南アルプスデジタル自然館 環境部環境課 TEL: 054-221-2963 E-mail: shizenhogo@pref.shizuoka.lg.jp
StreamRealtime