ちょっと作りたいwebページがあって、手書き認識がしたかったのだけど、必要なJSライブラリを探すのに苦労している…こんなに流行っているのにこれだ!ってのが以外と見つからない…
有名なものがあったら教えてください…
OCR
tesseract.js
普通に文字認識として十分よい.ただ認識がすごく遅い(いくらかそのissueやスレッドも上がっている).node.jsでサーバーサイド側やクライアントサイド側の両方でできてかなり使いやすい.一つの画像を認識するのに5秒~くらいかかる気がする(223×68の画像).これは認識以外のところで時間がかかっているのもあるとは思う.手書き文字認識(英語ブロック体)ではやや精度が悪く、いくらかのサイトによれば再度学習する必要がありそう.
https://github.com/naptha/tesseract.js#more-complicated-example
デモ
http://tesseract.projectnaptha.com/
ちょっと手書き認識実験
自分の環境の中で少し手書き認識やってみたところ、まぁ悪くはないけど、そこそこって感じ.絶望的ではないので他のヒューリスティックな方法で修正すれば使える?
手書き認識
OCRではなくて人が書いた文字を認識したいときは手書き認識(Hand written recognition)と呼ぶ.
ocrad.js
webクライアントでできるocrad.js .個人的にはあまり精度がよくない気がする.(気のせい?)ただGithubの評価?スターは多い(みーはー). 手書きだけじゃなくて、通常のOCRも可能.
https://github.com/antimatter15/ocrad.js/
デモ
デモは以下.画像をアップロードすることも、自分でその場で書くこともできる.
http://antimatter15.com/ocrad.js/demo.html
ちょっと手書き認識実験
さっきと同じ画像を使ってこっちでも試してみた.あれ…tesseract.jsよりダメじゃない…?
MyScript
MyScriptCloudが提供するAPIを使うもの.
これは有料みたい.ただ精度がだいぶいい.見ると開発で100台、テストで1000台、サービスデプロロイで要相談って感じみたい.
https://github.com/MyScript/MyScriptJS
https://developer.myscript.com/pricing
デモ
以下で見れる.
https://webdemo.myscript.com/
このデモンストレーション触ったらだいぶ使いたくなるけど、うーんフリーじゃなくて使いにくい….はず?
おわりに
サンプルコードレベルのではkerasに以下のがある.ただライブラリではないので、上には列挙していない.自分で学習するかWebサーバにする必要がある.
https://github.com/keras-team/keras/blob/master/examples/image_ocr.py
Comments