Pythonで手書き数字のORCにトライ

プラント屋の友人曰く、現場では計測値を手書きで記録して、後でデータ入力なんてのを日常的にやってることもままあるらしく、OCRで効率化したいそうで、(無料で)できるかどうか試してみました。

 

記事の内容を要約すると、
・Tesseractで手書き数字の認識にトライ→Bad
・ニューラルネットワークで手書き数字の認識にトライ→Bad
(環境:Windows10)

 

最初、オープンソースのOCRライブラリTesseractで自分の文字を試したものの、正解率が低くく、自分の字の正解率は4、5割程度でした。

そのあと試しにPyTorchによるニューラルネットワークで、手書き数字のデータ集MNISTを使って機械学習した結果、MNISTデータ上は正解率95%以上だけども、自分の字だと79%くらいになりました。4などの特定の文字が苦手らしく、実用は難しそうでした・・・。

 

(さらに…)

作業場を手に入れたいという空想

前回に引き続き、空想シリーズ。通勤時間に書くことが多いこれ系の記事ですが、最近、出社機会が増えてきている関係で続いてます。

 

僕の夢の一つが自分の作業場を持つことです。いわゆるガレージ作業場。戸建てを買えば叶えられることですが、マンション住まいの僕にはまだ遠い夢です。

(さらに…)

ソフト配信サイトのデザイン変更

ソフト配信サイトのデザインを変更しました。まぁ、生存報告的な更新ですね^^;

https://software.tiblab.net/

 

最近はスマホでWEBサイトを見る方が多くなってきているらしいので、レスポンシブ対応にしたいなーとずっと思ってて、お手軽に無料テンプレートを使わせてもらいました。まぁ僕のサイトについては、9割PCですけど。

 

本体サイトではなくサブサイトでやったのは、サイトの中で主なアクセスがあるのは、TB-codeとここくらいなものでして、とりあえずやるならここかなーと。TB-codeはPure.cssというモジュールを使っていて、一応、作成当初からレスポンシブ対応仕様なので。

 

本体サイトは、勉強のため自前CSSでコツコツやろうと思っています。何年かかることやら^^;