メインPCである下記のパソコンで、長らく発生していた「休止状態から復帰できない」問題が、ふとしたことから解決しました。どうやら原因は、仮想メモリ(ページファイル)の不足だったようです。中には役立つ人もいるかもしれないと思って、一応記事にしておきます。
Pythonで手書き数字のORCにトライ(その2)
前回、TesseractおよびPyTorchのニューラルネットワークで手書き数字の認識をやってみました。
今回は前回のPyTorchのニューラルネットワークに角度情報を加えて、手書き数字認識をやってみました。
具体的には、MNISTの28×28画像から、数字を線化処理し、8×8の2値画像に8段階の角度情報加えた8×8×8のデータで、512x1000x10の3層ニューラルネットワークを作り、自分の手書き数字をさせました。
結果、前回6~8割くらいだった正解率が9割くらいになりました。
追記:畳み込みニューラルネットワークもやってみたら更に高い正解率でした。
(ソースコードは記事の最後にあります)
Pythonで手書き数字のORCにトライ
プラント屋の友人曰く、現場では計測値を手書きで記録して、後でデータ入力なんてのを日常的にやってることもままあるらしく、OCRで効率化したいそうで、(無料で)できるかどうか試してみました。
記事の内容を要約すると、
・Tesseractで手書き数字の認識にトライ→Bad
・ニューラルネットワークで手書き数字の認識にトライ→Bad
(環境:Windows10)
最初、オープンソースのOCRライブラリTesseractで自分の文字を試したものの、正解率が低くく、自分の字の正解率は4、5割程度でした。
そのあと試しにPyTorchによるニューラルネットワークで、手書き数字のデータ集MNISTを使って機械学習した結果、MNISTデータ上は正解率95%以上だけども、自分の字だと79%くらいになりました。4などの特定の文字が苦手らしく、実用は難しそうでした・・・。
RaspberryPi ZeroでGroveセンサのテスト
作業場を手に入れる方法とコスト
前回に引き続き、空想シリーズ。通勤時間に書くことが多いこれ系の記事ですが、最近、出社機会が増えてきている関係で続いてます。
僕の夢の一つが自分の作業場を持つことです。いわゆるガレージ作業場。戸建てを買えば叶えられることですが、マンション住まいの僕にはまだ遠い夢です。