四角の中に一つだけ四角があるものを選ぼうの回
ちょっと前に作ったfindcontourを改造してみました。
やりたかったこととしましては、↓の図のピンクのやつだは取らず、他の四角はとるってやつです。
四角の中に一つだけ四角があるものを取ったのです。
続きを読む
tesseract3.04.01に出来た。
最初にleptonicaでエラーが出て、leptonicaをアップグレードしたりしたはず。(うろ覚え)
そのあと、autogen.shを実行しようとしたら、
Something went wrong, bailing out!
ってエラーが出て困っていた。
↓参考に
TesseractGitInstallation · tesseract-ocr/tesseract Wiki · GitHub
sudo apt-get install autoconf automake libtool libleptonica-dev
これのあと、いつもの、./configureとかmakeやのなんやのでインストール出来た。
これが解決法だったのかは分からない。
tesseract 3.03でかなり読める - アルパカ研究室
↑いつか比較するために書いたブログが役に立つ??
3.03の時に出来なかった文字に使ってみると
出てくる文字は変わって、少し近くなった気はするけど・・・
ですが、
なぜか読めなかった
は読み取ることが出来ました。
これが読み取れなかった件ですが、
エラーの内容も出るようになっている。
小さすぎたってことなんですか・・・
適当にスクショしたせいで・・・
しゅごいいいいいい
findcontoursの輪郭認識の動きを見えるようにしたらキモかった
opencvのfindcontoursの動きを一個一個見てみたかっただけです。
輪郭検出と輪郭内面積・重心計算 | OpenCV画像解析入門
↑参考にしたやつ
輪郭が格納されている?countoursの中身がこんな感じだったので、 順番に青い線で結んでいってみました。
円とかを表現しようとしたら頂点が多いので、たくさん端点が出来るってことなのかな?
ちゃんと輪郭をなぞっていっているのがわかります。
なんか、虫が這いずり回っているみたい。
続きを読む
tesseract 3.03でかなり読める
今新しく出ているバージョンが3.04.01で、最新版がかなり読めるようになったということを聞きまして、今はどれくらいなのかと見てみただけです。
↑3つは普通に -l jpnのコマンドで読むことができました。
続きを読む
luceneを使いたかった。
Javaで記述されたインデックスを作成するタイプの全文検索エンジンのluceneさんですね。
使おうとコマンドを打っても打ってもエラーが出て。
偉い方に聞いてみて純正javaであるoracleを入れてみたら動きました。
実際はいろいろやっていたのでoracleのせいだったのかはわからないwwww
Ubuntu にOracle Java 8 (PPA)をインストールする(ubuntu) - Qiita
↑oracleの入れ方はこちら参考で。
コマンドは
これでインデックスが出来まして。
で検索できました。
全然動かなくて5時間くらい格闘してた。悲しい。