findcontoursの輪郭認識の動きを見えるようにしたらキモかった

opencvのfindcontoursの動きを一個一個見てみたかっただけです。

輪郭検出と輪郭内面積・重心計算 | OpenCV画像解析入門

↑参考にしたやつ

 

輪郭が格納されている?countoursの中身がこんな感じだったので、 順番に青い線で結んでいってみました。

f:id:alakialaca:20160520220107p:plain

 円とかを表現しようとしたら頂点が多いので、たくさん端点が出来るってことなのかな?

 

 

ちゃんと輪郭をなぞっていっているのがわかります。

なんか、虫が這いずり回っているみたい。

 

 

続きを読む

pyinstallerを使おうとするとメモ帳が強制召喚される。(対処完了)

コマンドプロンプトにpyinstallerと打つと、このメモ帳が強制的に開かれて終了。人生の終わり。アーメン。っとなって諦めていました。

f:id:alakialaca:20160505122958j:plain

linuxでも上手くいかなかったけど、

pythonをexe化に悪戦苦闘のメモ(しかもちゃんとできてないよ。誰か助けて。) - アルパカ研究室


windowsではちゃんとexeファイルが出来たお。

 

↓参考

 

qiita.com

 

続きを読む

luceneを使いたかった。

Javaで記述されたインデックスを作成するタイプの全文検索エンジンluceneさんですね。

使おうとコマンドを打っても打ってもエラーが出て。

偉い方に聞いてみて純正javaであるoracleを入れてみたら動きました。

実際はいろいろやっていたのでoracleのせいだったのかはわからないwwww

Ubuntu にOracle Java 8 (PPA)をインストールする(ubuntu) - Qiita

oracleの入れ方はこちら参考で。

コマンドは

 

java -cp demo/lucene-demo-5.3.1.jar:core/lucene-core-5.3.1.jar:analysis/common/lucene-analyzers-common-5.3.1.jar org.apache.lucene.demo.IndexFiles -docs テキストを入れたフォルダ

 

これでインデックスが出来まして。

 

 

java -cp demo/lucene-demo-5.3.1.jar:core/lucene-core-5.3.1.jar:analysis/common/lucene-analyzers-common-5.3.1.jar:queryparser/lucene-queryparser-5.3.1.jar org.apache.lucene.demo.SearchFiles -index index -query "検索したい文字"

 

で検索できました。

全然動かなくて5時間くらい格闘してた。悲しい。

 

一気にプログラムを回したかった。

そういえば、こんなブログ作っていたと思い、思い出したかのように更新

 今日作ったしょぼいやつ。

コマンドラインからpngファイルを読み込み、とある処理するプログラム作ってたのですけど、

それを50ファイルくらい一気にやりたかったので作った。

続きを読む

treetagger使いたい.......(+ω+)

英語の構文解析がしたかったので

http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/

↑treetaggerのサイトのダウンロードから

1のlinuxパッケージ、2の tagging script、3のinstall-tagger.sh、4のparameter fileからEnglish parameter file をダウンロードし、全部を同じフォルダの中に入れてshコマンドでinstall-tagger.shを端末から実行したら展開されます。

 

パスを通すとどこからでもtreetaggerが使えるようになって楽なので、

隠しファイルの.bashrcの最後の行に(desktopでls -aで見つけられた。)

PATH="$PATH:/treetaggerの置いてある場所/treetagger/cmd"

PATH="$PATH:/treetaggerの置いてある場所/treetagger/bin"

を書き入れます。

 

端末にecho "my name is dog."| tree-tagger-english

と入力すると

reading parameters ...
tagging ...
finished.
my      PP$       my
name    NN         name
is           VBZ       be
dog       NN         dog
.             SENT    .
と表示された。

やったね。

あとはpythonから動かせたらいいのですけど、動かない........(+ω+)

 

 

 

tesseract の論文?を読みました。

論文というか、取り扱い説明書???

http://static.googleusercontent.com/media/research.google.com/ja//pubs/archive/33418.pdf

↑ググったらすぐに出てくるこれです。

verview of the Tesseract OCR Engine直訳して、テセラクトの概要......

どういう仕組みでtesseractが文字を読み取っているのか気になった次第です。

一応頑張って読みましたが正しいかどうかは分からないです。。。。。

 

続きを読む