luceneを使いたかった。

その他

Javaで記述されたインデックスを作成するタイプの全文検索エンジンのluceneさんですね。使おうとコマンドを打っても打ってもエラーが出て。偉い方に聞いてみて純正javaであるoracleを入れてみたら動きました。実際はいろいろやっていたのでoracleのせいだ…

2015-08-13

一気にプログラムを回したかった。

python

そういえば、こんなブログ作っていたと思い、思い出したかのように更新今日作ったしょぼいやつ。コマンドラインからpngファイルを読み込み、とある処理するプログラム作ってたのですけど、それを50ファイルくらい一気にやりたかったので作った。

2015-06-18

treetagger使いたい.......（＋ω＋）

python

英語の構文解析がしたかったので http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ ↑treetaggerのサイトのダウンロードから 1のlinuxパッケージ、2の tagging script、３のinstall-tagger.sh、4のparameter fileからEnglish parameter file をダウ…

2015-06-13

tesseract の論文？を読みました。

tesseract

論文というか、取り扱い説明書？？？ http://static.googleusercontent.com/media/research.google.com/ja//pubs/archive/33418.pdf ↑ググったらすぐに出てくるこれです。 verview of the Tesseract OCR Engine直訳して、テセラクトの概要...... どういう仕…

2015-06-13

セット4（後半）

python

セット4（後半）です。 (6)１行１単語形式（medline.txt.sent.tok）を読み込み，単語の連接を出力するプログラムを実装 #!usr/bin/env python3# -*- coding: utf-8 -*-import marshalline = ""for i in open("medline.txt.sent.tok.stem","r"): i = i.strip(…

2015-05-24

beamerのフォーマット

その他

ネットに基本形（フォーマット？）みたいなの置いておいたらどこでも作れると思ったので設置。いちいち調べるのめんどくさいのでｗｗ

2015-05-20

tesseract を使うときでの手こずったとこ

tesseract

プログラムとしてはtesseractをダウンロード出来るサイト(https://code.google.com/p/python-tesseract/)に書いてあるとおりに、 api = tesseract.TessBaseAPI()api.SetOutputName("outputName");api.Init(".","eng",tesseract.OEM_DEFAULT)api.SetPageSegMo…

2015-05-15

セット４（前半）

python

セット4（前半）です。 (1)ファイルを読み込み，単語をキーとして，品詞，活用形，基本形のタプルのリストを値とするマッピング型に格納せよ．プログラムの動作を確認するため，標準入力から読み込んだ単語の語彙項目を閲覧するプログラムを実装 #!usr/bin/e…

2015-05-13

セット3

python

セット3です。 (1)標準入力から英語のテキストを読み込み，ピリオドを文の区切りと見なし，１行１文の形式で標準出力に書き出す f = open("medsamp2012h.txt","r")data = f.read() t=re.sub("\.",'.\n',data)print(t)f.close() re.subでピリオドを改行（\n）…

2015-05-07

かたわ少女　うぶんつ実行

その他

かたわ少女の日本語版がリリースされたと聞いてさっそくダウンロードしてみました。 linux環境でもプレイできる数少ないゲームですね。ゲームの概要としてもすごく興味があって、昔に一度英語版をやっていたのですが、途中で挫折しましたｗｗダウンロード…

2015-05-06

セット２

python

セット2です。 (1)「拡散希望」という文字列を含むツイートを抽出 #!usr/bin/env python3# -*- coding: utf-8 -*-import retweet = re.compile("<text>[\s\S]*?</text>")kakusan=re.compile("拡散希望")f = open('tweets.txt',"r")data = f.read() # ファイル終端まで全て…