読者です 読者をやめる 読者になる 読者になる

pythonで再現性をもたせるためシードを揃えて行をシャッフル

シェルスクリプトでシードも揃えたままシャッフルできたら楽だったのですけど、ちょっとわからなかったのでパイソンで、リストをシードを揃えてシャッフルしてその順番に並べるってコード。 #!/usr/bin/python# -*- encoding: utf-8 -*-import numpy as npim…

ナンバーと一部の文章があるテキストを元に、ナンバーと文章全体のテキストから、文章を抜き出す。

はてなの中で写真の縦横って変えられないっぽい? a.txtがこんな感じ。 b.txtがこんな感じ a.txtの情報をもとにb.txtから情報を取る感じのやつです。 とりあえず、ナンバーと一部の文章があるテキスト(a.txt)の情報を元に、ナンバーと文章全体とurlがあるテ…

HP中の%の入っている文を取り出したかったから作ったやーつ

なにで使ったかはひ・み・つ!! #!/usr/bin/python# -*- encoding: utf-8 -*-import reimport urllib2pattern1 = re.compile(r"\d+\.\d+\s%|\b\d+\s%|\b\d+%|\b\d+\s*\.\d+\s%|\b\d+\s*\.\d+%")#数字と%のやつurl ="HPのURL"fp = urllib2.urlopen(url)inlin…

pyinstallerを使おうとするとメモ帳が強制召喚される。(対処完了)

コマンドプロンプトにpyinstallerと打つと、このメモ帳が強制的に開かれて終了。人生の終わり。アーメン。っとなって諦めていました。 linuxでも上手くいかなかったけど、 pythonをexe化に悪戦苦闘のメモ(しかもちゃんとできてないよ。誰か助けて。) - ア…

pythonをexe化に悪戦苦闘のメモ(しかもちゃんとできてないよ。誰か助けて。)

pyinstallerとやらを使ってみました。 結局わからなかった。。。 初めはいろいろなブログ見ながらwindowsでやってたのですが、 d.hatena.ne.jp

一気にプログラムを回したかった。

そういえば、こんなブログ作っていたと思い、思い出したかのように更新 今日作ったしょぼいやつ。 コマンドラインからpngファイルを読み込み、とある処理するプログラム作ってたのですけど、 それを50ファイルくらい一気にやりたかったので作った。

treetagger使いたい.......(+ω+)

英語の構文解析がしたかったので http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ ↑treetaggerのサイトのダウンロードから 1のlinuxパッケージ、2の tagging script、3のinstall-tagger.sh、4のparameter fileからEnglish parameter file をダウ…

セット4(後半)

セット4(後半)です。 (6)1行1単語形式(medline.txt.sent.tok)を読み込み,単語の連接を出力するプログラムを実装 #!usr/bin/env python3# -*- coding: utf-8 -*-import marshalline = ""for i in open("medline.txt.sent.tok.stem","r"): i = i.strip(…

セット4(前半)

セット4(前半)です。 (1)ファイルを読み込み,単語をキーとして,品詞,活用形,基本形のタプルのリストを値とするマッピング型に格納せよ.プログラムの動作を確認するため,標準入力から読み込んだ単語の語彙項目を閲覧するプログラムを実装 #!usr/bin/e…

セット3

セット3です。 (1)標準入力から英語のテキストを読み込み,ピリオドを文の区切りと見なし,1行1文の形式で標準出力に書き出す f = open("medsamp2012h.txt","r")data = f.read() t=re.sub("\.",'.\n',data)print(t)f.close() re.subでピリオドを改行(\n)…

セット2

セット2です。 (1)「拡散希望」という文字列を含むツイートを抽出 #!usr/bin/env python3# -*- coding: utf-8 -*-import retweet = re.compile("<text>[\s\S]*?</text>")kakusan=re.compile("拡散希望")f = open('tweets.txt',"r")data = f.read() # ファイル終端まで全て…

100本ノック セット1

100本ノックを課題としてやったのでそのメモです。 東北大学の乾・岡崎研究室のサイトで公開されている、言語処理100本ノックのメモです。問題の詳細はサイトをご覧ください。 第1セット (1) 行数をカウント。 #!usr/bin/env python3# -*- coding: utf-8…