読者です 読者をやめる 読者になる 読者になる

HP中の%の入っている文を取り出したかったから作ったやーつ

python

なにで使ったかはひ・み・つ!!

#!/usr/bin/python
# -*- encoding: utf-8 -*-

import re
import urllib2
pattern1 = re.compile(r"\d+\.\d+\s%|\b\d+\s%|\b\d+%|\b\d+\s*\.\d+\s%|\b\d+\s*\.\d+%")#数字と%のやつ

url ="HPのURL"

fp = urllib2.urlopen(url)
inline = fp.readlines()
len_inline = len(inline)
for i in range(0,len_inline):
    a = pattern1.findall(inline[i])
    if a:#文字列型の場合は空文字列("")は偽(false)、""以外は真(true)
        print inline[i]