各位用户为了找寻关于Python抓取百度查询结果的方法的资料费劲了很多周折。这里教程网为您整理了关于Python抓取百度查询结果的方法的相关资料,仅供查阅,以下为您介绍关于Python抓取百度查询结果的方法的详细内容
本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:
? 1 2 3 4 5 6 7 8 9 10 11 12 13#win python 2.7.x
import
re,sys,urllib,codecs
xh
=
urllib.urlopen(
"http://www.baidu.com/s?q1=123&rn=100"
).read().decode(
'utf-8'
)
rc
=
re.
compile
(r
'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>'
,re.I)
match
=
rc.finditer(xh)
rcr
=
re.
compile
(r
'<[^>]+>'
,re.I)
f
=
codecs.
open
(
"xiaohei.txt"
,
"w"
,
"utf-8"
)
for
i
in
rc.finditer(xh):
ss
=
i.group(
0
)
s1
=
rcr.sub('',ss)
print
(s1)
f.write(s1)
f.close()
希望本文所述对大家的Python程序设计有所帮助。