(优发娱乐平台) BeautifulSoup解析网页的问题

soup = BeautifulSoupurlopenurl.read 这样做就解析不了网页
soup.findAll 获取什么节点都没有
而把html = urlopenurl.read,html打印出来,在控制台复制粘贴给变量 content,然后这样做 soup = BeautifulSoupcontent,就能解析成功呢?

from bs4 import BeautifulSoup
import urllib url = http://soccerdata.sports.qq.com/playerSearch.aspx?lega=epl&pn=9
soup = BeautifulSoupurllib.urlopenurl.read
print lensoup.findAll
print lensoup.findAll
print lensoup.findAlldiv content = <div><h1>This is my homepage.</h1><p>Do you know?</p></div> soup2 = BeautifulSoupcontent
print lensoup2.findAll
print lensoup2.findAll
print lensoup2.findAlldiv

输出:

856
0
38
3
0
1
[Finished in 1.5s]

测试平台:

  • Win7 中文版 SP1
  • Python2.7.6
  • BeautifulSoup4.3.2

运行结果,供楼主参考。


有图有真相:

看一下你用的是哪个版本的bs吧

发表评论

电子邮件地址不会被公开。 必填项已用*标注