Live data HTML parsing with Python/BS
我已经搜索这些页面好几天都没有成功,所以我希望这不是重复的。如果是这样我道歉。
我在本地网络上有一个设备,它提供以 HTML 格式读出的数据,并实时更新。到目前为止,我的 BeautifulSoup 和 URLLIB2 尝试解析这些数据都没有成功。
任何帮助将不胜感激。
这是源代码,圈出感兴趣的数据:
如果结果输出:
1
2 3 4 5 6 7 8 9 10 11 12 |
from bs4 import BeautifulSoup
import re import urllib2 from urllib import urlopen url = ‘http://192.168.1.2/index.html#home-view’ #___________________________________________________________________ usock = urllib2.urlopen(url) data = usock.read() usock.close() soup = BeautifulSoup(data,"html.parser") result = soup.findAll(‘p’, {‘class’:‘gas-conc’}) print result |
已解决!:感谢您的帮助。使用 Selenium,我能够痛苦地刮掉这些数据。但是我必须在源代码上使用 BS ‘beautify’ 功能并手动计算要拼接的字符。
我有 90% 的把握,除非你设法以某种方式呈现 Javascript,否则你不会得到这些数据。
查看这篇文章,了解如何实现这一点的更多信息。
简而言之,您可以使用:
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/268033.html