http://www.samair.ru/proxy-by-country/United-States-01.htm
这个页面里端口号是 js 计算的,页面源代码里没有,这种情况要怎么解析出来呢?
可以自己读源代码,用代码实现他原来的逻辑。
不过,最简单的方法是用phantomjs解析页面,然后生成HTML快照,再用bs4解析提取。不过,我没有试过