logo
预览版
标准版
您当前访问的是 喵宅苑 MewoGarden × 技术宅II 预览版网页,若要正常使用功能请戳我前往标准版
帖子对应的标准版页面请点击帖子下方[→标准版]按钮
fair_jm

内容很简单就是使用htmlparser这个工具库来进行一些html的简单解析

测试页面:【链接登录后可见】

拦截的规则也是很简单的

  • 豆瓣每页的url形式是【链接登录后可见】 每页10页的话 第一页就是=0 第二页=10 以此类推
  • 文章页面的url是【链接登录后可见】数字/ 的形式

    【查看更多内容请登录哈】

  • zw蓝魔
    jimsshom

    html解析我一般是用python的lxml.html库,感觉还挺方便的。

    轻舟过

    解析html还是有点烦啊

    要是有api还是用api比较方便啊,毕竟得到的直接是结构化的数据