html

  • java 多线程 JVM 锁优化

    JVM规范规定JVM基于进入和退出Monitor对象来实现方法同步和代码块同步,但两者的实现细节不一样。代码块同步是使用monitorenter和monitorexit指令实现,而…

    编程笔记 2022年5月3日
  • Webmagic(爬虫)抓取新浪博客案例

    Webmagic框架更偏重实际的内容抓取。今天为大家分享Webmagic 爬虫框架抓取新浪博客的案例。 我们以作者的新浪博客http://blog.sina.com.cn/flas…

    编程笔记 2022年5月3日
  • WebMagic Selectable抽取元素

    昨天用的 WebMagic 最新版本,还存在一些问题。导致控制台报错,报错内容为找不到jsoup类文件。详情大家可以到https://github.com/code4cr…

    编程笔记 2022年5月3日
  • WebMagic Xsoup 和 自定义Pipeline

    WebMagic的抽取主要用到了Jsoup和官方自带的工具Xsoup。 Jsoup是一个简单的HTML解析器,同时它支持使用CSS选择器的方式查找元素。关于Jsoup的学习文章,大…

    编程笔记 2022年5月3日
  • Webmagic 爬虫的配置、启动和终止

    通过上一篇的小 demo,我们发现爬取网页内容都是通过实现 PageProcessor 来抓取的。在第一章也介绍到实 PageProcessor 是 Webmagic 4个重要组件…

    编程笔记 2022年5月3日
  • WebMagic 入门

    这是接着上一章 WebMagic 简介,我们来搭建第一个 WebMagic 爬虫项目。 WebMagic 主要包含两个jar包:webmagic-core-{v…

    编程笔记 2022年5月3日
  • WebMagic 简介

    WebMagic 是一款简单灵活的爬虫框架。目前百度百科上还没有相关的词条,网上使用的人比较多。和 jsoup 相比它更小巧和简单。 本文主要介绍 WebMagic,后面…

    编程笔记 2022年5月3日
  • Shiro 集成 OAuth2

    昨天还有一位网友问我OAuth2 相关的知识,由于时间有限,我没有详细的讲解。今天我们使用Shiro 来整合OAuth2 来配套学习。 目前很多开放平台如新浪微博开放平台都在使用提…

    编程笔记 2022年5月3日
  • Shiro 登录 会话管理

    Shiro提供了完整的企业级会话管理功能,不依赖于底层容器(如web容器tomcat),不管JavaSE还是JavaEE环境都可以使用,提供了会话管理、会话事件监听、会话存储/持久…

    编程笔记 2022年5月3日
  • Shiro 标签

    我在3月初定的计划是4月底百度收录量达到1000,最近两天百度收录量不增反降,压力巨大啊!继续前面的文章,本文我们学习Shiro的jsp标签的相关知识。 Shiro提供了JSTL标…

    编程笔记 2022年5月3日