html
-
java 多线程 JVM 锁优化
JVM规范规定JVM基于进入和退出Monitor对象来实现方法同步和代码块同步,但两者的实现细节不一样。代码块同步是使用monitorenter和monitorexit指令实现,而…
-
Webmagic(爬虫)抓取新浪博客案例
Webmagic框架更偏重实际的内容抓取。今天为大家分享Webmagic 爬虫框架抓取新浪博客的案例。 我们以作者的新浪博客http://blog.sina.com.cn/flas…
-
WebMagic Selectable抽取元素
昨天用的 WebMagic 最新版本,还存在一些问题。导致控制台报错,报错内容为找不到jsoup类文件。详情大家可以到https://github.com/code4cr…
-
WebMagic Xsoup 和 自定义Pipeline
WebMagic的抽取主要用到了Jsoup和官方自带的工具Xsoup。 Jsoup是一个简单的HTML解析器,同时它支持使用CSS选择器的方式查找元素。关于Jsoup的学习文章,大…
-
Webmagic 爬虫的配置、启动和终止
通过上一篇的小 demo,我们发现爬取网页内容都是通过实现 PageProcessor 来抓取的。在第一章也介绍到实 PageProcessor 是 Webmagic 4个重要组件…
-
WebMagic 入门
这是接着上一章 WebMagic 简介,我们来搭建第一个 WebMagic 爬虫项目。 WebMagic 主要包含两个jar包:webmagic-core-{v…
-
WebMagic 简介
WebMagic 是一款简单灵活的爬虫框架。目前百度百科上还没有相关的词条,网上使用的人比较多。和 jsoup 相比它更小巧和简单。 本文主要介绍 WebMagic,后面…
-
Shiro 集成 OAuth2
昨天还有一位网友问我OAuth2 相关的知识,由于时间有限,我没有详细的讲解。今天我们使用Shiro 来整合OAuth2 来配套学习。 目前很多开放平台如新浪微博开放平台都在使用提…
-
Shiro 登录 会话管理
Shiro提供了完整的企业级会话管理功能,不依赖于底层容器(如web容器tomcat),不管JavaSE还是JavaEE环境都可以使用,提供了会话管理、会话事件监听、会话存储/持久…
-
Shiro 标签
我在3月初定的计划是4月底百度收录量达到1000,最近两天百度收录量不增反降,压力巨大啊!继续前面的文章,本文我们学习Shiro的jsp标签的相关知识。 Shiro提供了JSTL标…