我们在网上搜索资料时,经常会遇到这样的情况:好不容易找到了一篇有用的文章,想复制时却状况百出:有的一点复制就提示弹出框提示你要先关注公众号,然后再按要求找到密码,输入密码后才能复制,麻烦之极;有的没这么麻烦,但是一点复制就告诉你这是VIP才能享有的权益,需要先交钱成为VIP才能复制;有的则比较简单粗暴,干脆不能选中文字,甚至连右键都给禁用了……
这些奇葩行为或许是为了保护版权,或许是利益驱动,但最终的结果都成了给用户添堵,让本来简单的复制粘贴变得无比复杂,比如某山课件、某度文库、某数字doc图书馆等等,都是添堵界的佼佼者。
其实这种限制可以用一种很简单的方法绕过去:利用PDF虚拟打印机将当前页面保存为PDF格式的文档,然后在PDF文档里复制需要的文字。具体操作方法如下:
1.安装Microsoft Print to PDF
Microsoft Print to PDF是微软自带的PDF虚拟打印机,从XP到Win10都有,不过许多精简版的系统默认没添加,或者干脆删除了,大家可以到控制面板的“启用或关闭Windows功能”下看看,找到“Microsoft Print to PDF”打上勾,即可自动添加。
如果一切正常,“设备与打印机”下就会出现一个名为“Microsoft Print to PDF”的打印机,这个打印机跟实体打印机的使用方法是一样的,只不过不能打印出实物纸张,而是将打印内容输出为PDF文档。
如果你的系统是精简版,很可能无法添加系统自带的“Microsoft Print to PDF”,这种情况下也可以使用第三方PDF虚拟打印机替代,如pdfFactory Pro等。
2.将网页输出为PDF格式
遇到不能复制的网页,我们可以直接按Ctrl+P,选择“Microsoft Print to PDF”,将当前网页另存为pdf格式。这里以IE浏览器为例:
点击“打印”,选择保存位置,正在浏览的网页就被保存成PDF文档了。接下来,打开保存的PDF文档,就可以复制出需要的文字了。
这个方法适用于绝大多数浏览器,但如果你用的是Chrome,那么恭喜了,复制文字将变得更加简单。Ctrl+P调出打印页面后,无需保存为PDF格式,直接在预览页复制就行了,简直是so easy!
使用这种方法,不管网页采取了什么限制复制的方法,只要是正常显示的文本,都可以提取出来。当然,如果网页显示的是图片,这种方法是无能为力的,因为图片上的文字只能采用OCR识别的办法,比如利用泰比(ABBYY)之类的工具来识别,这里不再赘述,有机会开新帖再给大家详细介绍。
结语:
虚拟打印机是一种很有用的工具,绕开网页的复制限制,只不过是一种非常规的雕虫小技而已。其实虚拟打印机的功能很强大,应用场景非常多,各位小伙伴们慢慢发掘吧!
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/250983.html