是百度文库对有些文档的复制有限制,怎样复制百度文库的内容?
方法一:适用于复制少量的文本
1、打开检查
方法:右键,点击检查
2、寻找内容的id
使用查看器,查看内容的id 寻找你需要拷贝内容的id
3、输入命令,复制内容
进入console
输入命令:
$("#pageNo-1").text();
解释:
其中pageNo-1 就是上一步找到的id
其中 text(); 方法就是获取pageNo-1 容器中的纯文本。
命令输入完成就可以复制了,注意是复制console中的,页面中的还是不能,这里只是把内容获取到console了。对于其他网站的也是类似。
百度文库的规则:
百度文库下载下来是word格式的,在网页上显示,他对应word的每一页有有个id
命名规则是:pageNo-页数
pageNo-1是第一 页的id
pageNo-2是第二页的id
pageNo-3是第三页的id
方法二:下载整个文档
只需要把地址栏中的 baidu 改成 baiduvvv 回车就可以跳转到下载页面,其实就是另一个网站。
原理:这个网站对百度文库的网页内容进行了抓取,然后转成word或pdf格式,然后下载。下载可能有些不一样,表格可能会变成图片,广告啥的文本也有,不过不错了。。
例如:
https://wenku.baidu.com/view/7fb6d4c6da38376baf1faee5.html?fr=search
修改为
https://wenku.baiduvvv.com/view/7fb6d4c6da38376baf1faee5.html?fr=search