dedecms采集教程大探秘(超详细)
看到很多网友都为织梦DEDE CMS的采集教程头疼 的确官方出的教程太笼
统了什么都没说换个网站你什么都做不了这个教程是最详尽的教程让你一看即会
首先我们打开织梦后台点击采集——采集节点管理——增加新节点
这里我们以采集普通文章为例我们选择普通文章然后确定
我们进入了采集的设置页面填写节点名称就是给这个新节点取个名字这里你可以任意填写。
然后打开你想要采集的文章列表页这里我们以织梦官网为例http://www.dedecms. com/web-manage/jianzhanxinde/打开这个页面右键——查看源文件
找到目标页面编码就在charset后面
页面基本信息其他的一般就不用管了填完了如图
现在我们来填写列表网址获取规则
看看文章列表第一页的地址http://www.dedecms. com/web-manage/jianzhanxinde/list_49_1.html对比第二页的地址http://www.dedecms. com/web-manage/jianzhanxinde/list_49_2.html我们发现了他们除了49_后面的数字不一样其他的都一样所以我们可以这样写http://www.dedecms.com/web-manage/j ianzhanxinde/list_49_(*) .html
就是把1换成了(*) 因为这里只有2页所以我们就填从1到2每页递增当然是1了 2-1. . .是等于1吧
这里我们就填写完了
可能大家采集的有些列表没有规则那就只有手工指定列表网址了如图
每行写一个页面地址
列表规则写完了我们就开始写文章网址匹配规则了,回到文章列表页右键查看源文件找到区域开始的HTML就是找文章列表开始的标志。
我们很容易的找到了如图中的“新闻列表” 。从这里开始后面就是文章列表里我们再找文章列表结束的HTML
就是这个了一个很容易找到的标志
不处理采集为缩略图这里根据自己的需要选如果链接中含有图片 择对区域网址进行再次筛选
(使用正则表达式)必须包含 (优先级高于后者)不能包含
打开源文件我们可以很清楚的看到文章链接都是以.html结束的所以我们在必须包含后面填.html如果遇到有些列表很麻烦还可以填写后面的不能包含
我们点击保存设置进入下一步可以看到我们获得的文章网址
看到这些就是对的了我们保存信息进入下一步设置内容字段获取规则
我们看看文章有没有分页 随便进入一篇文章看看。 。我们看到这里的文章没有分页
所以这里的我们就默认了
我们现在来找文章标题等等随便进入一篇文章右键查看源文件
看看这些
依照源码填写
我们再来填写文章内容的开始结束和上面的一样找到开始和结束标志
开始
结束
你想过滤文章中的什么内容就到过滤规则里写吧 比如要过滤文章中的图片
选择常用规则
再勾选IMG
这样我们就把正文中的图片过滤了设置完毕后点保存设置并预览
然后确定
这样一个采集规则就写好了很简单吧有些网站很难写可要多下点功夫了哦我们点保存并开始采集——开始采集网页一会的功夫就采集完了
我们看看我们采集到的文章
456
看来是成功了我们导出数据吧
首先选择要导入到的栏目按“请选择”那里即可在弹出的窗口中选择你需要导入的栏目发布选项这里一般默认即可除非你不想马上发布。每批导入默认是30条这里修改与否都无所谓 附带选项一般选“排除重复标题” 至于自动生成HTML那个选项建议先别生成 因为我们还要去批量提取摘要和关键字。
去链接不去文字的方法 {dede:trim}<a( [^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
Cloudxtiny是一家来自英国的主机商,提供VPS和独立服务器租用,在英国肯特自营数据中心,自己的硬件和网络(AS207059)。商家VPS主机基于KVM架构,开设在英国肯特机房,为了庆祝2021年欧洲杯决赛英格兰对意大利,商家为全场VPS主机提供50%的折扣直到7月31日,优惠后最低套餐每月1.5英镑起。我们对这场比赛有点偏见,但希望这是一场史诗般的决赛!下面列出几款主机套餐配置信息。CPU...
昨天我们很多小伙伴们应该都有看到,包括有隔壁的一些博主们都有发布Vultr商家新的新用户注册福利活动。以前是有赠送100美元有效期30天的,这次改成有效期14天。早年才开始的时候有效期是60天的,这个是商家行为,主要还是吸引到我们后续的充值使用,毕竟他们的体验金赠送,在同类商家中算是比较大方的。昨天活动内容:重新调整Vultr新注册用户赠送100美元奖励金有效期14天今天早上群里的朋友告诉我,两年...
LOCVPS怎么样?LOCVPS是一家成立于2011年的稳定老牌国人商家,目前提供中国香港、韩国、美国、日本、新加坡、德国、荷兰等区域VPS服务器,所有机房Ping延迟低,国内速度优秀,非常适合建站和远程办公,所有机房Ping延迟低,国内速度优秀,非常适合做站。XEN架构产品的特点是小带宽无限流量、不超售!KVM架构是目前比较流行的虚拟化技术,大带宽,生态发展比较全面!所有大家可以根据自己业务需求...