您现在的位置是:首页 > cms教程 > DedeCMS教程DedeCMS教程
织梦dedecms采集规则和使用方法
幻柏2023-10-05DedeCMS教程已有人查阅
导读楚截图和文字分不清楚,因此用粉色背景来区分。第一步、确定采集的网站(我们以DEDE的官方站做为采集站做示范)第二步、确定被采集站的编码。打开被采集的网
楚截图和文字分不清楚,因此用粉色背景来区分。
第一步、确定采集的网站(我们以DEDE的官方站做为采集站做示范)
第二步、确定被采集站的编码。打开被采集的网页之后,查看源代码(IE:查看 - > 源代码)在 之间找到 charset 这个,后面就显示网页的编码了,截图的是 “gb2312”
第三步、采集列表获取规则写法
[var:分页]
文章网址需包含 网址不能包含 这两个一般不用写,用于采集列表范围有很多不需要的连接才用到他来做过滤使用。如果只有一个列表页,那么在来源网址就直接写上网址就OK了。注意这里,最关键就是这里。
下面就是“采集获取文章列表的规则写法”,就是上面打开的被采集页面的源代码文件,找到文章列表之前 和本页面没有其他相同的代码在DedeCms官方站的列表页文章列表之前和之后最近的且没有相同的是“”和“ ”,分别写入“起始HTML”和“结束HTML”,写法看截图
第四步、采集文章标题,文章内容,文章作者,文章来源等规则写法,分页采集等。
“起始HTML”和“结束HTML”写法参考第三步中的“获取文章列表的规则写法”
下面讲的是如何采集分页内容 看截图圈着的地方文档是否分页 里面选择“全部列出的分页列表”“起始HTML”和“结束HTML”写法参考第三步中的“获取文章列表的规则写法”当然 上面这些不能用来采集带有视频的,因为已经过滤了,后面的四行是过滤掉视频的。
第一步、确定采集的网站(我们以DEDE的官方站做为采集站做示范)
第二步、确定被采集站的编码。打开被采集的网页之后,查看源代码(IE:查看 - > 源代码)在 之间找到 charset 这个,后面就显示网页的编码了,截图的是 “gb2312”
第三步、采集列表获取规则写法
[var:分页]
文章网址需包含 网址不能包含 这两个一般不用写,用于采集列表范围有很多不需要的连接才用到他来做过滤使用。如果只有一个列表页,那么在来源网址就直接写上网址就OK了。注意这里,最关键就是这里。
下面就是“采集获取文章列表的规则写法”,就是上面打开的被采集页面的源代码文件,找到文章列表之前 和本页面没有其他相同的代码在DedeCms官方站的列表页文章列表之前和之后最近的且没有相同的是“”和“ ”,分别写入“起始HTML”和“结束HTML”,写法看截图
第四步、采集文章标题,文章内容,文章作者,文章来源等规则写法,分页采集等。
“起始HTML”和“结束HTML”写法参考第三步中的“获取文章列表的规则写法”
下面讲的是如何采集分页内容 看截图圈着的地方文档是否分页 里面选择“全部列出的分页列表”“起始HTML”和“结束HTML”写法参考第三步中的“获取文章列表的规则写法”当然 上面这些不能用来采集带有视频的,因为已经过滤了,后面的四行是过滤掉视频的。
本文标签:织梦cms采集
很赞哦! ()
相关教程
图文教程
织梦dedecms后台验证码错误的原因和解决方法
经常看到很多人发帖称自己用织梦建的站在使用一段时间后会出现进不了后台,明明验证码是对的但提示说验证码不对。今天就花了时间整理了一些相关方法,主要有下面几种:
dedecms栏目创建修改管理教程
DedeCMS的栏目设置有相当丰富的参数,当然如果你想使用更简单些,你可以不理会多余的参数,只填写红色字提示的表单项即可,在介绍栏目管理操作之前
dedecms模板标记大全属性介绍二
【List 标记】功能说明:表示列表模板里的分页内容列表适用范围:仅列表模板 list_*.htm基本语法{dede:list col= titlelen
织梦cms统计当前栏目下子栏目数量的方法
我们在使用织梦时候,需要用到统计子栏目数量。要怎么实现呢?下面代码号小编为大家讲解下:其实主要是利用{dede:field.typeid/}这个标签实现。
相关源码
-
(自适应HTML5)响应式智能设备人工智能机器pbootcms源码免费下载这款基于PbootCMS开发的网站模板为人工智能和智能设备行业设计,采用现代化科技风格,突出产品的智能特性和技术创新。模板架构合理,功能完善,能够有效展示各类智能产品的核心功能和解决方案。查看源码 -
(自适应响应式)供应链进出口服务pbootcms企业网站源码为供应链管理、进出口服务类企业设计,特别适合展示物流网络、贸易服务和供应链解决方案。采用响应式技术,确保在各类设备上都能呈现企业服务内容。查看源码 -
(自适应响应式)家电维修清晰服务网站pbootcms模板免费下载本模板基于PbootCMS内核开发,为维修服务类企业打造,特别适合家电维修、设备维护等行业使用。通过简洁直观的界面设计,帮助企业快速搭建专业级服务平台,实现线上业务高效管理。查看源码 -
(自适应)蓝色自动溶剂萃取仪器设备类网站pbootcms模板下载本模板为溶剂萃取设备、实验室仪器等精密仪器行业设计,采用PbootCMS内核开发,具有高度专业性和行业适配性。模板设计充分考虑了仪器设备行业展示需求,能够呈现各类精密仪器的技术参数、应用场景和解决方案。查看源码 -
(自适应)大型农业机械设备水稻玉米收割机网站pbootcms源码下载本模板基于PbootCMS内核开发,为农业机械设备制造与销售企业设计,特别适合水稻玉米收割机、拖拉机、播种机等农用机械展示。模板充分考虑了农机行业的特性,从产品展示到技术参数,从作业案例到售后服务查看源码 -
工商注册财务代理记账类自适应pbootcms网站工商注册、财务代理记账企业打造的数字化门户模板,基于PbootCMS内核深度开发。采用前沿响应式架构,无缝适配手机端触控交互与PC端展示需求查看源码
| 分享笔记 (共有 篇笔记) |
