您现在的位置是:首页 > cms教程 > DedeCMS教程DedeCMS教程
织梦dedecms采集规则和使用方法
幻柏2023-10-05DedeCMS教程已有人查阅
导读楚截图和文字分不清楚,因此用粉色背景来区分。第一步、确定采集的网站(我们以DEDE的官方站做为采集站做示范)第二步、确定被采集站的编码。打开被采集的网
楚截图和文字分不清楚,因此用粉色背景来区分。
第一步、确定采集的网站(我们以DEDE的官方站做为采集站做示范)
第二步、确定被采集站的编码。打开被采集的网页之后,查看源代码(IE:查看 - > 源代码)在 之间找到 charset 这个,后面就显示网页的编码了,截图的是 “gb2312”
第三步、采集列表获取规则写法
[var:分页]
文章网址需包含 网址不能包含 这两个一般不用写,用于采集列表范围有很多不需要的连接才用到他来做过滤使用。如果只有一个列表页,那么在来源网址就直接写上网址就OK了。注意这里,最关键就是这里。
下面就是“采集获取文章列表的规则写法”,就是上面打开的被采集页面的源代码文件,找到文章列表之前 和本页面没有其他相同的代码在DedeCms官方站的列表页文章列表之前和之后最近的且没有相同的是“”和“ ”,分别写入“起始HTML”和“结束HTML”,写法看截图
第四步、采集文章标题,文章内容,文章作者,文章来源等规则写法,分页采集等。
“起始HTML”和“结束HTML”写法参考第三步中的“获取文章列表的规则写法”
下面讲的是如何采集分页内容 看截图圈着的地方文档是否分页 里面选择“全部列出的分页列表”“起始HTML”和“结束HTML”写法参考第三步中的“获取文章列表的规则写法”当然 上面这些不能用来采集带有视频的,因为已经过滤了,后面的四行是过滤掉视频的。
第一步、确定采集的网站(我们以DEDE的官方站做为采集站做示范)
第二步、确定被采集站的编码。打开被采集的网页之后,查看源代码(IE:查看 - > 源代码)在 之间找到 charset 这个,后面就显示网页的编码了,截图的是 “gb2312”
第三步、采集列表获取规则写法
[var:分页]
文章网址需包含 网址不能包含 这两个一般不用写,用于采集列表范围有很多不需要的连接才用到他来做过滤使用。如果只有一个列表页,那么在来源网址就直接写上网址就OK了。注意这里,最关键就是这里。
下面就是“采集获取文章列表的规则写法”,就是上面打开的被采集页面的源代码文件,找到文章列表之前 和本页面没有其他相同的代码在DedeCms官方站的列表页文章列表之前和之后最近的且没有相同的是“”和“ ”,分别写入“起始HTML”和“结束HTML”,写法看截图
第四步、采集文章标题,文章内容,文章作者,文章来源等规则写法,分页采集等。
“起始HTML”和“结束HTML”写法参考第三步中的“获取文章列表的规则写法”
下面讲的是如何采集分页内容 看截图圈着的地方文档是否分页 里面选择“全部列出的分页列表”“起始HTML”和“结束HTML”写法参考第三步中的“获取文章列表的规则写法”当然 上面这些不能用来采集带有视频的,因为已经过滤了,后面的四行是过滤掉视频的。
本文标签:织梦cms采集
很赞哦! ()
相关教程
图文教程
dede织梦搜索结果按点击排序的方法
呵呵,在论坛发现了一个可以让织梦模板搜索结果按点击排序的修改方法,很是简单,希望对大家有用。
Dedecms添加自定义函数的方法
添加自定义函数文件:include/extend.func.php实例://通过会员ID查看会员名称的函数function GetMemberName($
dede织梦5.7使用心得之TAGS优化
貌似已经有DEDE5.3的TAGS静态化插件,但是貌似是收费的,而对于SEO来说,一个/tags/%D6%AF%C3%CE.html 不见得比直接显示TAG好。
dede织梦采集或更新搜索文章时cpu占用跑满卡死怎么办
dede采集或更新搜索文章时cpu100%跑满卡死解决方法!现在大部分虚拟主机提供商,都有设置目录权限的控制面板提供。这点请咨询主机商,寻求解决办法
相关源码
-
(PC+WAP)生活资讯百科新闻门户类pbootcms网站模板为生活资讯、百科门户类企业打造的高性能网站模板,基于PbootCMS开源内核开发,采用HTML5响应式架构,PC与手机端实时数据同步,覆盖全终端用户浏览场景。查看源码 -
自适应电子科技类产品公司pbootcms网站模板基于PbootCMS内核开发,为电子科技类企业设计,适用于电子产品展示、企业官网等场景。该模板采用开源架构,用户可自由访问和修改源码,灵活适配各类行业需求,无需二次开发成本查看源码 -
(自适应)英文绿色精密模具零件加工五金零件pbootcms外贸网站模板本模板基于PbootCMS开发,为五金零件、精密模具加工等英文外贸企业设计。采用响应式布局,适配各类移动设备,是五金零件企业开展国际贸易的专业展示平台。查看源码 -
帝国CMS7.5二次元COS漫展网站模板源码免费下载本模板基于帝国CMS 7.5版本深度开发,为二次元文化分享领域设计。采用UTF-8编码,支持中文内容展示,特别适用于COSPLAY作品展示、漫展信息发布等二次元相关内容的网站建设。模板结构清晰,布局合理,充分考虑了二次元用户群体的浏览习惯和审美需求。查看源码 -
帝国cms7.5女性护肤搭配美妆潮流网站源码带数据4.5G本模板专为女性美容护肤行业设计,提供美容护肤、发型设计、女性健康、时尚化妆、娱乐新闻、服饰搭配等女性潮流资讯内容展示。采用帝国CMS7.5开发,同步生成电脑端和手机端,满足用户对美容时尚信息的获取需求。查看源码 -
自适应黑色简繁双语轴承齿轮机械设备制造网站模板该模板为轴承齿轮机械制造企业提供一体化网站建设方案,着重解决行业特有的多语言展示、移动端适配和高效率内容管理需求,帮助企业精准展示产品特性与工艺流程查看源码
| 分享笔记 (共有 篇笔记) |
