您现在的位置是:首页 > cms教程 > 帝国CMS教程帝国CMS教程
帝国CMS如何采集新闻文章
危眺沃2023-05-22帝国CMS教程已有人查阅
导读帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力

帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采集功能来完成信息的录入。为了深入了解帝国cms采集功能,下面我们以“新浪各地新闻”栏目为例来进行实战采集。
一、增加采集节点
1、添加节点:
帝国cms怎么采集信息
2、选择要增加采集的栏目:
帝国cms怎么采集信息
3、进入增加节点表单:
帝国cms怎么采集信息
4、在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:
帝国cms怎么采集信息
5、下来发现好多选项,如“采集页面地址方式二,内容页地址前缀...”先不要理他,后面再一一详解,直接拉到 “信息链接区域正则”这里:
帝国cms怎么采集信息
6、这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:
帝国cms怎么采集信息
7、把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:
帝国cms怎么采集信息
8、切换到Dreamweaver代码方式,
就是信息链接区域:
帝国cms怎么采集信息
9、得到信息链接区域正则:
帝国cms怎么采集信息
10、得到信息页链接正则:
帝国cms怎么采集信息
11、注意:如果信息页链接是相对地址,例如,那么“内容页地址前缀”要加域名:
帝国cms怎么采集信息
12、现在要采集内容页的标题和内容:
帝国cms怎么采集信息
13、查看新闻页“源文件”,找title标签:
帝国cms怎么采集信息
14、取得标题正则:
帝国cms怎么采集信息
15、这里是要采集的内容区域:
帝国cms怎么采集信息
16、取得新闻内容正则:
帝国cms怎么采集信息
(注意:新闻内容正则里的 d_id='*' 用了通配符,因为每一篇新闻的d_id值是不同的,所以可以用*来代替它,“*”可以代替任意字符。)
17、点击提交按钮就完成了整个采集节点:
帝国cms怎么采集信息
二、预览采集节点是否正确
1、提交按钮后返回管理节点:
帝国cms怎么采集信息
2、点击“预览”采集,进入节点预览结果:
帝国cms怎么采集信息
3、采集内容页列表:
帝国cms怎么采集信息
4、采集内容页页面:
帝国cms怎么采集信息
三、采集
1、预览采集节点无误后,然后返回“管理节点”,点击“开始采集”链接就开始进行采集:
帝国cms怎么采集信息
2、系统正在采集中:
帝国cms怎么采集信息
3、采集完后显示本地临时入库的信息,这时可以对临时入库的信息进行修改或者删除:
帝国cms怎么采集信息
4、修改信息页面如图:
帝国cms怎么采集信息
5、对采集的信息进行审核并入库,点击“入库全部信息按钮”:
帝国cms怎么采集信息
6、确定操作:
帝国cms怎么采集信息
7、信息入库完毕提示:
帝国cms怎么采集信息
信息入库完毕后下来点击”管理信息“:
帝国cms怎么采集信息
我们可以看到刚刚采集入库的新闻信息:
帝国cms怎么采集信息
最后到“数据更新”刷新首页、栏目、和内容页就可以完成网站的信息采集了。
本文标签:帝国cms采集
很赞哦! ()
相关教程
图文教程
帝国cms怎么调用发布于10秒前 1周前 1个月前函数方法
内容页调用:<?=user_ago($navinfor[newstime])?>列表內容模板(list.var) (*) 调用:$listtemp = "发布时间".user_ago($r[newstime])."";
帝国cms增加字段提示Row size too large怎么办
帝国CMS增加字段提示以下信息Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. You have to change some columns to TE
帝国CMS实现重复调用上一篇下一篇SQL代码写法
分享一段更高效的帝国CMS调用上一篇下一篇方法,支持重复多次调用,但只查一次数据库。
帝国CMS会员组显示不同菜单的方法
帝国CMS会员中心允许会员投稿,不同的会员组有不同的投稿权限,会员中心菜单仅显示对本会员组有作用的菜单项目。
相关源码
-
响应式艺考培训学校机构pbootcms模板html5源码基于PbootCMS免费开源内核开发,为艺考培训学校与艺术机构设计,替换图文即可快速适配全行业需求。响应式布局兼容手机/PC端,数据实时同步,运维效率提升300%。查看源码 -
帝国cms7.5奇闻异事末解之谜模板免费下载带数据本模板基于帝国CMS7.5系统开发,为神秘现象、未解之谜类主题网站设计。包含完整的PC端、移动端及百度MIP站同步生成功能,内置火车头采集规则模块,可快速采集目标站内容资源。整体设计风格神秘大气,符合主题定位。查看源码 -
(自适应响应式)HTML5中小学早教教育机构类网站pbootcms模板下载基于PbootCMS内核开发的响应式模板,为早教中心、培训学校等教育机构打造,提供从技术架构到视觉呈现的全套网站建设方案。查看源码 -
(自适应)工商代理公司注册财务会计pbootcms模板免费下载为工商代理、财务会计服务企业设计的网站模板,基于PbootCMS开发,充分考虑了企业服务行业的展示需求与客户转化路径。设计风格专业严谨,布局清晰合理,呈现企业服务内容与专业优势。查看源码 -
(自适应响应式)高端家用办公家具家居桌椅pbootcms模板下载为办公家具企业设计的响应式网站模板,涵盖产品展示、案例呈现、企业介绍等核心模块。通过可视化后台可快速发布实木桌椅、系统家具、办公屏风等产品信息,帮助客户直观了解材质参数与空间搭配方案。查看源码 -
(自适应)代理记账财务会计咨询服务个人公司网站模板该响应式网站模板为代理记账、财政咨询及财务会计类企业设计,基于PbootCMS内核开发。通过自适应手机端的HTML5技术,帮助企业高效构建专业财税服务平台查看源码
| 分享笔记 (共有 篇笔记) |

