首页 > zen-cart, 数据采集 > 付亚辉: zen-cart采集规则和数据库发布模块下载
201202/11

付亚辉: zen-cart采集规则和数据库发布模块下载

        今天网速实在太慢了,什么也搞不了。再加上天气这么热,心里有点烦躁。废话不多说了,开始今天的教程。

       首先安装zen-cart,我用的是zen-cart1.9中文版的,安装步骤我就不写了,这个很简单了。安装以后根据你要采集的网站建立对应的目录就OK了。例如我要测试采集的网站www.yankeesjerseystore.com这是我随便找的网站,我首先建立大分类Shop By Players 然后建立相应的小分类Alex Rodriguez Jersey(多页面,等会解释这个)和Folder Alfonso Soriano Jersey(单页面)。我只是测试采集就先建一个大分类两个小分类。如下图
大分类
小分类
       然后开始写采集规则了,每个网站的采集规则是不一样的,针对每个网站写不同的规则,不过zen-cart网站的规则差不多了,写多了就会发现很简单。
       第一步写采集网址规则,首先添加采集地址(我添加的是http://www.yankeesjerseystore.com/new-york-yankees-jersey-alex-rodriguez-jersey-c-6_16.html?page=(*)&sort=20a)如下图
然后为了采集自己想要的页面,就必须过滤一些网址了,就要写一些限制性的标志了,必须包含,不得包含,页面内选定区域采集网址从xx到xx等请看下图我是如何写的,这个不是唯一性的,每个人写的可能不一样。
这一步算是完成了。
       第二步写采集内容规则,我把每个标签名对应规则放出来,如下图
商品名称
商品型号
商品价格
商品特价
商品图像,注意哪个文件保存格式,我选择了[原文件名],根据自己的需要也可以改
商品描述,注意用哪个html标签排除,我用了去首尾空白符
OK,规则写完了,可以找个内容页测试一下,如下图
看,已经测试成功了,注意图片一定要显示完整。
       第三步发布内容设置,有几种发布方式,我选择方式三,导入到自定义数据库,如下图
然后点击数据库发布全局配置,选择编辑你要编辑数据库发布配置,如下图
点击编辑以后,出现下图
然后编辑数据库发布模块,如下图
看到你刚才写的标签名没,注意这个地方的标签与刚才写的标签名要对应着,,不然就会失败的,看到最后那个“2”没,就是刚才我们建立栏目时的分类ID,每采集一个栏目的时候变换不同的ID,上面我已经写了,不需要改动了,最后我会把发布模块分享给朋友们。修改完以后,要点击那个“修改配置”这样才能保存着。
       第四步文件保存及部分高级设置,如下图,基本上不用改变。
       最后一步,点击更新,然后就可以点击开始采集了,采集效果如下图
      OK,采集成功了,可以发布到数据库了,然后我到网站后台看一下,是不是已经导入到数据库了,呵呵!如下图,成功了
后台效果
前台效果
       最后要说明一点,采集单网址也是一样,注意选择如下图
       好了,教程写完了,挺累的,写了两个小时,不知道你们看明白没,反正我是很明白(呵呵),根据不同的网站灵活运用就OK了,稍后我把采集规则放出来,供朋友下载,有不明白的地方可以给我留言或者加我qq          zen-cart.rar(点击下载哦)

 

版权申明:原创文章,转载时请务必复制以下链接。
文章名称:付亚辉: zen-cart采集规则和数据库发布模块下载
文章链接:http://www.fuyahui.com/fuyahui-zencart-acquisition-rules-and-publish-a-database-module-download.html
来源地址:http://www.fuyahui.com

由于部分文章由网上转载,如若侵权,我们会在收到您的通知并提供有效证明后立刻删除。

5 Responses to “付亚辉: zen-cart采集规则和数据库发布模块下载”

  1. #1 老猫博客 回复 | 引用 Post:2012-03-06 16:13

    下载的失效了,下载不了了呢

    • #2 admin 回复 | 引用 Post:2012-03-07 09:02

      晚上我回去看看哦,是不是连接有问题呢

  2. #3 瘦脸 回复 | 引用 Post:2012-04-26 03:07

    网站拒绝显示此网页
    HTTP 403
    最可能的原因是:
    此网站要求您登录。

    您可以尝试以下操作:
    返回到上一页。

    更多信息

    此错误(HTTP 403 禁止)意味着 Internet Explorer 可以连接到该网站,但是没有查看该网页的权限。

    有关 HTTP 错误的详细信息,请参阅帮助。

    又是下载不了

    • #4 admin 回复 | 引用 Post:2012-04-30 14:30

      加我qq:350314173,我传给你

发表评论