• 联盟
  • 文章
  • 当前位置:排行榜 > 资讯 > 经验学堂 > 列表经验学堂

    火车头采集手动填写链接地址规则

    编辑:996评测网 发布时间:2020-04-25 15:51 分类:经验学堂

    让我们先看看火车采集器中的参数是什么、出现在哪里、怎么用……
    [参数]在火车采集器中是一个标记标签,用来匹配某些待提取的信息。这里和(*)区分开来,(*)是通配符号,用来代表某些应被忽略的信息。
    [参数]出现在内容网址获取和内容标签的正则提取中,如图:

    关于[参数]、[参数1]、[参数N]?
    这三者之间是什么样的存在?


    比如:http://996top.com/hefei/food
    如果hefei和food都是我们需要提取利用的内容,那么在写提取规则的时候我们就把它们标记为参数标签:http://996top.com/[参数]/[参数]
    而在拼接地址的时候就是对上面提取的参数进行利用,在这里我们提取到的参数已经进行了排序,所以hefei和food就分别为是我们提取到的[参数1]和[参数2]。但在写拼接地址的时候,我们会发现旁边出现的标签是[参数N]而不是[参数1]、[参数2],这是为什么呢?
    其实[参数N]的作用是我们点击一次时就自动出现[参数1]、再点击就依次出现[参数2]、[参数3]……方便需要利用多个参数的情况。

    如果依次出现的参数序号和拼接目标不同,我们还可自行修改数字调整参数位置,如上动态图片~

    知道怎么用了,但具体用在什么地方呢?下面奉上大众点评中用参数拼接地址的真实操作案例:

    进入商家列表页面后我们需要获取商家的地址,点击一个商家看看地址的格式。

    回到列表页,查看页面源代码,可以发现商家的地址是不全的,因此我们需要借用源代码中的信息拼接出一个完整的内容页地址。这时源代码中的内容页地址信息就可以借助参数提取出来,不多说,看下图规则。




    这里的[参数1]就是点击[参数N]后出来的哟,内容页地址拼接完成后我们来测试一下~

    这样就拼接成功啦~

    一、原理

    手动填写链接地址规则原理是编写脚本规则,去和源代码里的内容匹配,获取到自己设置的参数即可。

    使用到的正则解释

    [参数]

    用来匹配某项准备提取信息的标记标签,如想要在以下代码中提取组合出某种格式。以从代码"mClk(this,'108484','134217', '168475','1');"中提取组合出新的地址格式为例。

    "mClk(this,'[参数]','[参数]', '[参数]','1'); ",按照次序,108484参数就是参数1,依次类推。实际需要的地址为以下的地址格式:bbs/read.php?id=[参数1]&sort=[参数3]&action=[参数2],上面代码中的3个参数和下面地址中的id,soft和action参数要对应相应的值,次序不要颠倒。这样就组合成了新的地址格式。

    (*)

    (*)为通配符,在火车采集器可以在起始地址中代表页码数,在标签规则,模块或其他设置中可匹配代表任意字符串,如(*)可以匹配到xxx字符串也可以匹配到yy字符串。

     

     

    二、使用场合和使用方法

    1、一般可以使用自动获取网址链接的网页都是可以使用手动获取。手动填写链接地址的灵活性比较高!

    2、网页源代码中的内容页链接不规范,或者网址中没有链接的时候,都可以使用手动填写链接地址规则。

    举例说明:

    例一、如ajax链接

    http://996top.com/vod-showlist-id-1-order-time-c-18056-p-1ajax?callback=jQuery17105933980392558583_1363931589968&_=1363931590312

    查看源代码可知,网址链接不规范,这样的链接地址就不能直接使用自动获取网址了。

    image

    解决方法:

    image

    脚本规则:

     

     

    实际链接:http://[参数1]/[参数2]/[参数3]/

    例二、例如列表页里只有内容页的一个ID,其他的网址信息都没有的,这样也可以使用手动填写链接地址规则获取。

    列表页网址:http://996top.com/contentdoc/getdoclist.jsp?fieldid=1005&p=0&perpage=30&keyword=null

    内容页网址:http://996top.com/contentdoc/docContent.jsp?oid=55700

    查看源代码可知,网址链接也是不规范的。

    image

    解决方法:

    image

    脚本规则:|(*),[参数],

    实际链接:http://996top.com/contentdoc/docContent.jsp?oid=[参数1]


    (责任编辑:996top广告联盟评测)
    上一篇:火车头怎样采集图片发布图片文章? 下一篇:火车头采集器使用导入数据库发布数据到帝国CMS数据库?
    下级栏目
    最新加入
  • 12021-03-14唐土广告联盟
  • 22021-03-14伯技联盟
  • 32021-03-14新锐移动联盟
  • 42021-03-06卢卡联盟
  • 52020-07-20CPS日结广告联盟
  • 62020-07-15发发广告联盟
  • 72020-07-05团成移动联盟
  • 82020-06-22蜜趣CPS联盟
  • 92020-05-05趣米移动广告
  • 102020-04-28斯巴达联盟
  • 热评联盟
  • 1点评[93]铁憨憨广告联盟
  • 2点评[32]非凡广告联盟
  • 3点评[25]誉见广告平台
  • 4点评[22]辉耀移动联盟
  • 5点评[19]巨梦广告联盟
  • 6点评[16]望云广告联盟
  • 7点评[13]快唯广告联盟
  • 8点评[12]晨阳广告传媒
  • 9点评[10]盖亚联盟CPA
  • 10点评[10]亿云联盟
  • 服务排行
  • 1[5]很好唐土广告联盟
  • 2[5]很好伯技联盟
  • 3[5]很好新锐移动联盟
  • 4[5]很好卢卡联盟
  • 5[5]很好CPS日结广告联盟
  • 6[5]很好发发广告联盟
  • 7[5]很好团成移动联盟
  • 8[5]很好蜜趣CPS联盟
  • 9[5]很好趣米移动广告
  • 10[5]很好斯巴达联盟
  • 人气排行
  • 1浏览[419]盖亚联盟CPA
  • 2浏览[278]趣米移动广告
  • 3浏览[263]青瓜传媒APP推广
  • 4浏览[219]小明精准联盟
  • 5浏览[216]百度联盟
  • 6浏览[187]CPA唯尚广告联盟
  • 7浏览[158]非凡广告联盟
  • 8浏览[125]易盟广告
  • 9浏览[122]联合云享广告平台
  • 10浏览[117]超越广告联盟
  • 关于996| 版权声明| 联系方式| 广告服务

    Copyright © 版权所有:996评测网 广告联系QQ:2521646590 (请注明:投广告)
    (评论内容只代表网友观点,与996评测网立场无关)