在我们做网站用火车头进行内容采集过程中,难免会遇到有的下载站把下载地址进行了隐藏,并且下载地址不统一,如下:

 

可以到下载地址有的是相对地址

 <ul class="ul_Address"><script>_downInfo ={Address:"/anzhuo1/homie_v1.0.4_2265.com.apk",TypeID:"1",SoftLinkID:"137056",SoftID:"118759",Special:"0"}</script>

有的是绝对地址:

<script>_downInfo ={Address:"https://ugame.9game.cn/game/downloadGame?pack.cooperateModelId=51319&pack.id=21974768",TypeID:"0",SoftLinkID:"417736",SoftID:"267030",Special:"0"}</script>

 

我们在用火车头进行采集过程中,对这样的就需要进行一个组合判断

首先新建标签  下载地址1,如图:

 

然后新建标签下载地址2:获取

数据处理里新建同义词替换:

然后新建标签下载地址,组合下载地址2+下载地址1即可。

 

参考规则附上:生活休闲

目标站地址:

http://www.2265.com/game/267030.html

下载地址typeID路径:

http://www.2265.com/inc/SoftLinkType.js

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。