在我们做网站用火车头进行内容采集过程中,难免会遇到有的下载站把下载地址进行了隐藏,并且下载地址不统一,如下:
可以到下载地址有的是相对地址
<ul class="ul_Address"><script>_downInfo ={Address:"/anzhuo1/homie_v1.0.4_2265.com.apk",TypeID:"1",SoftLinkID:"137056",SoftID:"118759",Special:"0"}</script>
有的是绝对地址:
<script>_downInfo ={Address:"https://ugame.9game.cn/game/downloadGame?pack.cooperateModelId=51319&pack.id=21974768",TypeID:"0",SoftLinkID:"417736",SoftID:"267030",Special:"0"}</script>
我们在用火车头进行采集过程中,对这样的就需要进行一个组合判断。
首先新建标签 下载地址1,如图:
然后新建标签下载地址2:获取
数据处理里新建同义词替换:
然后新建标签下载地址,组合下载地址2+下载地址1即可。
参考规则附上:生活休闲
目标站地址:
http://www.2265.com/game/267030.html
下载地址typeID路径:
http://www.2265.com/inc/SoftLinkType.js
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)