苏宁、京东物流支持

项目需获取京东和苏宁物流信息,因第三方接口收费且不稳定,作者用PHP写了爬虫。介绍了获取苏宁和京东物流信息的请求URL、类型及数据处理方式,主要是字符串截取和数组处理,最后贴出示例单号。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近项目中有需要用到京东和苏宁的物流信息,但市场上的第三方接口都是收费的,还就是有些不太稳定,于是一鼓作气写了个“爬虫”,这里做简要说明

语言:php,请求先安装curl扩展
一、苏宁物流
RequestUrl:https://wuliu.suning.com/home/toLogisticsDetail.htm
RequestType:post
RequestData:[‘expressNos’=>$this->expressNo]

$Reqdata = ['expressNos'=>$this->expressNo];
$url = 'https://wuliu.suning.com/home/toLogisticsDetail.htm';
$content = $this->Curl_post($url,$Reqdata);
private function Curl_post($url,$post_data){
	$ch = curl_init();
	curl_setopt($ch, CURLOPT_POST, 1);
	curl_setopt($ch, CURLOPT_HEADER, 0);
	curl_setopt($ch, CURLOPT_URL,$url);
	curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);
	$result = curl_exec($ch);
	$data = str_replace("\"",'"',$result );
	$data = json_decode($data,true);
	return $data;
}

拿到请求的内容,做如下处理

  1. 去掉最外层部分
$content = explode('<ul class="s-waybill-content">',$content)[1];
$content2 = explode('</ul>',$content)[0];
  1. 去掉中心标签的空格,换行,注释等
 $content2 = $this->compress_html($content2);
 private function compress_html($string) {
	$string = str_replace("\r", "", $string);
    $string = str_replace("\r\n", '', $string); //清除换行符
    $string = str_replace("\n", '', $string); //清除换行符
    $string = str_replace("\t", '', $string); //清除制表符
    $pattern = array("/> *([^ ]*) *</","/[\s]+/","/<!--[^!]*-->/","/\" /","/ \"/","'/\*[^*]*\*/'");
    $replace = array(">\\1<"," ","","\"","\"","");
    return preg_replace($pattern, $replace, $string);
}
  1. 继续做处理…,主要是字符截取和替换,正则等
$pattern = '|<span[^>]*>(.*)</span>|isU';
$s = preg_match_all($pattern, $content2, $matches);
$list = array_chunk($matches[1],2);
foreach ($list as $k=>$v) {
	$list[$k]['time'] = $list[$k][0];
	$list[$k]['text'] = $list[$k][1];
	unset($list[$k][0]);
	unset($list[$k][1]);
}
  1. 完成,$list 就是拿到的数据 .

二、京东物流

RequestUrl:https://www.jdwl.com/order/search?waybillCodes=
RequestType:get

$url = 'https://www.jdwl.com/order/search?waybillCodes='.$this->expressNo;
$content = $this->Curl_get($url);
private function Curl_get($url){
	$curl = curl_init();
	curl_setopt($curl, CURLOPT_URL, $url);
	curl_setopt($curl, CURLOPT_HEADER, 1);
	curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
	$data = curl_exec($curl);
	curl_close($curl);
	return $data;
}

拿到请求的内容,做如下处理

  1. 同样去掉最外层部分
$content = explode('<ul class="b-new-search-list">',$content)[1];
$content2 = explode('</ul>',$content)[0];
  1. 去掉干扰项
$content2 = preg_replace("#<i[^>]*>(.*)</i>#isU", "$1", $content2);
$content2 = $this->compress_html($content2);//这个函数在上面有写
  1. 截取所有li标签里的内容
$_li = '|<li[^>]*>(.*)</li>|isU';
$s = preg_match_all($_li, $content2, $li_);
  1. 循环 $li_[1]的内容,时间和内容的处理
$list = [];//数组,存放物流信息
foreach ($li_[1] as &$v) {
	//s1截取所有日期时间点
	$_time = '|<span[^>]*>(.*)</span>|isU';
	preg_match_all($_time, $v, $time_);
	$date = $time_[1][0];//日期
	unset($time_[1][0]);//去掉日期
	$times = $time_[1];//得到当前日期的所有时间点
	//加上日期
	foreach($times as &$vv){
		$vv = $date.' '.$vv;
	}

	//s2截取所有内容
	$_pcon = '|<p[^>]*>(.*)</p>|isU';
	preg_match_all($_pcon, $v, $pcon_);
	$pcons = $pcon_[1];

	//s3时间与内容匹配
	$reslist = ['time'=>$times,'text'=>$pcons];
	$arrs = array();
	foreach ($reslist as $key => $value) {
        array_push($arrs,$reslist[$key]);
      }
	$r = $this->array_merge_more(['time','text'],$arrs);
	foreach ($r as $v1) {
		array_push($list,$v1);
	}
}
//主要是相同长度,相同顺序的2组数组按照key值拼接组合
private function array_merge_more($keys,$arrs){
    // 检查参数是否正确
    if(!$keys || !is_array($keys) || !$arrs || !is_array($arrs) || count($keys)!=count($arrs)){
      return array();
    }
    // 一维数组中最大长度
    $max_len = 0;
    // 整理数据,把所有一维数组转重新索引
    for($i=0,$len=count($arrs); $i<$len; $i++){
      $arrs[$i] = array_values($arrs[$i]);
      if(count($arrs[$i])>$max_len){
        $max_len = count($arrs[$i]);
      }
    }

    // 合拼数据
    $result = array();
    for($i=0; $i<$max_len; $i++){
      $tmp = array();
      foreach($keys as $k=>$v){
        if(isset($arrs[$k][$i])){
          $tmp[$v] = $arrs[$k][$i];
        }
      }
      $result[] = $tmp;
    }
    return $result;
  }
  1. 完成, $list 就是京东物流的列表

贴两张最终的图

京东:vc50979551335
京东结果
苏宁:SN2I00045595658
苏宁结果
总结:这两个是官网上的内容,主要是准确的截取字符串,和对数组的处理
希望这篇文章对你有帮助,如果有疑问,请私信小编
觉得还不错,赞赏一下
赞赏码

标题基于SpringBoot+Vue的学生交流互助平台研究AI更换标题第1章引言介绍学生交流互助平台的研究背景、意义、现状、方法与创新点。1.1研究背景与意义分析学生交流互助平台在当前教育环境下的需求及其重要性。1.2国内外研究现状综述国内外在学生交流互助平台方面的研究进展与实践应用。1.3研究方法与创新点概述本研究采用的方法论、技术路线及预期的创新成果。第2章相关理论阐述SpringBoot与Vue框架的理论基础及在学生交流互助平台中的应用。2.1SpringBoot框架概述介绍SpringBoot框架的核心思想、特点及优势。2.2Vue框架概述阐述Vue框架的基本原理、组件化开发思想及与前端的交互机制。2.3SpringBoot与Vue的整合应用探讨SpringBoot与Vue在学生交流互助平台中的整合方式及优势。第3章平台需求分析深入分析学生交流互助平台的功能需求、非功能需求及用户体验要求。3.1功能需求分析详细阐述平台的各项功能需求,如用户管理、信息交流、互助学习等。3.2非功能需求分析对平台的性能、安全性、可扩展性等非功能需求进行分析。3.3用户体验要求从用户角度出发,提出平台在易用性、美观性等方面的要求。第4章平台设计与实现具体描述学生交流互助平台的架构设计、功能实现及前后端交互细节。4.1平台架构设计给出平台的整体架构设计,包括前后端分离、微服务架构等思想的应用。4.2功能模块实现详细阐述各个功能模块的实现过程,如用户登录注册、信息发布与查看、在线交流等。4.3前后端交互细节介绍前后端数据交互的方式、接口设计及数据传输过程中的安全问题。第5章平台测试与优化对平台进行全面的测试,发现并解决潜在问题,同时进行优化以提高性能。5.1测试环境与方案介绍测试环境的搭建及所采用的测试方案,包括单元测试、集成测试等。5.2测试结果分析对测试结果进行详细分析,找出问题的根源并
内容概要:本文详细介绍了一个基于灰狼优化算法(GWO)优化的卷积双向长短期记忆神经网络(CNN-BiLSTM)融合注意力机制的多变量多步时间序列预测项目。该项目旨在解决传统时序预测方法难以捕捉非线性、复杂时序依赖关系的问题,通过融合CNN的空间特征提取、BiLSTM的时序建模能力及注意力机制的动态权重调节能力,实现对多变量多步时间序列的精准预测。项目不仅涵盖了数据预处理、模型构建与训练、性能评估,还包括了GUI界面的设计与实现。此外,文章还讨论了模型的部署、应用领域及其未来改进方向。 适合人群:具备一定编程基础,特别是对深度学习、时间序列预测及优化算法有一定了解的研发人员和数据科学家。 使用场景及目标:①用于智能电网负荷预测、金融市场多资产价格预测、环境气象多参数预报、智能制造设备状态监测与预测维护、交通流量预测与智慧交通管理、医疗健康多指标预测等领域;②提升多变量多步时间序列预测精度,优化资源调度和风险管控;③实现自动化超参数优化,降低人工调参成本,提高模型训练效率;④增强模型对复杂时序数据特征的学习能力,促进智能决策支持应用。 阅读建议:此资源不仅提供了详细的代码实现和模型架构解析,还深入探讨了模型优化和实际应用中的挑战与解决方案。因此,在学习过程中,建议结合理论与实践,逐步理解各个模块的功能和实现细节,并尝试在自己的项目中应用这些技术和方法。同时,注意数据预处理的重要性,合理设置模型参数与网络结构,控制多步预测误差传播,防范过拟合,规划计算资源与训练时间,关注模型的可解释性和透明度,以及持续更新与迭代模型,以适应数据分布的变化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值