php抓取淘宝/天猫评论,抓取成功后自动保存为"文本格式",存储在当前目录下

这篇博客展示了如何使用PHP从淘宝/天猫获取商品评论,并将抓取到的数据以文本格式保存到当前目录。代码中定义了必要的参数,通过file_get_contents函数发送请求,正则表达式匹配评论内容,再进行编码转换并存储到指定文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

不说其他的,上段代码先

index.html

<!DOCTYPE html>
<html>
<meta charset="utf-8">
<head>
<title>抓取淘宝评论</title>
</head>
<style type="text/css">
.boss{
width:500px;
height:350px;
margin:0 auto;
margin-top: 10%;
}
img{
width:500px;
height:350px;
position: absolute;
z-index: -10;
}
.div1{
width: 200px;
height:200px;
margin:0 auto;
padding: 15px;
}
button{
width:180px;
height:30px;
background-color: skyblue;
margin-top: 10px;
}
#inp1{
width:115px;
}
</style>
<body>
<div class="boss">
<img src="1.jpg">
<div class="div1">
<h1>抓取淘宝评论</h1>
<form action="pinglun.php" method="post">
请填写itemId:<br><input type="text" id="inp2" placeholder="请填写itemId" name="itemId" value=""><br>
请填写spuId:<br><input type="text" id="inp2" placeholder="请填写spuId" name="spuId" value=""><br>
请填写sellerId:<br><input type="text" id="inp3" placeholder="请填写sellerId" name="sellerId" value=""><br>
请填写生成文件夹名:<br><input type="text" id="inp3" placeholder="XXX.txt格式" name="sed" value=""><br>
<button>提交</button>
</form>
</div>
</div>
</body>
</html>



pinglun.php

<?php
header("Content-Type:text/html;charset=utf-8");
 $itemId = $_POST['itemId'];
$spuId = $_POST['spuId'];
$sellerId = $_POST['sellerId'];
$sed = $_POST['sed'];


if($itemId == ''){
    echo "<script>alert('错误的itemId');history.go(-1);</script>";
}else if($spuId == ''){
    echo "<script>alert('错误的spuId');history.go(-1);</script>";
}else if($sellerId == ''){
    echo "<script>alert('错误的sellerId');history.go(-1);</script>";
}else if($sed == ''){
    echo "<script>alert('错误的sed');history.go(-1);</script>";
}




$url="https://rate.tmall.com/list_detail_rate.htm?itemId=$itemId&spuId=$spuId&sellerId=$sellerId&order=3¤tPage=1&append=0&content=1&tagId=&posi=&picture=1";
  
    $res =  file_get_contents($url);  
    // 匹配评论部分  
    preg_match_all("/Content\":\"((.|\n)*?)\"/",$res, $match);  
  
    $wt = array();  


    $arr = $match[1];
    // 去除空评论  
    foreach ($arr as $v) {  
        if($v != ''){  
            // 转化成utf-8编码  
            $wt[] = iconv("GBK","UTF-8", $v);
        } 
    }  
$str = implode("\r\n", $wt);
$txt = file_put_contents($sed, $str);
if($txt == 'false'){
    echo "储存失败";
}else{
    echo "储存成功";
}
?>

抓取完成后:


淘宝评论采集原创利器是一个自动采集淘宝商品评论和买家昵称的工具。支持引用买家、评论、日期、尺码、颜色、标题等参数自由组合为模板,可以设置过滤等采集参数,内置按关键词和按店铺采集宝贝地址的功能。 软件功能: 第一,支持引用 买家、评论、日期、尺码、颜色、标题等参数自由组合为模板,且支持多模板随机选择 第二,支持每个参数,本参数的所有数据随机互换位置。如某宝贝采集100组合,那么,买家这个参数就在所有一百买家数据之间随机互换位置,评论这个参数就在所有一百评论数据之间随机互换位置,日期、尺码、颜色等也一样! 第三,支持商品标题按空格分割随机交换位置,还支持提取评论数据中随机一句接在标题尾 一般什么人需要呢: 1、卖家搜集买家昵称通过旺旺等途径实现精准营销,或搜集同行宝贝的评论信息作为自己宝贝的参考信誉(你懂的) 2、淘宝客可以将评论信息组合成文章发布到网站(自己的网站和大众网站如博客、空间等)上获取百度收录,或也搜集买家昵称建立数据库。 3、生成的文章各种用途,更多应用看自己的需要了。可配合水淼·原创文章生成器,导入组合更优质和变化的原创文章。 采集的评论是买家真实写的,原创可读通,再加上打乱秩序,每次采集同一个宝贝,返回的评论数据都不同,效果更加好 更新日志: 版本 v2.5日期 2014-01-04 全新界面,智能引用全部参数,不再局限于如年龄、身高等几个内置参数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值