PDO采集菜鸟入门

<?php
    /**
     * 采集soho网页新闻
     */
    // header头
    header("content-type:text/html;charset=utf8");
    // 网站地址
    $url="http://sports.sohu.com/nba.shtml 
";
    // 获取网站内容
    $str=file_get_contents($url);
    // 转码
    $str=iconv('GBK','utf-8',$str);
    // pdo连接数据库
    $pdo=new PDO("mysql:host=localhost;dbname=caiji" ,"root","root");
    $pdo->exec("set names utf8");
    // 获取网页内容`
    $reg='#<div style="display: block; height: 110px; overflow: hidden;" class="l">.*<div class="blank10"></div>#isU';
    preg_match($reg, $str,$arr);
    // 分步正则获取图片、标题、详情
    $reg2='#<img alt="NBA" src="(.*)" border="0" height="100" width="100"></a></div>#isU';
    $reg3='#<h4><a onFocus="undefined" title="" href=".*" target="_blank">(.*)</a></h4>#isU';
    $reg4='#<p>(.*)<a onFocus="undefined" href=".*" target="_blank">.*<div class="r"></div></div>#isU';
    // var_dump($arr);
    preg_match_all($reg2,$arr[0],$image);
    preg_match_all($reg3,$arr[0],$title);
    preg_match_all($reg4,$arr[0],$content);
    // 添加到同一个数组
    $data=array();
    // 将图片保存到本地
    foreach ($image[1] as $key => $value) {
        // 截取后缀
        $exm=substr($value,strrpos($value,'.'));
        // 拼写路径
        $image_name='./image/'.time().rand(1000,9999).$exm;
        // var_dump($image_name);
        // 获取图片内容
        $value=file_get_contents($value);
        file_put_contents($image_name,$value);
        $data[$key]['image']=$image_name;
    }
    // foreach ($image[1] as $key => $value) {
    //     $data[$key]['image']=$value;
    // }
    foreach ($title[1] as $key => $value) {
        $data[$key]['title']=$value;
    }
    foreach ($content[1] as $key => $value) {
        $data[$key]['content']=$value;
    }
    // 循环入库
    foreach ($data as $key => $value) {
        $sql="insert into sohu (image,title,content) values('".$value['image']."','".$value['title']."','".$value['content']."')";
        $pdo->exec($sql);
    }
    var_dump($data);
    
 ?> 
内容概要:本文针对国内加密货币市场预测研究较少的现状,采用BP神经网络构建了CCi30指数预测模型。研究选取2018年3月1日至2019年3月26日共391天的数据作为样本,通过“试凑法”确定最优隐结点数目,建立三层BP神经网络模型对CCi30指数收盘价进行预测。论文详细介绍了数据预处理、模型构建、训练及评估过程,包括数据归一化、特征工程、模型架构设计(如输入层、隐藏层、输出层)、模型编译与训练、模型评估(如RMSE、MAE计算)以及结果可视化。研究表明,该模型在短期内能较准确地预测指数变化趋势。此外,文章还讨论了隐层节点数的优化方法及其对预测性能的影响,并提出了若干改进建议,如引入更多技术指标、优化模型架构、尝试其他时序模型等。 适合人群:对加密货币市场预测感兴趣的研究人员、投资者及具备一定编程基础的数据分析师。 使用场景及目标:①为加密货币市场投资者提供一种新的预测工具和方法;②帮助研究人员理解BP神经网络在时间序列预测中的应用;③为后续研究提供改进方向,如数据增强、模型优化、特征工程等。 其他说明:尽管该模型在短期内表现出良好的预测性能,但仍存在一定局限性,如样本量较小、未考虑外部因素影响等。因此,在实际应用中需谨慎对待模型预测结果,并结合其他分析工具共同决策。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值