Pandas数据分析实战案例之青春有你2(获取人物名称与头像)

Pandas数据分析实战案例之青春有你2

看前须知:如果有需要借鉴的地方的话,可以把 导出数据下载图片 的地址改掉。除此以外,可能定义函数的时候里面的 获取资料地址有误 ,会显示404,在文章末尾处会附上相应解决方法。

任务:

  1. 获取参加鹅厂比赛小姐姐的姓名
  2. 获取小姐姐们的头像图片

代码如下:

1. 导入所需库
# 导入库
import pandas as pd
import requests
import json
2. 接下来是定义从爱奇艺平台获取信息的一个函数:
def get_aqiyi_infos():
    """
    获取资料地址:http://www.iqiyi.com/h5act/generalVotePlat.html?activityId=373
    """
    # 获取url
    url = "https://vote.iqiyi.com/vote-api/r/getMergeVoteInfo?voteIds=0896558730010825&sourceId=1&uid=&sign=7461535834340ff3861fc4e1bf73cbaf"
    
    # 添加headers
    headers = {
   
   
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'
    }
    
    # 发起请求
    response = requests.get(url, headers=headers
<think>好的,我现在需要帮用户解答如何从零基础开始学习AI的问题。首先,用户之前询问了创业风口,现在转向学习AI,可能是有兴趣进入AI领域创业或就业。我需要考虑用户可能的背景,他们可能没有技术基础,所以回答要尽量通俗易懂,同时结构清晰,步骤明确。 首先,我得确定用户的需求到底是什么。他们提到“0基础学习”,所以需要从最基础的开始,包括数学、编程等。但可能用户时间有限,需要高效的学习路径,避免过多理论,侧重实用。同时,用户可能对学习资源有需求,比如推荐书籍、在线课程、实践项目等。 接下来,我需要分解学习AI的步骤。通常,学习AI需要数学基础,如线性代数、概率统计、微积分,但0基础的人可能需要先掌握这些。不过,用户可能觉得数学太难,所以需要平衡理论和实践,避免一开始就被吓到。或许可以推荐一些入门级的数学资源,或者结合编程工具(如Python库)来应用数学知识,边做边学。 然后是编程,Python是AI的主要语言,所以需要指导用户学习Python基础,特别是数据处理和库的使用,如NumPy、Pandas、Matplotlib,接着是机器学习库如Scikit-learn,深度学习框架如TensorFlow或PyTorch。这部分需要分阶段,从基础到应用。 接下来是机器学习理论,从基本概念开始,监督学习、无监督学习,再到深度学习。可能需要推荐一些经典的教材或在线课程,比如Andrew Ng的课程,同时结合项目实践,比如Kaggle竞赛,来巩固知识。 实践项目非常重要,用户需要通过实际应用来理解理论。可以建议从小项目开始,逐步增加难度。同时,参社区和持续学习也是关键,比如关注AI领域的动态,参加线上课程,阅读论文等。 最后,考虑到用户可能想快速应用AI到创业或工作中,需要强调实践和项目经验的重要性,以及如何构建作品集来展示能力。同时,提醒学习AI是一个长期过程,需要持续学习和适应新技术。 现在需要检查是否有遗漏的要点,比如是否需要提到数学的具体知识点,或者如何选择合适的学习资源。另外,要确保语言通俗,避免专业术语过多,必要时举例说明。比如在数学部分,可以说明线性代数中的矩阵运算在神经网络中的应用,让用户理解为什么需要学习这些数学知识。 还要注意用户可能的痛点,比如时间管理、学习动力,所以在步骤中可以建议制定学习计划和加入学习社群。同时,推荐免费资源,降低学习门槛,比如Coursera的免费课程,Kaggle的入门项目等。 最后,确保结构清晰,分步骤、分阶段,让用户容易跟随,并且每个阶段都有明确的目标和资源推荐。可能还需要加入鼓励的话语,保持积极的态度,帮助用户坚持下去。</think>以下为零基础学习AI的系统路径,采用**「最小可行知识→即时实践→正向反馈」**循环模式,建议每天投入2小时持续学习: $$ \begin{aligned} \text{学习效率} &= \frac{\text{动手项目时长}}{\text{纯理论学习时长}} \times \log(\text{社区互动频次}) \\ &\geq 3.0 \text{(理想阈值)} \end{aligned} $$ --- ### 一、数学基础快速补全(4-6周) 1. **核心三件套精简版**: - 线性代数:掌握矩阵运算$A_{m×n} \cdot B_{n×p}$、特征值分解$A = PDP^{-1}$ - 概率统计:理解贝叶斯定理$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$ - 微积分:会求导链式法则$\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}$ 2. **学习策略**: - 使用$3Blue1Brown$可视化教程(B站有中文字幕) - 配合《AI for Everyone》数学章节(吴恩达著) --- ### 二、编程技能筑基(Python优先) $$ \text{代码能力} = \sum_{i=1}^{n} \frac{\text{项目难度}_i}{\text{调试时间}_i} $$ 1. **阶段目标**: - 基础语法:3周内完成100道LeetCode Easy题 - 数据处理:掌握Pandas处理$10^6$级数据量 - 可视化:用Matplotlib绘制三维决策边界图 2. **工具链配置**: ```python # 必装库清单 !pip install numpy pandas matplotlib !conda install -c pytorch pytorch ``` --- ### 三、机器学习认知升级(实战驱动) $$ \text{模型效果} = \frac{\text{特征工程质量} \times \text{算法选择}}{\text{数据噪声}} $$ 1. **学习路线**: - 第1周:完成Scikit-learn官方教程(6个分类案例) - 第2周:Kaggle入门赛(如Titanic准确率>80%) - 第3周:用PyTorch实现MNIST分类(准确率>97%) 2. **理论突破口**: - 重点理解反向传播$\frac{\partial L}{\partial W} = \delta \cdot a^{T}$ - 掌握交叉熵损失函数$L = -\sum y_i \log(p_i)$ --- ### 四、深度学习专项突破 $$ \text{GPU利用率} \propto \frac{\text{Batch Size}}{\text{显存占用}} $$ 1. **核心框架二选一**: - TensorFlow:工业部署首选(TF Lite移动端优化) - PyTorch:研究开发更灵活(动态计算图优势) 2. **必修项目清单**: - CNN实现CIFAR-10分类(Top5准确率>90%) - LSTM文本生成(困惑度<40) - GAN生成二次元头像(FID<30) --- ### 五、持续进化方法论 1. **知识管理公式**: $$ \text{知识密度} = \frac{\text{论文精读数} + 2\times\text{源码分析数}}{学习月数} $$ 2. **推荐实践平台**: - Colab:免费GPU资源(Tesla T4 / P100) - Hugging Face:20000+预训练模型 - Weights & Biases:实验追踪系统 **关键提醒**:前3个月避免陷入理论推导漩涡,优先建立「数据预处理→模型训练→结果可视化」的完整工作流认知。建议加入AI Hackathon(如阿里天池)获得即时反馈,完成首个项目后学习效率将提升$2-3$倍。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值