亚马逊云科技 Build On-这可能是我离Amazon最近的一次

本文分享了作者参加Amazon云科技Build On活动的体验,包括云服务的使用感受和Amazon的印象。文章指出,尽管活动主要是为了推广Amazon云服务,但它也提供了学习新技术的机会。作者在实验中遇到并解决了关于时间戳格式的问题,强调了实践在学习过程中的重要性。文章最后鼓励读者多动手、热爱实验。
部署运行你感兴趣的模型镜像

一、 Amazon的服务及印象

1、云服务体验

    对于深度学习方向的同学来说,GPU资源是必不可少的,要么你所在的实验室具有雄厚的资金条件,显卡多得随便用;要么你选择一份能够拥有大厂显卡使用权的实习;要么只能考虑在线的一些资源了。
    博主不是Amazon云服务的重度用户,但印象中云服务一直做得很不错。如果你是学生或者新用户的话,可以直接免费申请试用,实践出真知。博主身边有创业的同学,使用的Amazon的云服务给出的评价是:“虽然价格不是很便宜,但是服务很好,响应速度感人,很值”。如果同学们愿意为线上资源付费的话,Amazon是一个不错的选择(非广告,没有任何营收哈)。对于手中资金尚不宽裕的同学来说,Google的colab是一个非常不错的白嫖选择,不过要记得即使保存实验中间结果,因为colab的免费服务在运行24小时后会自动中断,释放资源分发给其他人。

2、Amazon印象

让我对Amazon好感拉满的一个重要原因是Amazon的CTO李沐。李沐老师的《跟李沐学AI》课程讲解得详细但不繁琐,简洁却又知识量饱满。加上李沐老师个人平易近人、谦虚和蔼,让我对于Amazon这样的企业也充满了好感。毕竟一个企业的CTO在本职工作之外,能够有如此的热情和精力进行知识共享,也可以从侧面代表这个企业的追求。有兴趣的同学去B站搜索《跟李沐学AI》,这里不放链接了,以免有引流嫌疑。

二、 当我们谈论实验时我们在谈论什么

1、好读书,不求甚解

Build On实验是Amazon开展的一系列活动。对于Amazon来说,活动的目的当然是让更多的用户了解Amazon云服务,为Amazon吸引更多的优质客户,提高企业影响力。但这并不意味着这只是一场商业活动,在Build On的实验中,我们一样可以在技术上有所得。
Build On整个活动的持续时间只有半天,在半天时间里是不可能让任何人突飞猛进,洞察一个全新的行业的,但却可以给我们一个打开一扇新技术大门的钥匙。本次的Build On活动以一个通过摄像头识别鸟类的产品为依托,向同学们讲述了这个产品的基本实现流程并带领活动同学们完整地操作了一遍。当然这不足以让同学立刻能够完全独立实现这样一个产品,但也足以让同学们这样一款产品的完成需要的基本步骤,足以达到对一个项目“知全貌”的目的。

2、九层之塔,起于累土

在Build On实验的动手实践过程中,每一步都有详细的操作手册和老师指导。虽然一遍流程操作无法使我达到掌握技术的目的,但对于工程经验的积累仍然可以有所收获。例如,在视频流上传云端的过程中,我上传云端的视频一直无法播放,这个问题甚至让指导老师也很困惑。我甚至删除实验环境,在老师的监督下重新进行了一遍实验仍然如此。最后,我才发现原来在云端有两个不同的时间戳格式可以进行选择,由于实验现场和服务器所在地的时差问题,时间一直无法匹配,需要修改默认的时间戳格式。
这样的工程经验是在想象中无法得到的。在绝大部门的理工学科中,实验是绝对不可缺少的环节,纯粹的理论恐怕仅存在于纯粹的数学中了。哪怕物理学都需要从实验中观察、验证、获得灵感,更不要说计算机了。
作为理工科的学生,希望我们都能够勤于动手、热爱实验,诸君共勉!
此次活动的实验手册我已上传百度网盘,有兴趣的同学可以下载尝试。
链接如下:
链接:https://pan.baidu.com/s/1MFdrnpFTYFGskE3x18Z-Tw
提取码:qcdb

您可能感兴趣的与本文相关的镜像

Linly-Talker

Linly-Talker

AI应用

Linly-Talker是一款创新的数字人对话系统,它融合了最新的人工智能技术,包括大型语言模型(LLM)、自动语音识别(ASR)、文本到语音转换(TTS)和语音克隆技术

<think> 嗯,用户这次明确要求亚马逊云EC2的运维指南,看来ta正在着手云服务器的实际管理工作。结合之前的引用资料,用户应该是在企业IT环境中负责成本优化的人员——毕竟引用[1]反复强调EC2成本节省10%-20%的关键点,引用[2]里那些初创企业案例也凸显了运维效率的重要性。 用户可能不仅需要基础操作手册,更关注如何系统性降低TCO(总体拥有成本)。ta特意强调"运维指南"而非简单功能说明,说明需要的是包含成本控制、性能调优、安全监控等维度的综合方案。有趣的是,两次引用都提到"3个月"这个时间节点(潜行创新/IoT平台建设、客户初期优化周期),这提示我应该把指南按时间轴组织。 注意到用户上次要求生成相关问题,这次却没提。但根据ta引用[2]里对DevOps案例的关注(Worktile自动化部署),运维指南里必须包含自动化工具链的集成方案。另外碳阻迹的全球化案例暗示用户可能有多地域部署需求,安全章节要特别强调跨区域合规配置。 最棘手的点是引用[1]最后那句"只有完全优化才能真实对比TCO"—这实际在暗示单纯的操作步骤远远不够。所以我的回复要把每个运维动作和成本/性能的量化关联说透,比如实例调整建议必须附带AWS官方文档标注的节省比例范围。 </think> 以下是亚马逊云EC2的运维指南框架及核心实践要点,结合成本优化、性能调优和自动化运维场景整理: --- ### **一、EC2运维核心模块** #### **1. 实例生命周期管理** - **自动伸缩(Auto Scaling)** - 配置动态扩缩容策略(如CPU >70%扩容,<30%缩容) - 使用预测性扩缩容提前应对流量波峰 ```bash aws autoscaling put-scaling-policy --policy-name cpu70-scale-out \ --adjustment-type ChangeInCapacity --scaling-adjustment 1 \ --cooldown 300 --auto-scaling-group-name my-asg ``` - **实例启停调度** 通过`Instance Scheduler`工具在非工作时间自动停止开发/测试环境实例,节省最高70%成本[^1] #### **2. 成本优化实践** | **优化手段** | **预期节省** | **适用场景** | |--------------------|-------------------|--------------------------| | **竞价实例(Spot)** | 最高90% OFF | 容错任务(批处理、CI/CD) | | **预留实例(RI)** | 标准RI最高72% OFF | 稳定生产负载 | | **大小调优** | 10%-20%成本降低 | 负载波动场景[^1] | - **操作建议** 使用`AWS Cost Explorer`识别低利用率实例,配合`Compute Optimizer`自动获取调整建议 #### **3. 性能监控与调优** - **监控工具栈** - **CloudWatch**:设置实例级指标(CPU、内存、磁盘IO)告警 - **CloudTrail**:审计API调用行为 - **调优关键项** ```markdown * EBS优化:为I/O密集型实例启用`EBS Optimized` * 增强网络:使用ENA/SR-IOV驱动提升网络吞吐 * GPU实例:对AI训练任务启用Elastic Fabric Adapter (EFA) ``` #### **4. 安全与合规** - **加固措施** - 启用`IMDSv2`(元数据服务防SSRF攻击) - 使用`Security Hub`自动检查以下合规项: ✓ 禁用根账户API密钥 ✓ EBS加密状态 ✓ 未授权安全组规则 --- ### **二、自动化运维实战** #### **1. 基础设施即代码(IaC)** ```cloudformation # CloudFormation模板片段 Resources: WebServerInstance: Type: AWS::EC2::Instance Properties: ImageId: ami-0abcdef1234567890 # 使用Golden AMI InstanceType: t3.medium Tags: - Key: Environment Value: Production ``` #### **2. DevOps流水线集成** - **CI/CD流程** 通过`CodeDeploy`实现蓝绿部署: ```mermaid graph LR A[代码提交] --> B(CodeBuild构建镜像) B --> C{自动测试} C -->|通过| D[CodeDeploy切换流量至新实例组] ``` --- ### **三、高阶优化场景** - **混合云部署** 通过`VMware Cloud on AWS`迁移本地虚拟机,保留原有管理接口 - **无服务器化改造** 将定时任务迁移至Lambda,消除实例空转成本(如日志压缩、DB备份) > **关键提醒**:持续优化是成本节约的核心,企业通常在迁移后3-6个月内通过精细化调整再获**10%-20%成本削减**,长期云原生改造可达**60%+节省**[^1][^2] --- **相关问题** 1. 如何监控EC2实例的跨区域网络延迟? 2. 预留实例(RI)与Savings Plans的优劣对比? 3. EC2实例遭遇CPU窃取(Steal Time)偏高如何处理? 4. 如何设计EC2灾难恢复方案(如多AZ部署+定期快照)? [^1]: AWS成本优化白皮书 [^2]: AWS架构完善框架(Well-Architected)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值