- 博客(29)
- 收藏
- 关注
原创 软件工程/SRE 专家:AI 胜任力进阶路线图
摘要: 本文提供了一份面向软件工程/SRE专家的AI技能进阶路线图(2025),分为三个阶段:1)Q1聚焦AI辅助开发,实现自动化代码生成与文档处理;2)Q2-Q3专注AIOps智能运维,构建自动化故障处理系统;3)Q4重点部署LLMOps与AI安全防护。包含具体实践任务(如搭建RAG系统、设计运维智能体)和推荐工具链(Cursor/LangChain等),强调AI工具与工程实践的深度整合。文末附有核心学习资源和安全指南,突出"AI赋能工程师"的职业发展理念。
2025-12-25 15:53:51
564
原创 AI × 软件工程 / SRE 学习清单(工程师版)
AI工程学习路径摘要(工程师版) 本学习清单旨在帮助软件工程师/SRE安全有效地在生产环境中应用AI技术。学习分为四个阶段: 认知基础(1-2周):建立AI与传统服务的差异认知,重点理解不确定性、可测试性和失败模式,产出工程差异文档。 Prompt工程(3-8周):掌握稳定可复用的Prompt设计模式,完成3类工程Prompt模板(分析/生成/校验)及真实场景实验对比。 工程实践(2-4个月):将AI集成到代码库,实现AI Code Review Bot等实际项目,要求结构化输出和明确人类决策点。 SRE整
2025-12-25 15:42:33
479
原创 k8s中的服务通过secret访问数据库的实际案例
本文介绍了在Kubernetes中安全管理数据库敏感信息的最佳实践。通过Python Flask应用连接阿里云RDS的示例,演示了如何使用Kubernetes Secret存储账号密码(jialh/Cfeur123),并通过环境变量注入到应用容器中。文章包含完整实现步骤:创建Secret、编写Python应用、构建Docker镜像、部署到Kubernetes以及测试验证。重点说明了密码变更流程:更新Secret后,通过滚动重启Deployment使新密码生效。这种方案实现了敏感信息与代码的解耦,同时支持配置
2025-12-12 10:14:12
383
原创 【最详细】Kubernetes探针介绍、应用与最佳实践
Kubernetes探针是检测容器健康状态的核心机制,包括存活探针(livenessProbe)、就绪探针(readinessProbe)和启动探针(startupProbe)。存活探针判断容器是否运行,失败会触发重启;就绪探针决定是否接收流量,失败会从服务中剔除;启动探针专为慢启动应用设计。三种探针支持exec、httpGet和tcpSocket三种检测方式,关键参数包括initialDelaySeconds、periodSeconds等。最佳实践建议:存活探针应轻量且谨慎设计失败条件;就绪探针需检查所有
2025-12-11 17:19:46
872
原创 Java 服务从虚拟机迁移到 Kubernetes(K8s)集群
本文介绍了将Java服务从虚拟机迁移到Kubernetes集群的完整流程。首先通过Maven打包应用,然后编写Dockerfile构建基于JDK8的镜像,并推送至镜像仓库。接着配置Kubernetes的Deployment和Service资源文件,指定环境变量、资源配额和服务暴露方式。最后部署到集群并进行连通性测试。文章还提出了优化建议,包括微服务集群迁移的架构设计、网关服务保留方案,以及逐步向云原生网关演进的路径。整个迁移过程保持了原有应用配置的一致性,同时实现了容器化部署的标准化。
2025-12-10 15:27:41
800
原创 【基于阿里云ACK】详细介绍k8s日志系统的设计与部署
本文介绍了在Kubernetes集群中构建PLG日志系统的完整方案。主要内容包括:1)开发输出结构化日志的Python应用并容器化;2)部署应用至K8s集群;3)搭建PLG日志系统(Promtail采集、Loki存储、Grafana展示)。重点步骤涵盖应用日志格式设计、镜像构建、K8s资源部署配置,以及Loki存储组件的详细配置。该方案采用主流云原生技术栈,适合中小型到中大型场景,实现高效可靠的日志收集、存储和查询功能,为系统可观测性提供保障。
2025-12-05 17:21:31
1166
1
原创 CC攻击和DDOS的特征与防护(基于阿里云)
摘要:CC攻击是一种通过大量恶意请求耗尽服务器资源的网络攻击方式。防御措施包括:1)通过分析访问日志识别攻击IP并屏蔽;2)将网站内容静态化减少资源消耗;3)限制单IP连接频率;4)使用云WAF进行代理防护(存在数据泄露和绕过风险);5)限制代理访问。CC攻击与DDoS的区别在于前者针对应用层,后者针对网络层。阿里云提供的防护方案包括传统负载均衡CLB(仅限监听带宽)和WAF 2.0(默认5秒3000次请求触发JS验证,企业版支持自定义策略)。注意WAF可能误拦截压测流量,建议压测时暂时关闭防护。
2025-12-05 14:05:41
526
原创 【Stable Diffusion初学者指南】模型指南
Stable Diffusion模型或checkpoint模型是预先训练的稳定扩散权重,用于生成特定风格的图像。模型生成什么样的图像取决于训练图像。如果训练数据中不存在猫,则模型将无法生成猫的图像。同样,如果您只用猫图像训练模型,它只会生成猫。我们将介绍哪些模型、一些流行的模型以及如何安装、使用和合并它们。
2024-03-08 17:03:43
2206
1
原创 【Stable Diffusion初学者指南】修复初学者指南
无论你的提示和模型有多好,一次性获得完美图像的情况都很少见。修补是修复小缺陷不可或缺的方法。在这篇文章中,我将介绍一些使用修复来修复缺陷的基本示例。
2024-03-04 17:38:03
1249
原创 【Stable Diffusion初学者指南】如何为Stable Diffusion提出良好的提示
快速构建是任何Stable Diffusion用户都应该掌握的基本技能。通过了解如何构建清晰简洁的提示,您可以解锁 Stable Diffusion 提供的全部风格。为了擅长提示构建,您应该从一个特定的主题开始,并添加关键字以达到特定的效果。您在本文中学到的技能可以应用于其他人工智能艺术生成器,例如 MidJourney。
2024-03-02 14:49:47
1152
1
原创 【Stable Diffusion初学者指南】如何使用Stable Diffusion
想学习Stable Diffusion人工智能吗?本初学者指南适用于Stable Diffusion或其他 AI 图像生成器零经验的新手。您将获得Stable Diffusion的概述和一些基本的有用技巧。
2024-03-01 16:07:24
1819
原创 【阿里云】使用EAS一键部署Stable Diffusion AIGC绘画
今天介绍一下在阿里云快速部署Stable DiffusionAIGC中的Stable Diffusion文生图模型是开源流行的跨模态生成模型,用于生成与给定文本对应的图像。通过EAS,你可以一键部署AIGC Stable Diffusion SDWebUI绘画的AI-Web应用,以便在该应用中进行模型推理验证,实现自动生成图像等功能。
2024-02-28 16:52:01
1701
8
原创 【全网最简单】基于Amazon EC2 linux快速部署 Stable Diffusion WebUI
Stable Diffusion已成为2023年最流行的文生图模型之一,它使用超级简单、完全开源免费,生成的图片以假乱真、震惊四座。Stable Diffusion WebUI是由 Automatic1111 开发的简单但功能强大的 Web 界面,可以帮助我们轻松运行Stable Diffusion模型。Stable Diffusion运行需要高性能的显卡支持,个人电脑一般很难达到其需要的性能要求,比较好的解决方案是在云服务上部署运行Stable Diffusion我发现当前网上大部分Stable Diff
2024-02-27 16:18:49
1258
原创 用ChatGPT编写贪吃蛇小游戏
ChatGPT是由OpenAI开发的一种先进的自然语言处理(NLP)模型,它是GPT-3.5架构的最新版本。该模型通过大规模的预训练学习获得了强大的语言理解和生成能力,可以理解并生成人类语言。
2023-08-03 16:19:33
361
原创 linux 部署3节点Nacos集群 亲测有效
Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service的首字母简称,一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。
2022-09-22 16:10:29
1570
1
原创 node_exporter+prometheus+grafana实现主机监控
node_exporter+prometheus+grafana实现主机监控
2022-08-03 17:04:07
1054
原创 高并发之阿里云弹性伸缩的使用记录
说明阿里云的弹性伸缩功能,是阿里云ecs服务器应对高并发业务的解决方案阿里云弹性伸缩文档:https://help.aliyun.com/document_detail/25857.html此文档记录了当前架构如何结合阿里云弹性伸缩的踩坑之路前提1、启用阿里云弹性伸缩的前提是业务已经有一定的性能测试的经历,了解哪些应用服务比较吃ecs的cpu,并发可能较大2、需要将可能存在并发的应用服务隔离出来,单独放在一台服务器3、应用服务连接数据库RDS、redis、eureka需要用内网IP4、转发到
2022-04-13 11:01:53
1919
原创 ELK-nignx日志分析与展示
关于elk搭建请看:《elk搭建与简单的线上应用》前序在上一次《elk搭建和简单线上应用》中写道,Filebeat可以替代Logstash来实现数据收集与简单的清洗工作。但是关于nignx日志各个字段都要清洗出来,当前Filebeat还做不到,需要借用Logstash能力下面我将线上分析nignx日志的例子,来展示Logstash强大数据清洗的能力具体步骤可以参考:https://www.cnblogs.com/hukey/p/11519612.html#1.%20%E5%89%8D%E8%A8%
2022-03-29 16:28:35
2477
原创 elk搭建与简单的线上应用
开源文档:Logstash:https://www.elastic.co/guide/en/logstash/current/index.htmlFilebeat:https://www.elastic.co/guide/en/beats/filebeat/current/index.htmlElasticsearch:https://www.elastic.co/guide/en/elasticsearch/reference/current/index.htmlKibana:https://ww
2022-03-29 15:05:17
4276
原创 性能测试-关于阿里云PTS使用与思考
1、性能测试必要性官话:性能测试能帮助用户更好地从技术上来规避系统上线后的风险、评估线上系统的真实能力、根据业务模型摸底线上能力以提前应对个人理解:服务器有性能瓶颈,用户的操作对于服务器会有影响,但是用户什么操作、多大量的操作,对服务端的内存有影响还是cpu有影响、多大的影响、服务器能否承受,不知道。用户和服务器的关系,其实是灰度的、不可量化的。而性能测试,可以通过一定的测试策略,在模糊地带找到用户和服务器之间的丝丝关系点,且能量化评估,这是第一点。第二点,性能测试可以来找到整个系统真正的瓶颈(问题点
2022-03-18 11:22:29
4383
原创 短链服务YOURLS部署指南详解
也可以看文档:https://blog.youkuaiyun.com/qq_41475058/article/details/105656375?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522159756012919724835836781%2522%252C%2522scm%2522%253A%252220140713.130102334%E2%80%A6%2522%257D&request_id=15975601291972483583678
2022-03-18 11:12:29
3489
原创 亚马逊云:手动搭建Cloudwatch Agent,在EC2收集内存、磁盘性能及日志
前提:在aws的ec2手动搭建Cloudwatch Agent,以收集ec2内存、磁盘性能操作步骤:1、给ec2增加角色,角色具有CloudWatchAgentServerPolicy权限选择安全>>修改 IAM 角色2、安装amazon-cloudwatch-agent,其中ap-southeast-1更换为对应的区域编码yum install -y https://s3.ap-southeast-1.amazonaws.com/amazoncloudwatch-agent-ap
2022-01-11 11:29:58
2689
原创 钉钉机器人接收 Amazon CloudWatch 告警
1、创建一个sns主题2、创建一个邮件的订阅3、创建钉钉机器人记下Webhook重点:要记下你的加密手段具体请看https://aws.amazon.com/cn/blogs/china/enterprise-wechat-and-dingtalk-receiving-amazon-cloudwatch-alarms/4、创建AWS Lambda 函数具体看:https://aws.amazon.com/cn/blogs/china/enterprise-wechat-and-dingta
2021-07-20 19:05:37
986
原创 亚马逊云:使用SSM集群管理Cloudwatch Agent,在EC2收集内存、磁盘性能及日志
背景介绍:默认情况下,AWS的监控服务Cloudwatch并没有对EC2内的内存总量和使用情况进行监控,因为内存属于用户操作系统内的信息,在AWS的产品设计中,所有系统内的信息都属于用户的私有财产和信息。所以默认情况下,AWS的Cloudwatch不收集相关信息。但在实际使用的项目中,以内存监控为代表的系统、应用层面的监控是系统监控中的非常重要的一环,所以AWS提供了Cloudwatch Agent来帮助用户将EC2实例中的系统层面的信息,如:内存及其他相关信息通过Cloudwatch展现出来,这些信息
2021-07-17 14:50:58
3251
1
原创 jenkins使用Publish over SSH插件连接远程服务器以及目录对应关系
网上很多教程说的是Publish over SSH插件使用秘钥进行连接,但是这个方法比较麻烦,实际只需要直接用找好密码登录,一下是操作步骤1、安装jenkinsf服务和Publish over SSH插件。2、Jenkins SSH Key不需要填写3、添加SSH ServersName:随便写Hostname:服务器IP地址Username:用户名Remote Directory:远程目录重要:点击Use password authentication, or use a differen
2021-07-02 09:59:32
5974
2
原创 python:用回溯法求解迷宫问题
今天刷华为机试题,刷到一道迷宫问题,看了其他人提交的代码发现有许多小bug不是很满意,我这里就用回溯法解决了这个迷宫问题,配上代码讲解题目:定义一个二维数组N*M(其中2<=N<=10;2<=M<=10),如5 × 5数组下所示:int maze[5][5] = {0, 1, 0, 0, 0,0, 1, 0, 1, 0,0, 0, 0, 0, 0,0, 1, .........
2020-03-16 21:12:36
3035
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅