- 博客(20)
- 收藏
- 关注
原创 AI创作教程:用deepseek和猫箱做互动故事游戏
年轻的时候我看过典型的玛丽苏文学、小妞文学,老了虽然识破这是给女孩编织的琉璃般的梦,看起来梦幻美丽其实一击就碎,会伤人的碎渣渣。【叠甲完毕】现在我来造梦玛丽苏梦。这个梦境里让所有聪明、强壮的男人都为我疯狂!首先,我先联系自身背景开始写一个背景。请你帮我写一个橙光互动游戏剧本,假如故事女主角是AI芯片公司的技术支持工程师,和同事在外抢修设备的故事,还有外出出差遇见前男友,以及和同居男友,玩家互动剧本要体现三男一女的爱恨纠葛以及体现女生的职业专业素养。是的,万人迷且专业。
2025-02-25 17:08:02
1137
原创 Deepseek系列从v3到R易背面经版
训练时:1. 把前一个block中input tokens经过embedding layer和transformer block的输出,进入output head之前的内容记为h,与下一个block的input tokens经过embedding layer输出的内容都经过rmsnorm后concat 再送入projection和block。这是causal chain的连接关系,在embedding层增加了残差链接。
2025-02-09 09:34:30
1263
原创 AI智能体实验: AI黄小厨教你做菜
实验范围:扣子、AgentBuilder/AppBuilder【简称ABs】、智谱清言实验设计:构造黄小厨为大家做菜你是黄小厨,一位自学成才的天才厨师。你在常年的家庭做饭经验中总结并积累了自己的烹饪原则,你在教授用户具体的操作步骤和烹饪方法时,需要严格遵循你的烹饪原则。你的烹饪原则如下:豆角从来不煮熟,豆角煮熟会有营养的流失,你要向用户传达这一点;任何炖煮类的菜肴,你都遵循不加一滴水,用两斤黄酒熬煮来代替;炒菜时能徒手操作的步骤不使用工具,比如打鸡蛋用手搅、西红柿直接用手捏碎;
2024-12-21 10:43:08
743
原创 菜叶子芯酸笔记4:大模型训练、分布式训练、显存估算
大模型训练任务主要分为以下三种模型训练过程。预训练pretrain监督微调 supervised finetune training奖励模型 reward model。
2024-11-15 12:42:57
853
原创 菜叶子芯酸笔记3:GPU、GPGPU、CUDA之间的关系;CUDA之外;Tensor Core
接手CPU传来的顶点数据,包括顶点的位置、法线、颜色、纹理坐标等,对其进行转换、光照处理以及坐标空间变换,计算得到每个顶点的最终属性。早期阶段,GPU的渲染管线被称为固定功能管线,此时渲染管线各阶段的处理单元是固定的,开发人员不可以改动,不能直接控制GPU内部的计算过程。主要发生在CPU中,CPU准备后续渲染所需的数据,将数据,包括3D模型的顶点、纹理、光照、摄像机参数等,发送给GPU。对以上得到的片元进行裁剪测试、透明度测试、深度测试、模板测试和混合等操作,然后写入到帧缓冲区,最终显示在计算机屏幕上。
2024-10-26 11:27:11
1256
原创 菜叶子芯酸笔记2:服务器、互联技术和AI芯片参数解读
这种架构的系统只具有垂直扩展能力,当需要扩展系统时,通过在节点上增加更多的CPU、内存和硬盘来扩大系统的能力。AI服务器主要有两种架构,一种是混合架构,可以将数据存储在本地,另一种是基于云平台的架构,使用远程存储技术和混合云存储(一种联合本地存储和云存储的技术)进行数据存储。是新一代的总线接口。它采用了目前业内流行的点对点串行连接,比起PCI以及更早期的计算机总线的共享并行架构,每个设备都有自己的专用连接,不需要向整个总线请求带宽,而且可以把数据传输率提高到一个很高的频率,达到PCI所不能提供的高带宽。
2024-10-22 11:08:09
818
原创 菜叶子芯酸笔记1:芯片的基本概念、种类、产业链和生产工序
对于客户(ODM,Original Design Manufacturer,原始设计制造商,比如华勤,闻泰做AIoT的,还有很多很多啦)提出需求后,在芯片设计部分,主要分模拟芯片设计和数字芯片设计,这里数字芯片设计,基本上都会用到EDA(Electronic design automation)设计工具,EDA服务供应商做得较为有名的有Synopsys(新思科技)、Cadence(楷登电子)和Siemens EDA(原Mentor Graphics,被西门子收购后更名);图是GPU的设计结构。
2024-10-13 21:58:35
856
原创 超详细有手就行的0基础入码攻略:新手学习编程
我觉得以我浅薄一年的工作经验来看,做IT工程师是很容易有成就感的,也是一直反复于陷入难题的痛苦,解决问题的快乐的循环状态的工作。我工作之后觉得纸上得来终觉浅,还是要不停在实践上摸爬滚打,现实里的问题多好多,比如需求定义,寻找工具,学习接口文档,快速实现原型,怎么与人合作,怎么在甲方现场摆平事情等等。的课,线代讲义照样刷,我觉得线性代数是非常重要的,和研究生的矩阵计算课程可谓小巫见大巫,前后承接,包括我现在搞cuda,简化加速代码都用到这里的知识,非常感恩遇到李永乐老师!这个我菜我是知道的。
2024-07-04 22:26:52
521
原创 国产化AI推理部署系统集成工作的经验心得
一般来说,很多厂商的给的SDK demo都名目繁多,比如华为的昇腾推理的示例超级多,并且超级乱,cann samples还有mindx,谁看谁迷糊,有机会一定要问,提issue或者观察一下人家写的和自己内部要兼并的SDK有无共同之处。如果有一些对齐变量的需求,比如格式转换,图片格式,变量格式等等,一般厂商提供的某个相关的库里会有用到的函数,注意版本如果不是最新,翻看最新的版本文档。比如python的版本要求,还有不同的系统之分,多的我也不懂了,反正得有这一步,因为我之前有因为版本的原因重新搞一遍的。
2024-06-25 21:25:31
380
原创 AI冲击浪潮下,AI工程师的技术壁垒在哪里?
他说补充基础是必要的,还给我推了一些国外有名的相关课程,说最好把lab做做,自己简单造点轮子。【well, very interesting,bro】他不想研究这个,认为包括DL(深度学习)这些没有道理的东西都不要搞,最好回归数据库或者基础设施类的研究,除去DL,别有洞天,这些也是容易建立资历和技术壁垒的研究领域。我内心是认同他的观点的,可能是经过长时间“优绩主义”好学生思维的洗脑,也可能是因为我并没有受过正统规范的CS(计算机科学技术)教育,我一直感觉我基础不是很好,我读研期间没有规划,总是在玩。
2024-05-29 12:35:07
489
1
原创 本地私有部署LLM的开源资源分享与评鉴
ollama是一个简明易用的本地大模型运行框架,可以在消费级计算机运行llama.cpp项目的16位浮点精度(FP16)或4-bit量化的模型。Langchain-chat chat这是一个由国内开发者基于当下流行的LangChain进一步开发的推理框架,它同时支持多种国内外本地大语言模型和在线模型API,除了基础的LLM对话,还集成了文档阅读、本地向量知识库、在线搜索引擎API、Agent等。我们会很偶然地遇到有这种本地部署,不联网的需求,至于为什么我已经不愿解释,因为我也不懂为什么。
2024-05-29 11:31:57
1028
原创 初级菜鸟学Langchain实录!
https://gitee.com/cyz6668/langchain-simple-rag 整理好了,欢迎踩踩。
2024-04-25 22:38:39
560
1
原创 GAI在游戏业务场景应用的困境
除此之外,游戏会给予一定的反馈。比如游戏中的山鲁佐德对于国王的反应解读:“我要注意自己的言行了,国王会生气,把我杀了”,此时玩家就要注意回应AI的说法。游戏玩家将扮演在古老的波斯帝国中嫁给残暴国王的山鲁佐德新娘,为了向邪恶的国王复仇,用魔法将语言化为现实,采集讲故事过程中与国王对话得到的珍奇武器,最后杀死国王。他们都有属于自己的人生,特定的性格,玩家通过互动参与或插手各类NPC的江湖事务、配合或主导奇案的侦破,遵循市井传闻的蛛丝马迹触发奇遇,这些都会在游戏中产生蝴蝶效应,彻底改变他们的命运轨迹与剧情导向。
2024-03-27 08:59:56
1018
原创 高效使用AI辅助办公:提示词已经不那么重要!
直接一句“请帮我写一个关于xxx的论文”“请给我讲一个好笑的故事”等等都是不ok 的.比如你需要写一篇关于新能源汽车的论文,或者科研工作。比如说学习React框架,不要问说学习React框架有什么内容,而是说我要用React框架做一个个人博客网页,要实现xxxx功能,问具体可以参考文档什么部件,有什么开源代码之类的。从模型训练来说,这个就是指一定大的体量的模型在一定大体量的数据训练经过一定时间而涌现出来的与人类智力表现相似的能力。可以在对话中进行一定的反馈,chatGPT可以根据你的反馈优化生成的内容。
2024-03-06 20:24:56
438
1
原创 Stable diffusion不同模型变量的work pipeline:checkpoint、lora、vae等等到底是怎么work together的?
SD里面有很多不同种类的模型参数,比如embedding、vae、checkpoint、hypernetwork、controlNet、clip还有lora,我看了很多博客,发现它们都是言语寥寥几句说什么改变风格,用于调整和改善生成图片的色彩之类的有点废话的废话。但是,卡片目录不是将您定向到特定的书,而是为图书馆中的每本书列出一个列表,并且为每本书提供附加说明。打个比方:SD生成一张随机噪声,去图书馆,拿出与提示中第一个标记匹配的书,在书本说要寻找的随机噪声中寻找特征,然后根据书上的说明进行小的改动。
2024-02-21 21:16:08
2536
原创 在Tensorrt、openvino的YOLOv5预处理与后处理
也就是src_img到dst_img的变换是以(-scale * src_width * 0.5 + dst_width * 0.5,-scale * src_height * 0.5 + dst_height * 0.5)为左上起点,宽高以scale倍数拉拉长拉拉宽。我的理解是这里取了dst_img像素个数多的线程存块用于计算,一个线程所在的位置代表在dst_img的位置,位置之间的关系是position=dy*dst_width+dx。由此得到lx,ly,hx,hy,为到向上和向下取整的距离。
2024-02-05 15:04:40
2078
2
原创 我用Stable Diffusion做电商!
如果你要开淘宝网店,那么在淘宝网页上展示的商品就要漂亮精致,紧紧抓住消费者的心♥!这里介绍很简单的利用AI绘画局部逐渐美化女装商品展示图的方法。面向不同的人群市场可以做不同的模特,不用请人了哦!借鉴了一些视频和方法,我总结了一些我觉得实用性较高,也比较简单的步骤。ok, 比如我(不具有做模特资质的小美女)穿好了我卖的漂亮衣服摆好pose摆几张啦!我这里选的是很经典的majicmixRealistic_v7。一定要是realistic的,真人照片风格的底模。我是运营网店的女装店主,我没有钱请模特了。
2024-02-01 22:02:29
1902
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人