- 博客(23)
- 收藏
- 关注
原创 LLM大模型 - 实战篇 - AI Agents的开发应用
作家 Agent- 负责根据用户需求创作情感丰富的文章内容编辑 Agent- 负责校对和格式化文章,并保存到本地寄信人 Agent- 负责读取本地文件并通过邮件发送内容以下是完整的代码实现,包含了将文本保存到本地文件和发送邮件的功能:python# 导入必备的工具包import os@tool("将文本写入文档中")"""将编辑后的书信文本内容自动保存到txt文档中"""try:# 确保目录存在# 将文本写入txt文档中。
2025-09-20 17:34:19
855
原创 LLM大模型 - 实战篇 - Assistant API 原理与实战应用
OpenAI在2023年11月6日的开发者大会上推出了,这是一个革命性的开发者工具,允许开发者在自己的应用程序中构建功能强大的人工智能助手。这些助手能够根据预设指令运作,并综合利用多种资源来响应用户查询。OpenAI的Assistant API为开发者提供了构建专业级AI助手的强大工具集。灵活性强:支持多种工具集成,适应不同应用场景易于集成:清晰的API设计和对象模型降低了开发难度功能强大:结合知识库检索和代码执行能力,处理复杂任务可扩展性好:支持从小型应用到企业级系统的各种规模部署。
2025-09-19 18:02:47
741
原创 LLM大模型 - 实战篇 - Function Call 原理与应用
Function Call(函数调用)是 OpenAI 于 2023 年 6 月 13 日推出的一项重要功能。它让大语言模型具备了调用外部函数或 API的能力,从而突破训练数据局限,获取实时信息、执行具体任务。pythontools = ['description': '获取给定位置的当前天气','description': '城市或区,例如北京、海淀',},},},pythontools = ["description": "根据出发地、目的地和日期,查询对应日期的航班号",
2025-09-19 17:51:13
936
原创 LLM大模型 - 实战篇 - 实现文本处理:分类、信息抽取与匹配
文本分类旨在将金融文本划分到预定义的类别中。以下是完整的实现代码:python"""利用LLM进行金融文本分类任务"""# 定义类别及其示例'新闻报道': '今日,股市经历了一轮震荡,受到宏观经济数据和全球贸易紧张局势的影响。投资者密切关注美联储可能的政策调整,以适应市场的不确定性。','财务报告': '本公司年度财务报告显示,去年公司实现了稳步增长的盈利,同时资产负债表呈现强劲的状况。经济环境的稳定和管理层的有效战略执行为公司的健康发展奠定了基础。',
2025-09-18 16:05:16
1225
原创 LLM大模型-基础篇-Prompt-Tuning方法入门
Prompt-Tuning:通过模板将下游任务转化为预训练任务形式,减少额外参数,适合小样本/零样本场景。PET 核心组件:Pattern(模板)、Verbalizer(标签映射)。P-Tuning V1 核心思想:固定大模型参数,使用 LSTM + MLP 编码 Prompt,提升连续性与关联性。
2025-09-17 17:50:19
1140
原创 LLM大模型-基础篇-ChatGPT模型原理
版本核心变化训练方式数据集代表能力GPT-1Transformer Decoder(去掉第二子层)无监督 + 有监督微调预训练 + 微调GPT-2Pre-LayerNorm,序列长度 1024无监督(zero-shot)WebTextZero-shot 推理GPT-3大规模参数与数据无监督(few-shot/zero-shot)多源大规模数据规模驱动能力GPT-4多模态(文本+图像),128k tokens无监督 + 工具调用多模态数据多模态推理GPT-5。
2025-09-17 17:32:57
855
原创 LLM大模型-基础篇-语言模型入门
大语言模型(Large Language Model,简称 LLM)是一种人工智能模型,能够理解和生成人类语言。文本分类(判断文章类别)问答(回答问题)翻译(中英互译等)对话(像 ChatGPT 一样聊天)备注“大”是指模型的参数量很大(通常超过 100 亿个参数),这些参数是在海量文本数据上训练出来的。参数越多,模型的理解和生成能力通常越强。GLM(清华大学)BLOOM(开源社区)优点能像人类一样聊天、回答问题,甚至能用插件自动搜索信息。缺点需要大量计算资源和时间训练。
2025-09-16 19:55:00
1037
原创 LLM大模型-基础篇-深度学习基础
Hugging Face 开发的开源 Python 库。提供各种预训练的 Transformer 模型(BERT、GPT、T5 等)。支持 PyTorch 和 TensorFlow。提供简单的pipelineAPI 和灵活的底层接口。备注“预训练模型”是指已经在大规模数据上训练好的模型,可以直接用,也可以在你的数据上微调。pipeline是最简单的调用方式,适合快速体验。
2025-09-16 17:17:28
1028
原创 LLM大模型-基础篇-深度学习基础
MNIST 数据集包含 70,000 张 28×28 像素的手写数字图片(0-9),目标是训练一个模型识别数字。张量是 PyTorch 的核心数据结构,类似 NumPy 的多维数组,但可以在 GPU 上运行。PyTorch 会自动记录运算过程,并计算梯度。如果不确定 CUDA 版本,可以运行。
2025-09-16 15:51:49
170
原创 音视频开发●视频编解码原理
H264是一种高效视频编码标准,通过去除视频中的时空冗余实现高压缩率。其核心原理是利用I帧存储完整图像,P/B帧仅存储与参考帧的差异数据。视频被划分为GOP(图像序列组),每组包含一个I帧和若干P/B帧。H264广泛应用于电影、短视频等场景,支持多种封装格式(如MP4、FLV)。该编码技术显著提升了视频传输效率,成为当前主流的视频压缩方案。
2025-09-12 16:42:14
281
原创 音视频开发 ● android录音到播放的整个过程
在录音过程中,应用所需要做的就是通过后面三个类方法中的一个去及时地获取AudioRecord对象的录音数据. AudioRecord类提供的三个获取声音数据的方法分别是read(byte[], int, int), read(short[], int, int), read(ByteBuffer, int). 无论选择使用那一个方法都必须事先设定方便用户的声音数据的存储格式。声音数据从音频硬件中被读出,数据大小不超过整个录音数据的大小(可以分多次读出),即每次读取初始化buffer容量的数据。
2023-06-15 20:07:19
208
原创 音视频开发 ● Android使用SurfaceView绘制Bitmap
1.明明可以使用imageview显示图片、自定义View的ondraw()绘制一张图片,那是因为Android系统是每隔16ms发出VSYNC信号来进行屏幕的重绘,这个重绘是在主线程中的。一旦主线程中的绘制任务时长超过16ms,就会出现卡帧现象。因为SurfaceView的屏幕绘制不是在主线程中,所以不会导致主线程(UI线程)的卡帧现象。所以复杂耗时的绘制任务应该放到使用SurfaceView去绘制,效率高且不影响主线程绘制。2.SurfaceView 绘图效率较高,用于界面更新频繁的程序,如相机预览。
2023-06-15 11:36:21
1186
原创 关闭offline-mode后出现Disable offline mode and Sync
在引入远程依赖包的时候,会出现一个sync错误,提示找不到这个类库。网上查了下(http://stackoverflow.com/questions/20746071/failed-to-build-android-hello-world-application-in-offline-mode),说是设置了offline work,需要将gradle设置里的offline work去掉,然而我的AS中并没有勾选这个选项。试一下把这个选项打开是什么效果,打开后重新sync出现下面的错误,和之前的错误有点差
2022-05-09 16:48:57
1719
原创 音视频开发 ● Android 音视频开发总结
关于视频中的黑屏、花屏、绿屏问题我们在做音视频开发的时候难免会遇到一些很棘手的问题,但是我们只要找准问题出现的阶段,定位问题的根源就会轻松很多。前几天我看了一篇总结这些问题的文章,写的很好,根据自己遇到的问题,我又总结了一下。首先我们要知道(端对端)视频处理的整个过程,我们才能更体面的分析。上图就是(端对端处理的整个过程)。我们对这类问题的分析,应该是一个端到端逐步排 查的流程。每一个环节都可能引发黑屏、花屏、绿 屏问题的产生,这也是我们准确分析问题所面临的挑战。角色分析:视频采集: 如果
2022-05-07 17:51:03
806
原创 关于Android中对java死锁的解析
关于Android中对java死锁的解析1:出现死锁的原因:互斥条件。即某个资源在一段时间内只能由一个进程占有,不能同时被两个或两个以上的进程占有。这种独占资源如CD-ROM驱动器,打印机等等,必须在占有该资源的进程主动释放它之后,其它进程才能占有该资源。这是由资源本身的属性所决定的。如独木桥就是一种独占资源,两方的人不能同时过桥。不可抢占条件。进程所获得的资源在未使用完毕之前,资源申请者不能强行地从资源占有者手中夺取资源,而只能由该资源的占有者进程自行释放。如过独木桥的人不能强迫对方后退,也不能非
2022-01-04 16:09:56
369
原创 音视频开发 ● FFmpeg精准剪切
将视频讲解切割,每张幻灯的片断一个文件,按幻灯页码命名文件01.mp4,02.mp4,03.mp4……,以此类推;分辨率不超过320*180像素,单声道96kbps音质,控制每个文件尺寸不超过10M,另请发来对应的ppt文档,用来制作成视频与ppt同步翻页的课程。于是,承接前面一篇,三分屏课件制作教程,我考虑也能自动按照时间轴拆分所有视频文件。于是得到了下面这段分割代码。ffmpeg -ss [start] -t [duration] -accurate_seek -i [in].mp4 -codec
2021-08-03 14:51:51
2438
原创 flutter开发插件是导入AAR包出现错误
flutter开发插件是导入AAR包出现错误:flutter Direct local .aar file dependencies are not supported when building an AAR. The resulting AAR would be broken because the classes and Android resources from any local .aarandroid开发插件时无法正常引用aar包原因:插件无法识别aar包解决办法:1: 修改引用 i
2021-04-30 17:42:57
2374
2
原创 图片滤镜算法
图片滤镜算法常见的图片滤镜算法老旧照片的颜色效果大概的实现思路:r = r * 0.393 + g * 0.769 + b * 0.189;g = r * 0.349 + g * 0.686 + b * 0.168;b = r * 0.272 + g * 0.534 + b * 0.131;黑白图核心是把图片的rgb的值一致,通常我们会取三个色值的平均值,三个色值的最大值,最小值,加权平均值等方式来处理:(color.r + color.g + color.b)/3.0反转色的效果是
2020-05-15 11:46:26
875
1
原创 音视频开发 ● Android 3.1.2 Cmake编译live555
这是项目的地址,使用的是Android Studio 3.1.2,ndk是17c,链接:https://pan.baidu.com/s/1_eeD8sC5eFLr-qH5xiRY4g提取码:g2hf
2019-04-03 09:55:29
569
原创 音视频开发 ● win10编译ffmpeg so库
第一步先安装linux虚拟机,这里我使用的是mingw,windows上还有很多这种工具,我就不一一介绍了mingw的安装包我也上传到百度云了,连接在下面链接:https://pan.baidu.com/s/1ZlnkKoz4mqjgDa3adcNN6Q提取码:ieh4https://www.jianshu.com/p/e9ff7b654c4a这是安装的教程,切记一定要按照教程一步步来,有...
2019-03-27 15:35:08
1127
原创 音视频开发 ● Android端视频使用ffmpeg实时解码
首先我们来看java端代码 while (mOpened) { try { int read = mInputStream.read(buffer); if (read != 0 && read > 0) { ...
2018-12-18 16:45:08
992
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅