- 博客(891)
- 资源 (8)
- 收藏
- 关注
原创 AI强化学习策略买卖股票的效果如何?
策略网络观测的就是一只股票的各项参数,比如开盘价、收盘价、成交数量等。部分数值会是一个很大的数值,比如成交金额或者成交量,有可能百万、千万乃至更大,为了训练时网络收敛,观测的状态数据输入时,必须要进行归一化,变换到 `[-1, 1]` 的区间内。使用强化学习预测股价,需要在决策的时候采取合适的行动 (Action) 使最后的奖励最大化。主体参考了 https://github.com/wangshub/RL-Stock,修改了一些。(例如:买进、持有、卖出),并对好的动作结果不断进行。
2024-09-19 11:53:22
548
1
原创 torch cat numpy from_numpy
目前能接受的ndarrays类型有numpy.float64, numpy.float32, numpy.float16, numpy.complex64, numpy.complex128, numpy.int64, numpy.int32, numpy.int16, numpy.int8, numpy.uint8, and numpy.bool.注意,返回的tensor和原来的ndarray共享内存,更改tensor也会更改ndarray。并且返回的tensor不能调整大小。
2024-09-03 11:35:06
437
原创 mac m1 配置 frp
frp 是一个专注于内网穿透的高性能的反向代理应用,支持 TCP、UDP、HTTP、HTTPS 等多种协议。可以将内网服务以安全、便捷的方式通过具有公网 IP 节点的中转暴露到公网。连接到客户端http服务时访问公网服务器的端口号。custom_domains = www.yourdomain.com // 指向服务端的域名。服务端与客户端连接的端口号,即 bind_port。客户端连接到该服务器的端口号。local_port = 5000 本地监听的端口。
2024-08-28 14:34:32
1198
原创 股票技术指标 RSI KDJ MACD ATR
具体指标解释,大模型都有,只说作用RSI(Relative Strength Index,相对强弱指数)KDJmacd包括三个主要组成部分:MACD线(也称为DIF,Difference between the two EMAs)信号线(Signal Line,也称为DEA,Difference Exponential Moving Average)MACD柱状图(Histogram)。
2024-08-14 17:02:34
9874
原创 whisper get_writer srt_writer 参数说明
【代码】whisper get_writer srt_writer 参数说明。
2024-06-25 14:41:17
427
原创 pip install 安装 torch cuda 11.8 cu118
百度了一下,有推荐这么改的,速度还是慢,因为还是转到官网 pytorch.org。最终采用 其中的版本 2.3.1,可以看看 pip 源。默认安装,速度比较慢。
2024-06-18 19:16:09
8251
原创 LangChain llamaindex
参考:全流程 | Windows 系统本地部署开源模型阿里通义千问 QWEN 1.5,结合 LangChain-Chatchat 框架和向量数据库 FAISS、Milvus - 知乎
2024-05-24 17:41:19
270
原创 大语言模型量化方法对比:GPTQ、GGUF、AWQ 包括显存和速度
AWQ(激活感知权重量化),它是一种类似于GPTQ的量化方法。所以他们的论文提到了与GPTQ相比的可以由显著加速,同时保持了相似的,有时甚至更好的性能。GGUF(以前称为GGML)是一种量化方法,允许用户使用CPU来运行LLM,但也可以将其某些层加载到GPU以提高速度。虽然使用CPU进行推理通常比使用GPU慢,但对于那些在CPU或苹果设备上运行模型的人来说,这是一种非常好的格式。GPTQ是一种4位量化的训练后量化(PTQ)方法,主要关注GPU推理和性能。
2024-05-15 16:15:46
6808
1
原创 from_pretrained 做了啥
transformers的三个核心抽象类是Config, Tokenizer和Model,这些类根据模型种类的不同,派生出一系列的子类。构造这些派生类的对象也很简单,transformers为这三个类都提供了自动类型,即AutoConfig, AutoTokenizer和AutoModel。三个AutoClass都提供了from_pretrained方法,这个方法则一气完成了模型类别推理、模型文件列表映射、模型文件下载及缓存、类对象构建等一系列操作。
2024-03-22 15:56:16
2631
原创 float32 float16 bfloat16 推理训练GPU速度和内存调研
概念:3种数量类型表示的数据范围不一样,以float32为例其中有1个符号位,8位表示指数,23位表示尾数标准训练推理是用的float32,但是占用GPU显存太大,所以优化的方向就是一般就是,时间换空间或者是减少float32位精度。
2024-03-11 16:49:04
1449
原创 llm llama GPU 内存/显存计算
Calculating GPU memory for serving LLMs | Substratus.AI
2024-03-04 11:10:01
625
原创 国产大模型 翻译方面应用
智谱华章GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型参考:https://github.com/wgwang/awesome-LLMs-In-China?tab=readme-ov-file
2024-02-29 13:53:28
461
原创 MBartForConditionalGeneration mbart-large-50-many-to-many-mmt 使用cuda gpu
【代码】MBartForConditionalGeneration mbart-large-50-many-to-many-mmt 使用cuda gpu。
2024-02-28 17:55:22
697
1
原创 ubuntu 安装python3.10
方法一:How to Install Python 3.10 on Ubuntu 22.04 or 20.04 - LinuxCapable方法二:Ubuntu python3.10 安装教程,并更新python,pip默认指向为python3.10, pip3(超详细教程)_apt-get install python-优快云博客
2024-01-29 14:17:51
1044
原创 FileNotFoundError supervisor/xmlrpc
【代码】FileNotFoundError supervisor/xmlrpc。
2024-01-23 14:24:38
439
原创 huggingface 连不上 from_pretrained from_single_file
huggingface的缓存目录 ~/.cach。
2024-01-12 17:12:00
874
原创 PYTORCH 依赖 cuda 11.8 , cuda 12.1 cpu 里 torch torchvision torchaudio对应关系
1、强大的GPU加速的张量计算(NumPy)。2、自动求导系统的深度神经网络。
2024-01-11 17:25:37
2024
原创 node `GLIBC_2.28‘ not found (required by node)
是linux底层的API库。通常情况下,有些环境需要glibc更高的版本才支持,比如GLIBC_2.28。glibc库对linux系统非常重要,轻易不要更换。如果需要更换,需提前备份好原本的相关库以防万一。
2024-01-11 14:53:06
1632
symbian 论坛大大hoolee的QA CHM版
2010-01-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人