- 博客(260)
- 资源 (55)
- 收藏
- 关注
原创 关于预训练&后训练、LLM和视频大模型相关学习记录
视频数据相比文本数据太大,导致在现有算力条件下,一方面视频大模型的参数量难以达到LLM的量级,同时训练使用的数据量也不能有则尽用。后训练:在预训练模型基础上,进行指令微调、偏好微调(RLHF)和强化微调等,使模型具备更符合人类期望的行为。预训练:模型通过预测海量互联网文本数据中的下一个 token,学习语言的通用规律,得到基础模型。对于视频模型的预训练而言,仍在发展的初级阶段,目前视频大模型的参数量仍停留在百亿(几十B)的水平。预训练对数据质量的要求不高,而后训练对数据质量的要求较高。
2025-02-08 10:13:48
185
原创 向VMware中的Linux虚拟机共享Windows宿主机的文件/文件夹
鼠标移到虚拟机标签上,右键单击“设置”在虚拟机设置弹出框中,打开“选项”选项卡。在列表中单击“共享文件夹”在右侧单击“添加”完成Window宿主机目录的共享操作单击“确定”,完成共享操作。登录Linux,在/mnt 目录下查看共享的文件夹...
2021-12-07 18:23:51
3702
1
原创 物联网中使用的常见通信技术
HPLC技术宽带电力线载波通信(HPLC)是利用现有电力线,通过载波方式将模拟或数字信号进行高速传输的技术,是电力系统特有的通信方式。智慧用能物联网解决方案选用HPLC技术。HPLC通信频段为700KHz~12MHz之间(频段可配置),应用层通信速率最大可达2Mbps,支持多级组网与自动选路等 特性,完全满足综合能源服务主要场景中对带宽、通信距离和可靠性需求。智慧用能物联网解决方案采用HPLC技术为主、多种物联网接入技术互补的多业务融合承载建网理念。HPLC网络中有三种节点,由CCO中央协调节点(HPL
2021-11-10 13:04:07
12337
3
原创 通过 Kubeadm联网部署K8S
环境信息角色IP系统master10.4.7.152Ubuntu18.04node10.4.7.162Ubuntu18.041. 操作系统配置(两个节点均需执行)操作节点:master,node禁用swapswapoff -a #临时 sed -ri 's/.*swap.*/#&/' /etc/fstab #将/etc/fstab文件的swap行用#注释(永久禁用)关闭防火墙sudo ufw disable #关闭防火墙su
2021-09-01 19:01:41
232
原创 工业41大类
工业(41)采矿业(7)煤炭开采和洗选业石油和天然气开采业黑色金属矿采选业有色金属矿采选业非金属矿采选业开采专业及辅助性活动其他采矿业制造业(31)农副食品加工业食品制造业酒、饮料和精制茶制造烟草制品业纺织业纺织服装、服饰业皮革、毛皮、羽毛及其制品和制鞋业木材加工和木、竹、藤、棕、草制品业家具制造业造纸和纸制品业印刷和记录媒介复制业文教、工美、体育和娱乐用品制造业石油、煤炭及其他燃
2021-09-01 10:57:12
8607
原创 docker删除所有容器和镜像
docker删除所有镜像:docker rmi -f $(docker images -qa)docker删除所有容器:停止容器docker stop $(sudo docker ps -a -q)删除容器docker rm $(sudo docker ps -a -q)
2021-08-20 09:45:18
175
原创 边缘计算平台类产品概览
产品名称IEC:智能边缘云IEF:智能边缘平台IoTEdge:IoT边缘BEC:百度边缘计算BIE:百度智能边缘ENS:边缘节点服务物联网边缘计算ECM:边缘计算机器IECP:物联网边缘计算平台EISP:边缘智能服务平台厂商华为华为华为百度百度阿里阿里腾讯腾讯移动可用状态公测商用商用商用商用商用商用商用需申请商用定位构建广域覆盖的分布式边缘云基于云原生技术构建的边云协同操作系统基于物联网平台的设备接入服务,提供边...
2021-08-18 09:42:10
1236
原创 5G相关白皮书
5G超高清新场景白皮书5G智能物流白皮书煤矿F5G应用技术白皮书5G行业专网网核心网白皮书面向5G的边缘数据中心基础设施白皮书5G VoNR(Voice Over NR)+白皮书5G ToB 业务体验标准白皮书5G和5G演进工业控制应用场景白皮书Wi-Fi 6与5G技术及应用场景白皮书...
2021-08-06 17:48:16
111
原创 Window10主硬盘更换及系统重装
笔记本:HP 的Elitebook 848 G4原硬盘:128GB SSD(系统盘) + 1TB HDD更换后:488G SSD(系统盘) + 1TB HDD几个问题:1、更换后如何激活新系统原系统是基于账号关联的,因此在安装系统时属于原window账号即可自动激活新系统,而不需要输入License2、如何操作参考https://www.microsoft.com/zh-cn/software-download/windows10简而言之:2.1 在另一台电脑下载一个安装工具2.2 使用
2021-06-27 23:02:25
4375
原创 window10 重装后“未安装任何音频输出设备”
window10 重装后“未安装任何音频输出设备”右键单击“我的电脑”,选择“管理”展开“设备管理器”单击“英特尔(R)智英技术OED先”禁用设备“,然后再”启用设备“参考如下链接方法二http://www.win10w.net/wenzhang/15099.html...
2021-06-27 22:43:49
6072
原创 百度BML 图像分类-多标签在线API调试结果记录
调试工具:Postman{ "log_id": 4206097585808259010, "results": [ { "name": "Drama", "score": 0.5753621459007263 }, { "name": "Comedy", "score": 0.4507753252983093 } ]}
2021-01-20 13:23:05
246
原创 Window VMWare中Centos虚拟机ifconfig命令不显示ens33
现象:执行ifconfig命令,回显信息中没有ens33解决方法:执行下面的命令,ifconfig出现ens33,但没有ip地址ifconfig ens33 up执行下面的命令systemctl stop NetworkManagerifup ens33(此时应该就出现ip了)重启网络systemctl restart network.service4.执行ifconfig检测是否ens33是否已获取到ip地址最后一步:永久关闭NetworkManager,保证下次开机
2021-01-18 22:21:25
1063
原创 百度EasyDL-表格数据预测试用示例
场景说明使用数据集iris,包含4个特征,预测值有3种取值,属于多分类问题体验地址:https://ai.baidu.com/easydl/app/201/20100/models使用步骤创建数据训练模型查看训练结果4.发布模型5.在控制台创建应用:在“公有云服务》应用列表”中创建应用6.配置授权:发布后的服务会出现在“公有云服务》权限管理”中,为之前创建的应用授权4. 获取Access_token:参考https://ai.baidu.com/ai-doc/REFERE
2021-01-13 21:06:09
817
原创 并行计算与机器学习
重要概念通信:sharing memory & message passing架构:client-server & peer-to-peerSynchronization: bulk synchronous & asynchronousParallelism: data parallelism ( more popular) VS model parallelism并行编程模型MapReduce: message passing, client-server,an
2020-08-16 17:02:15
428
原创 各机器学习平台视频建模功能汇总
产品类型 视频数据管理 模型场景 建模方式 交互方式 AI建模平台 EasyDL 专业版 不支持 不支持 不支持 不支持 EasyDL经典版 支持,但不支持标注 视频分类...
2020-08-07 19:23:11
487
原创 SageMaker 超参数优化作业
体验了华为ModelArts、百度BML&EasyDL、阿里云PAI以及亚马逊SageMaker的超参数优化功能,可以说,SageMaker在产品成熟度、AI建模流程的定义以及特性功能上都大幅的领先。由于国内区部分只能企业用户注册,所以使用的是国外区,记录了截图,以便后面网络不畅时可以了解:...
2020-08-03 20:08:33
631
原创 深度学习模型提升模型效果的常见方法
在训练集上表现不好,需要降低bias:调整超参数,如设置更深更宽的网络训练更长的时间选择其它特征学习函数(CNN、RNN、LSTM、GRU等)在验证集上表现不好,需要降低方差:引入正则化(如L2)引入dropout提供更多的训练数据基于数据增强,如图片翻转、裁剪、旋转等采集更多的数据调整数据的平衡性在测试集上表现不好,需要降低方差:需要使用更多的验证集超参数调优:α:Learning Rateβ:momentum中的参数β1,β2,ε:adm中的参数激活
2020-06-28 19:29:14
2095
原创 机器学习的行业与场景总结
行业与场景金融服务风险管理信用评分预测分析客户流失欺诈检测违约风险贷前客户评分贷后违约预测网点备付金智能预测保险索赔管理客户流失欺诈识别反洗钱异常检测行销信用评分客户流失欺诈识别潜在客户评分个性化广告优化零售客户流失广告优化个性化教育精准营销政务舆情监测汽车客群分析客流分析精准营销二手车交易欺诈检测
2020-06-11 21:15:40
392
原创 预训练的ONNX模型
获取地址:https://github.com/onnx/modelsNLP类:text/machine_comprehension视觉类:vision
2020-05-13 00:16:20
1200
1
原创 在Window10下基于Anaconda安装Tensorflow以及Keras并基于Spyder进行验证
这里写自定义目录标题环境信息安装目的安装过程安装验证环境信息Window 10Anaconda3(64-bit)安装目的安装Keras,并使用Tensorflow作为其后端。也就是说执行完安装后,Keras和Tensorflow都是可以使用的安装过程以管理员身份运行Anaconda Prompt。在默认的base环境中执行安装命令: conda install the...
2020-04-12 13:05:22
659
原创 百度EasyDL试用示例
场景说明基于EasyDL完成猫狗图像分类模型,在完成部署后,通过H5完成手机端验证,通过Postman对API进行了测试。通过上述流程完成对EasyDL功能的体验。体验总结EasyDL是以模型为中心的设计,但模型仅是个中间产物,不是很合理功能入口的逻辑不够清晰,模型的训练与部署在独立的EasyDL中实现,而服务的管理则要在百度智能云中的EasyDL中实现,这个逻辑有点感人。服务的运维监...
2020-03-26 23:48:14
130049
原创 深度学习各场景评估指标总结
下表总结了机器学习在常见场景下使用的评估指标:(PS:原文档包含截图,已上传到个人资源)类别 场景 场景描述 应用场景 图像 图像分类 识别一张图中是否是某类物体/状态/场景,适用于图片内容单一、需要给整张图片分类的场景 1、图片内容检索:定制训练需要识别的各种物体,并结合业务信息展现...
2020-03-17 18:16:34
2009
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(九、卷积神经网络)
全连接网络的问题局部相关性网络层的每个输出节点都与所有的输入节点相连接,用于提取所有输入节点的特征信息,这种稠密(Dense)的连接方式是全连接层参数量大、计算代价高的根本原因。全连接层也称为稠密连接层(Dense Layer),当全连接层的激活函数????为空时,全连接层也称为线性层(Linear Layer):其中????????????????????(????)表示I 层的节点集合。基于距离的重要性分布假设称为局部相关性...
2020-02-12 18:48:05
1243
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(八、过拟合)
机器学习的主要目的是从训练集上学习到数据的真实模型,从而能够在未见过的测试集上面也能够表现良好,我们把这种能力叫做泛化能力。提到了模型的表达能力,也称之为模型的容量(Capacity)。当模型的表达能力偏弱时,比如单层线性层,它只能学习到线性模型,无法良好地逼近非线性模型;但模型的表达能力过强时,他就有可能把训练集的噪声模态也学到,导致在测试机上面表现不佳的现象(泛化能力偏弱)。因此针对不同的...
2020-02-11 19:21:25
389
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(七、Kears高层接口)
Keras 是一个主要由Python 语言开发的开源神经网络计算库。Keras 库分为前端和后端,其中后端可以基于现有的深度学习框架实现,如Theano,CNTK,TensorFlow,前端接口即Keras抽象过的统一接口API。那么 Keras 与tf.keras 有什么区别与联系呢?其实Keras 可以理解为一套搭建与训练神经网络的高层API 协议,Keras 本身已经实现了此协议,可以方便...
2020-02-11 18:29:25
688
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(六、反向传播算法)
反向传播算法和梯度下降算法是神经网络的核心算法。导数与梯度导数本身是标量,没有方向,但是导数表征了函数值在某个方向Δ????的变化率。在这些任意Δ????方向中,沿着坐标轴的几个方向比较特殊,此时的导数也叫做偏导数(Partial Derivative)。对于一元函数,导数记为????????/????????;对于多元函数的偏导数,记为????????/????????1,????????/????????2, …等。偏导数是导数的特例,也没有方向。梯度下降算法:????′ =...
2020-02-11 12:34:54
324
1
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(五、神经网络)
DL is essentially a new style of programming–“differentiable programming”–and the field istrying to work out the reusable constructs in this style. We have some: convolution, pooling,LSTM, GAN, VAE, m...
2020-02-10 23:15:47
1102
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(四、TensorFlow 进阶)
合并与分割合并张量的合并可以使用拼接(Concatenate)和堆叠(Stack)操作实现,拼接并不会产生新的维度,而堆叠会创建新维度。选择使用拼接还是堆叠操作来合并张量,取决于具体的场景是否需要创建新维度。拼接 在TensorFlow 中,可以通过tf.concat(tensors, axis),其中tensors 保存了所有需要合并的张量List,axis 指定需要合并的维度。a = ...
2020-02-10 21:36:51
552
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(三、TensorFlow 基础)
数据类型TensorFlow 中的基本数据类型,它包含了数值型、字符串型和布尔型。数值类型数值类型的张量是TensorFlow 的主要数据载体,分为:标量(Scalar) 单个的实数,如1.2, 3.4 等,维度数(Dimension,也叫秩)为0,shape 为[]向量(Vector) n 个实数的有序集合,通过中括号包裹,如[1.2],[1.2, 3.4]等,维度数为1,长度不定,...
2020-02-10 19:43:33
646
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(二、回归问题和分类问题)
回归问题解析解与数值解解析解:通过严格的公式推导出的精确解称为解析解(Closed-form Solution)。但是对于多个数据点(???? ≫ 2)的情况,这时很有可能不存在解析解,我们只能借助数值方法去优化(Optimize)出一个近似的数值解(Numerical Solution)数值解:是采用某种计算方法,如有限元的方法, 数值逼近,插值的方法, 得到的解.别人只能利用数值计算的结果,...
2020-02-10 12:50:33
497
原创 《TensorFlow 2.0深度学习算法实战教材》学习笔记(一、人工智能绪论)
人工智能绪论人工智能,机器学习,神经网络,深度学习之间关系机器学习分类机器学习可以分为有监督学习(Supervised Learning)、无监督学习(UnsupervisedLearning)和强化学习(Reinforcement Learning)有监督学习 有监督学习的数据集包含了样本????与样本的标签????,算法模型需要学习到映射????????: ???? → ????,其中????????代表模型函...
2020-02-10 12:33:29
871
原创 在Asciidoc中的多级列表以及缩进的使用
保持合理的缩进可以保障文档的可读性,Asciidoc在语法上对缩进提供了支持,示例代码:- Praesent eget purus quis magna eleifend eleifend. 1. Fusce euismod commodo velit.+--image::help/images/ditaa-diagram.png[title="示例1",alt="zetyun.c...
2020-01-07 17:23:00
1199
原创 产品设计思维工具(2019年做产品的一点总结)
序号 方法 应用场景/说明 1 先使用文字陈述出所有已知信息,再进行精简 界面Label定义 文字描述 2 将信息结构化 界面信息排列,结构化可以提供良好的阅读理解以及扩展能力 3 ...
2019-12-31 19:16:55
319
原创 在Dockerfile中安装本地whl包
将whl包上传到Dockerfile所在的目录,通过COPY命令将安装包拷贝到镜像中,再通过RUN执行安装命令即可FROM registry.domain.com:5000/aps/module/base/baseimage-cpu:3.1.3COPY pip-9.0.1-py2.py3-none-any.whl /tmpRUN pip install --use-wheel --no...
2019-11-07 17:51:07
5322
1
原创 将机器学习模型部署为服务
简单了解了mlflow和seldon两种方式,相关学习内容记录如下:mlflowhttps://github.com/mlflow/mlflow1、训练模型:$ python examples/sklearn_logistic_regression/train.py(会在后台训练,需要等待)2、将模型部署为服务:$ mlflow models serve --model-uri ru...
2019-10-12 18:32:31
1067
02-谷歌AutoML.rar
2020-08-07
视频分类数据集dance和driving
2020-03-17
序列标注sample-text-seq-annotated-iob.zip
2020-03-17
Jupyter Notebook Cheatsheet.pdf
2019-12-11
Acsiidoc 示例文件--用于快速学习asciidoc语法
2019-04-03
基于asciidoc的产品文档大纲规划-中文版本
2019-03-18
Kylo调研总结
2018-10-16
全息三维显示技术概览,是一个学习笔记,对立体视觉原理、常见的显示和采集技术有个粗略的整理
2023-03-03
Innovate2020_人工智能与机器学习_AI+基础架构资源的演进与选择CPU,+GPU,+ARM+和+ASIC
2022-02-25
AI与机器学习计算手册
2022-02-25
5G超高清新场景白皮书
2021-08-05
常见机器学习模型可视化展示效果
2021-08-03
AI开发平台-百度BML&华为ModelArts&阿里PAI&腾讯TAI&亚马逊SageMaker调研对比.pdf
2021-08-03
深度学习在各场景下的评估指标
2020-03-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人