- 博客(21)
- 资源 (3)
- 收藏
- 关注
原创 SORA 探秘
此外为了提升训练的视频的 prompt 和 视频本身内容的一致性(其实就是保证生成效果的稳定性和收敛性),这里对于视频的图片的caption 其实就是prompt采用和Dalle-3 一样的做法,重新训练了一个好用的标签生成器保证了生成标签的一致性和正确性,(原来的那个从互联网爬下来的标签实在是太差了)可能利用了类似LLM的 多token 的Transfomer 的进行参数的生成,这样做其实一直都是可以的,但是计算量实在是大的有些吓人,一般在图像中还是用vit的方式更多一些。以上都是基于我个人的理解。
2024-03-08 17:37:25
377
1
原创 LLM PreTraining from scratch -- 大模型从头开始预训练指北
这里需要注意,tfrecord 的写入的数据只有int,float, byte 3种形式,因此string 格式的数据数据需要通过utf-8的编码写入到tfrecord 中,再读取的时候通过utf-8的解码才能还原为写入的string数据,对应修改train.py 文件,此外原版代码中所有的语料是读取到内存中再进行操作,但是随着语料的量级达到T级别,基本无法全部用内存hold 住所有的语料,另外读取语料的到内存的时间也会很长,基于以上几点考虑,重新选择tfrecord 作为新的数据的存储方式。
2024-03-08 17:34:03
1595
原创 浅谈ChatGPT 和 对AI 的思考
新世纪以来,人工智能作为一个非常热门话题,一直收到大众的广泛的关注。从一开始的图像的分类,检测,到人脸的识别,到视频分析分类,到事件的监测,到基于图片的文本生成,到AI自动写小说,AI 自动作画,AI 超分,再到在围棋上战胜人类的AlphaGo,AlphaZero 每一次都霸占着版面的头条。最近一段时间,另外一个基于人工智能技术的产品ChatGPT再一次火爆的国内外,以至于现在听不懂什么叫ChatGPT 都感觉自己和时代有点落伍了,那ChatGPT 究竟是什么,它能做什么,它是怎么来的,它会对于我们产生什么
2023-03-07 10:59:25
5294
原创 VIT 三部曲 -1 Transformer
赵zhijian:VIT 三部曲赵zhijian:VIT 三部曲 - 2 Vision-Transformer赵zhijian:VIT 三部曲 - 3 vit-pytorch目前在代表分类领域最高权威的imagenet 图片分类竞赛中, CNN的榜首位置收到了来自self attention 类的算法的的挑战,在最新的榜单上, VIT-H/14 以 88.55% Top-1 的准确率成功登顶第一的宝座,成功打败了由nas 出来的efficientNet 系列的模型,也成功打破了基于卷积和pool
2020-12-15 11:42:10
11292
2
原创 深度学习在医学图像处理中的应用
简介本文参考了三篇深度学习在医学图像处理中的三篇综述性的文章,旨在对于深度学习和医学图像相结合的现有情况做一个小总结,并探讨一下未来的一些发展趋势和自身的一些思考医学影像深度学习工具深度学习模型在医学影像处理中使用的到的深度学习的模型框架主要有:SAE(stack auto-encoder)无监督学习方案,逐层训练,得到特征描述为主R
2017-06-28 16:45:52
22674
3
转载 论如何实现财务独立
高级市场经理Hi,叶子:上次邮件中你问我要如何规划人生,才能尽早实现财务自由,适逢离职快一周年,这几天我睡觉时都辗转反侧,思考怎么能用最好的方式分享给你,希望对你有所帮助。首先我想告诉你,你还年轻,只要你做出正确的选择就有机会。去年我和L先生一起迈进人生第三个十年,毕业6年纪念日那天,我正式从中国最好的互联网公司辞职,L先生比我早3年离职。你知道那会儿正盛行“世界那
2016-09-25 20:05:46
669
原创 git ssh 心得
最近开始学习使用git 管理我的代码。 之前一直使用的http上的git 的clone 每次上传的时候都需要输入账户帐号密码,很是麻烦。怎么办 搜索了一圈发现使用ssh的办法可以解决这个问题,那我们就来折腾一下呗。首先使用git remote 命令利用git remote rm 命令删除本地的git remote 的远程的http地址。利用git remote add origin 命令添加
2016-09-18 21:30:18
340
原创 学习心得
一周一次的心得体会,今天来说说很火的一个东西叫docker。dockerdocker 是啥,docker 是一个轻量化的虚拟容器解决方案。在内核级别实现虚拟化,将每一个web上面的应用进行统一的打包,打包成统一的镜像的形式,方便进行部署和分发。 作为一个web应用的初学者,对于docker 的理解还是比较的浅显的,最为直观的感觉就是,当你要部署一个web应用的时候,不需要配置apache ,不需
2016-06-02 21:17:46
432
原创 Mark jenkins + git 完成自动构建
http://blog.youkuaiyun.com/likely_zhao/article/details/51347671自动构建下面我记录以下我用jenkins + git 完成自动构建的全过程。安装jenkins 和 jenkins git 工具找到git 中需要构建的一个仓库的url创建一个freestyle 的task设置task 的代码源类型为git 并输入要构建的代码路径设定构建的tr
2016-05-14 23:39:35
472
原创 Mark Git 初步
步骤 1. 建立和使用一个仓库 2. 建立一个分支 3. 做一个提交 4. 拉拽请求第一步很简单,鼠标点点就好了 第二步建立一个分支概念,相当于拷贝出一个临时的空间出来开发,开发完了之后在merge 到主分支中,大家可以分开开发,在通过codereviewer 进行合并。 在合并的时候需要pull request ,此时需要比较代码不同的部分,通过后可以合并到master中。
2016-05-08 21:01:23
411
原创 Mark linux 安装拼音输入法
最近在笔记本上安装了一个ubuntu V1604 LTS但是安装了之后无法输入中文。解决方法:设置语言支持,直接点选就好安装ibus-pinyin 或者 ibus-sunpinyin在text entry setting中设置添加最新的汉语拼音(建议用pinyin搜索)关闭后就可以了。注销后再登录就好了have fun
2016-05-06 23:04:32
332
转载 机器人操作系统ROS教程(三) ROS新手教程
前面我们介绍了ROS的特点和结构,接下来就要开始准备动手感受一下ROS的强大了。ROS官网的wiki上针对 新手的教程很详细,最好把所有的新手教程都搞清楚,这是后面开发最基础的东西。尽管如此,ROS对于新手 来说还是很难上手,这里,我就来总结一下我当时学习的历程,也为其他新手作为一个参考。一、ROS 的安装ROS的安装当然是我们开始动手的第一步了,这里我们使用的操作系统是ubuntu,
2016-01-25 22:22:29
1308
转载 机器人操作系统ROS教程(二) ROS总体框架
根据ROS系统代码的维护者和分布来标示,主要有两大部分:(1)main:核 心部分,主要由Willow Garage公司和一些开发者设计、提供以及维护。它提供了一些分布式计算的基本工具 ,以及整个ROS的核心部分的程序编写。(2)universe:全球范围的代码,有不同国家的ROS社区组织 开发和维护。一种是库的代码,如OpenCV、PCL等;库的上一层是从功能角度提供的代码,如人脸识别,
2016-01-25 22:14:30
944
原创 自动保存PubFig 数据库
PubFig face database 链接(http://www.cs.columbia.edu/CAVE/databases/pubfig/)是一个之前一直想
2014-09-13 15:43:29
4289
4
原创 C# hello World
今天第一次用C# using System;using System.Collections.Generic;using System.Linq;using System.Windows.Forms;namespace Test_saveimg{ static class Program { ///
2014-08-09 16:21:25
466
转载 利用C# 保存图片
hihi小弟也好寄研究了一下一般如果找網頁圖片,好像用flashget或是直接網頁另存(kkman),就可把網頁資料下載下來透過程式,比較常用的作法是讀取網頁解析html,取得img的Tag然後將img下載到你要的目錄下下面是簡單寫的範例,臨時寫的,可能很多問題(謹供參考)參考看看喔^^ 1public class MyI
2014-08-07 20:49:38
3341
中证债券估值产品介绍.pdf
2023-04-10
全国公募基金市场投资者状况 调查报告(2020 年度)
2023-04-03
A股投资者结构全景图深度剖析
2023-04-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人