AlgorithmWillBeFine-优快云博客

原创手撕transformer-基于numpy实现

使用numpy详细讲解transformer原理，并附上时现代码

2023-08-17 21:38:01 1315 1

原创 C++ SDK提供回调函数接口给Android/iOS 集成

C++如何提供跨平台的回调函数接口是业务开发很常遇到的需求，但是实际上公开的资料都很杂乱，而且不一定正确，因此在此文章中，以Android Java和iOS Swift为例，系统化说明一下如何制作一个跨平台C++回调函数接口。

2023-07-28 08:01:24 710 1

原创 [AI]如何让语言模型LLMs流式输出：HuggingFace Transformers实现

HugginFace Transforms是一个非常方便的库，集成了非常多SOTA的模型，包含：LLAMA, GPT, ChatGLM Moss，等。目前基本上主流的方案都是基于HugginFace Transforms这个框架实现的。以前如果要流式输出需要自己去改模型底层的推理逻辑。

2023-06-14 12:06:49 15664 3

原创 [AI] 在 huggingface transformers新增自定义token

通常，新数据集和自然语言任务使用新的或不同的领域特定词汇。虽然目前模型一起使用的子词tokenizers能够处理基本上任意的token，但这并不是最优的。这样可以处理文本，但以这种方式一些特殊涵义的词汇可能不够精准，而且整体token长度会变长，从而降低模型的效率。因此将新的领域特定令牌添加到tokenizers和模型中，可以更快地进行微调，并更好地捕获数据中的信息。我们可以通过使用词汇表中的令牌数量（包括新添加的令牌）调用模型的。作为最后一步，我们需要向模型的embedding matrix中。

2023-06-13 20:48:03 1811 1

原创 [业内观点]深度剖析WWDC 2023 Apple Vision Pro对AR产业带来的冲击

6/5日苹果的"One more thing" Apple Vision Pro的发布，肯定是在XR/AR/VR发展中，值得载入史册的一天。很多人会说， Apple Vision Pro的很多能力都是业界早就很多人提出，并且已经在很多产品中落地了，比如眼动+全手势交互在几年前的MicroSoft Hololens上就已经实现，3维无限大屏也是目前很多Bird Base AR眼镜主打的应用场景，显示跟Oculus Quest是相同的方案。那Apple Vision Pro又有什么特别的呢？。

2023-06-07 11:13:40 481 1

原创 [OpenCV+FFMepg]使用FFMepg编码cv::Mat并写入视频

OpenCV本身就已经包含很多视频读写的基础能力，但是如果需要更全面的音视频编解码的能力，目前最通用的跨平台方案就是OpenCV+FFMpeg，以下就来介绍如何透过FFMpeg对cv::Mat进行编码，并写入到文件中。首先，需要引入一些必要头文件，注意FFMpeg的header在C++中引入需要加入extern "C"首先需要指定编码的格式，这里以MP4为例，可以根据需求修改。接著需要建构编码视频的Context，详细的参数介绍可以。Encoder的参数可以透过这样设置，详细的介绍可以。

2023-05-31 06:55:51 1889 2

原创 [AI]算法小抄-State of GPT (Andrej Karpthy MSBuild2023 )

总体来说GPT系列根据上面的流程已经获得跨时代的成果，其中关键除了模型本身，还涉及非常多细节：包含：数据采集，训练参数...等。在这次演讲并未有进一步披露。对于未来的发展，目前GPT4展现出来了思维链(Chain of Thought)的能力，也已经广泛应用到AutoGPT, LangChain中。以下是个CoT的示例。

2023-05-30 11:53:34 368 1

原创 [AI]算法小抄-你不知道的LangChain原理

如果在LangChain原始工程中搜索promt.py，你会发现有非常多的相关文件。这是因为对于LangChain底层不同的功能，都是需要依赖不同的prmpt进行控制，虽然简单粗暴好理解，但是也不是没有副作用的，以下总结这种框架共有优缺点，这个优缺点同样适用于ChatGPT Plugin和LlmaIndex...等，Prompt Egineering框架。

2023-05-29 10:45:15 3179 1

原创 [AI]算法小抄-目前最完善的RLHF框架：AlpacaFarm

系列文章主要目的快速厘清不同方法的原理差异和应用场景，对于理论的细节请参考文末的Reference，Reference中也会筛选较为正确，细节的说明在的众多方法中，RLHF一直都被认为是ChatGPT成功的关键，但成本与训练门槛最高。GPT系列的RLHF方案一直未开源，因此研究到这一步的团队只能基于进行魔改，而且过程复杂又昂贵。

2023-05-26 10:23:44 551 1

原创 [AI]算法小抄-总结大模型微调方式

以下根据适合的任务，成本对于上述的方法进行总结方法适合任务数据成本训练成本自然语言类型子任务，如：文本分类，语义分析...等中，模版设计和映射对于效果影响巨大低，一个子任务只需要少部分数据通用型分发任务，比如：API调度，AutoGPT等低，半自动化生成，参考Alpaca低，一个子任务只需要少部分数据RLHF强用户体验相关，比如：人格化，聊天...等高，需要人工打分以及人工撰写高，数据跟训练效果未知。

2023-05-25 11:52:45 1432 1

Pthon开源全球海拔数据获取，支持私有数据部属服务

https://www.opentopodata.org/ https://github.com/ajnisbet/opentopodata 支持多种开源海拔数据，并建立私有海拔查询服务 ASTER ETOPO1 EU-DEM Mapzen NED 10m NZ DEM SRTM (30m or 90m) EMOD Bathymetry GEBCO Bathymetry BKG (200m)

2023-05-29

easylogging++：好用的跨平台打log工具，支持android, iOS和PC

源代码：https://github.com/amrayn/easyloggingpp 无需要依赖其他三方库，直接集成到工程理编译就行 If you are working on a small utility or large project in C++, this library can be handy. Its based on single header and only requires to link to single source file. (Originally it was header-only and was changed to use source file in [issue #445](https://github.com/amrayn/easyloggingpp/issues/445). You can still use header-only in [v9.89](https://github.com/amrayn/easyloggingpp/releases/tag/9.89)). This library has been design

2023-05-29

JARVIS：基于LLM控制万种API的架构

Language serves as an interface for LLMs to connect numerous AI models for solving complicated AI tasks! See our paper: [HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace](http://arxiv.org/abs/2303.17580), Yongliang Shen, Kaitao Song, Xu Tan, Dongsheng Li, Weiming Lu and Yueting Zhuang (the first two authors contribute equally)

2023-05-29

使用LangChain调用Gadio工具，并且建立Gradio页面

使用LangChain调用Gadio工具，并且建立Gradio页面包含使用Langchain建立gpt agent 使用Langchain让GPT自动调用工具将输入输出透过Gadio生成可视化页面公网调用接口

2023-05-29

iOS OpenCV(包含FFMpeg，h264, freetype和HarfBuzz)，可产出so和framework

iOS OpenCV(包含FFMpeg，h264, freetype和HarfBuzz) 可产出so和framework 适用于OpenCV3和OpenCV4版本所有三方库都包含独立编译脚本可用于视频合成，和自定义字体渲染

2023-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人