- 博客(135)
- 资源 (2)
- 收藏
- 关注

原创 机器学习项目是如何开发和部署的?
本文以一个小项目带你弄清ML的项目流程这周做作业查资料时,无意中看到一个GitHub项目ML-web-app,它以PyTorch训练MNIST文字识别模型为例,介绍了从模型训练到部署上线...
2020-05-28 22:42:22
1308
原创 DeepSeek开源周六彩蛋:一套组合拳,成本8.7万,营收56万
字数 709,阅读大约需 4 分钟2025 年 2 月 24 号-2 月 28 号,DeepSeek 开源了大模型领域的多个关键软件,推动 AGI 向前发展。你以为这就结束了?今天 (3 月 1 号) DeepSeek 又给出了一份汇总性的内容,总结自己利用这些关键技术,构建自己的推理系统的。先说结论:1. 平均 1 天使用 226.75 个计算节点 ,每个节点 8 张 H800,假设每块 H80...
2025-03-01 16:28:31
512
原创 跟着 Deepseek 提示词文档学习使用大模型
字数 1249,阅读大约需 7 分钟在浏览DeepSeek 官网 API 文档[1]时,笔者发现了非常有用的资源,那就是 DeepSeek 官方出品的提示词库[2]:该提示词库是给开发者使用的文档,适用所有兼容 OpenAI API 的大语言模型。事实基本所有开源的大语言模型,都支持 OpenAI 的 API 风格,所以该教程适用所有的模型。角色当我们和大模型对话/交互时,我们输入的内容会被...
2025-02-07 00:00:17
500
原创 qwen2.5-coder 大模型发布,实测有点用,又好像没用
大陆时间 2024 年 11 月 12 日凌晨 3 点左右,阿里千问团队发布 Qwen2.5-Coder 系列模型模型特色新模型主打强大、多样和实用三大特点。强大Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,代码能力追平 GPT-4o,展现出强大且全面的代码能力,同时具备良好的通用和数学能力。多样10 月开源了 1.5B和7B 两个尺寸,本次又带来 0....
2024-11-13 00:00:50
2306
原创 被数百万元收购的 ChatNio 初体验
最近一则新闻 15 岁山东初中生做 CTO,开源项目刚刚被数百万元收购了 火爆出圈,笔者看了下被收购的开源项目 ChatNio,发现挺好用了,就体验下。ChatNio 号称下一代 AIGC 一站式商业解决方案,其功能融合了 Next Web 和 One API 各自的优点,通过整合实现 1+1>2 的效果:Chat Nio > Next Web + One APIChatNio 在保持...
2024-11-10 16:34:19
2323
原创 大模型联网搜索组件 SearXNG 部署和使用
SearXNG 是一个免费的互联网元搜索引擎,它整合了来自超过 70 个搜索服务的结果。用户不会被跟踪或进行特征分析,很好地保护了用户隐私。2022 年 11 月 OpenAI 发布 ChatGPT 后,大模型和知识库开始火爆,联网搜索成为弥补大模型知识陈旧的重要工具。提供元搜索功能的 SearXNG 开始被很多大模型应用比如 ChatNio[1] 采用,在大模型时代发挥了巨大作用。本文将介绍如何...
2024-11-09 21:47:34
8577
1
原创 Ollama 0.4 版本发布,支持 Llama 3.2 Vision 视觉模型,实测满足个人使用
更新信息最大的更新莫过于对 Llama 3.2 Vision 视觉模型的支持!ollama 的版本也因此从v0.3.14直接升级到v0.4.0。升级 ollama 后,运行如下命令体验#默认运行11B大小模型ollamarunllama3.2-vision#运行90B大小模型,需要显存支持ollamarunllama3.2-vision:90b支持 Llama 3.2 V...
2024-11-07 10:20:27
1481
原创 股市大涨,打工人如何优雅摸鱼看盘
简介2024.9.24 国新办新闻发布会宣布金融支持经济高质量发展[1],A 股交易火热,截至 9.30 号,一天交易额突破 2.6 万亿,很多股民开始大举资金入市。作为普通的打工人,A 股交易的时间段我们都在干活,没有时间和精力去看盘,更谈不上买卖股票(上班炒股)了。为了解决这个问题,笔者开发了一款命令行工具sec,是证券的英文单词security的前 3 个字母缩写。sec 经过国庆 7 天...
2024-10-08 01:51:05
743
原创 LobeChat Database 完全本地部署
为什么部署 LobeChat Database 版本LobeChat 作为一款界面美观、交互简洁的大模型前端,非常适合作为 Ollama 运行本地大模型的前端交互界面使用。非 database 版本的 LobeChat 将设置、对话数据存储到浏览器缓存 (IndexedDB) 中,如果清理了浏览器缓存,或者跨设备使用,则需要重新设置 LobeChat,必要时还要同步对话数据,降低了使用的便利性。笔...
2024-09-22 22:33:36
5709
原创 ChatGPT UI最佳平替 LobeChat Database 快速部署
为什么部署 LobeChat Database 版本LobeChat 作为一款界面美观、交互简洁的大模型前端,非常适合作为 Ollama 运行本地大模型的前端交互界面使用。非 database 版本的 LobeChat 将设置、对话数据存储到浏览器缓存 (IndexedDB) 中,如果清理了浏览器缓存,或者跨设备使用,则需要重新设置 LobeChat,必要时还要同步对话数据,降低了便利性。Lobe...
2024-08-07 23:54:03
1248
原创 使用 Cloudflare tunnel 安全暴露内网服务
Cloudflare Tunnel 创建与配置Cloudflare Tunnel 能够保护 web 服务器或应用免受直接攻击,不管它运行在哪里:共有云、私有云、kubernetes 集群或者你电视下的 Mac Mini。Ensure your server is safe, no matter where it’s running: public cloud, private cloud, Kub...
2024-07-27 21:57:41
1261
原创 Meta 发布最强开源大模型 Llama3.1
大陆时间 2024 年 7 月 23 号 23:10,美国人工智能公司 Meta 发布最新的 Llama 开源模型 llama3.1[1],共有 8B 70B 和 405B 三种参数版本。新一代大语言模型具有以下优势:更大的上下文窗口: 支持 128K token 上下文窗口,能够更好地理解复杂的问题和上下文。多语言支持: 同样支持多语言的功能 (8 种),能够有效处理不同语言的问题和任务。改进的...
2024-07-24 01:37:10
579
原创 装一台电脑跑大模型/知识库
为什么需要 homelab核心原因是我的需求云服务器无法满足,homelab 是为了弥补云主机的缺点。需求如下:部署一些私有云服务,自己购买的云服务器配置不高,很多服务无法运行nextcloud个人项目知识库 (fastgpt, dify)开源软件开发测试环境,需要不同于 Apple 硬件的显卡个人项目部署:goapp,grafana,clickhouse 等self-hosted github ...
2024-07-21 00:00:00
1045
原创 简洁优雅知识库 FastGPT 快速部署
简介FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过可视化进行工作流编排,从而实现复杂的问答场景!它界面简洁美观,功能完备强大。本文将介绍如何基于 Docker 快速部署 FastGPT,该方案非常适合个人或者小型团队。系统要求本方案已经在 Linux 上验证通过,笔者也建议选择 Linux 作为运行 FastGPT 的操作系统。...
2024-07-20 16:49:20
1162
原创 使用 Act 本地运行 GitHub Actions
简介GitHub Actions 为仓库开发者提供了执行定制化 Job 的能力,开发者可以使用各种 Job 基于代码仓库运行测试、构建、发布等操作,实现 CI/CD 等工作流。这些 Job 默认运行在 GitHub 提供的 runner 中,但是由于仓库众多,配置了 actions 的代码仓库未必能得到足够的资源 (runner) 来快速、高效的运行代码仓库的 Actions。一个可行的方式是绑定...
2024-06-24 23:45:37
1560
原创 历时 8 年研发,苹果 Vision Pro 量产版开卖,买不买?
我们想要打造一台空间计算电脑,你可以通过它直接进入一个新的空间。这是我们的初心----------- WWDC23, Mike RockwellVision Pro 是苹果面向空间计算时代的新产品,采用混合现实 (MR) 头显设备,能够将数字内容无缝现实在现实空间。VisionOSVisionOS 是 Apple 在 MacOS iOS 和 iPadOS 基础上实现的首款空间操作系统。它采用新的专...
2024-01-20 21:14:15
894
原创 ChatGPT 与华为 Mate 60,我这暗流涌动的 2023 年
回望过去,展望未来。从写年度总结到如今已经是第 4 个年头了,看了下前 3 年的总结,有一种沉甸甸的充实感。有了这些记录,近 3 年关于自己的重要事情都有迹可循,不会觉得虚度光阴。2022 读书总结2021 读书总结2020 读书总结之前的年度总结,内容都是按照特定的模板写的,大概内容是:当前目标完成情况当年开始情况反思当前的收获和经验制定下一年目标今年我不想循规蹈矩了,我决定追随自己的内心,想到...
2024-01-18 23:02:44
578
原创 HuggingFace CEO 5 大新年预测:2024 年将是人工智能丰收年!
2024 新年伊始,HuggingFace CEO Clem 在巴黎办公室录制视频,分享对 2024 年人工智能的一些预测。Clem 从事 AI 领域工作 10 余年,2017 年联合创办了 HuggingFace,作为资深专业人士,Clem 的预测十分具有参考价值。Clem 在视频开头便强调:现在是进入人工智能领域的最佳时机!更多考虑 AI 行业的消耗包括 AI 的财政成本和环境成本。最近 2 ...
2024-01-11 01:25:29
583
原创 OpenAI DevDay: 人人都可以创建自己的 ChatGPT
当地时间 2023 年 11 月 6 号,OpenAI 发布博客 DevDay[1],介绍新的模型和开发这产品。发布以下更新新的 GPT-4 Turbo 模型能力更广:比 GPT-4 更强大,知识覆盖到 2023 年 4 月的世界事件。128K 上下文窗口:拥有 128000 token 的上下文窗口,能够处理相当于 300 多页文本的内容。更快更便宜:性能得到优化,价格降低,输入令牌价格降低 3...
2023-11-07 10:39:02
234
原创 华为整顿新能源车企
华为的 XPixel 智慧大灯[1] 火了,不仅能够照明,还能够根据灯光明暗显示图像信息,在车辆行驶时提供引导服务,引得网友竞相关注。20231011224322几家欢喜几家愁,今天媒体爆出理想汽车开了 4 天战略会,美团 CEO 王兴、Y Combinator 中国创始人陆奇等行业重要人物受邀参与。战略会达成了一个重要共识,就是“花钱”。避开华为锋芒,“扬长补短”, 现在几乎没有人敢正面迎战华为...
2023-10-11 23:36:32
164
原创 华为秋季发布会产品预览
2021 年 9 月 25 号,孟晚舟回国[1],2 年后的 2023 年 9 月 25 号,华为举办秋季全场景发布会,这 2 年,华为都做了哪些突破?发布会规格空前从 华为终端[2] 微博发布的直播平台来看,有超过 140 家媒体同时直播,阵容豪华。而且人民日报、新华社等都会直播,重视程度可见一斑。这么大的阵容,要是发布会没有重磅产品,谁都不信。发布产品预览Mate 60 RSMate 60 保...
2023-09-24 23:10:28
322
原创 关于 Mate 60 、芯片和光刻机,疑问将揭晓
关于华为和 mate 60,你一定有很多疑问:mate 60 还有哪些隐藏功能?mate 系列还有王炸产品吗?麒麟 9000S 怎么生产的?光刻机怎么解决的?不过很多评测视频和文章都被下线,公众无法窥探。现在,这些都将揭晓。今早华为终端发布信息,宣布华为秋季全场景新品发布会定档 9 月 25 号。华为终端 CEO 余承东也在微博转发该信息,暗示还有大招。Mate 60 摇摇领先的功能通信,这是华为...
2023-09-15 00:20:56
319
原创 遥遥领先?mate 60 pro 芯片猜想
2023 年 8 月 9 号华为以先锋计划直接上线了新品旗舰手机 mate 60 pro 的预约购买连接。众所周知,华为在 2019 年 5 月 15 号被美国制裁,无法使用美国技术的产品生产最先进的手机芯片,手机业务面临危机。在上一篇文章华为 mate 60 pro 是 5G 还是 4G?中,我们结合网络上的开机测评,认为新款的 mate 60 pro 至少在网络速度上,达到了 5G 网络的速度...
2023-09-04 22:37:26
460
原创 遥遥领先,华为 mate 60 pro 芯片疑云
2023 年 8 月 9 号华为以先锋计划直接上线了新品旗舰手机 mate 60 pro 的预约购买连接。众所周知,华为在 2019 年 5 月 15 号被美国制裁,无法使用美国技术的产品生产最先进的手机芯片,手机业务面临危机。在上一篇文章中,我们结合网络上的开机测评,认为新款的 mate 60 pro 至少在网络速度上,达到了 5G 网络的速度标准,现在我们来分析下华为的芯片问题是如何解决的。1...
2023-09-04 00:08:03
1043
原创 华为 mate 60 pro 是 5G 还是 4G?
原计划 2023.9.12 发布新品的华为,在 8.29 号以先锋计划直接上线了新品 mate 60 pro 的预约购买连接。不过在手机详情页,并没有提及使用的是哪款芯片,有关华为 Mate 60 Pro 是否支持 5G 网络的问题引发了广泛讨论和关注。是不是 5G抢先购买 mate 60 pro 的 自媒体人开机体验显示[1],系统并不会显示 4G 还是 5G。但是电话联系运营商关闭 5G 后,...
2023-08-31 00:53:01
4588
原创 InfoGPT - 让ChatGPT/文心一言等大语言模型更易用
InfoGPT 是笔者学习ChatGPT等大语言模型过程中开发的一款开源软件,截至 v0.0.14 版本,支持 openai api 代理、电报机器人、微信公众号三个平台。微信公众号集成比较麻烦,会专门开一篇介绍。项目地址:https://github.com/alwqx/infogpt欢迎大家试用和提需求对于个人用户OpenAI API 代理共享 API Key...
2023-04-18 23:15:48
338
原创 为什么要学习研究 ChatGPT 等新一代 AI 技术
我最近一直在研究 ChatGPT,包括注册账号,试用聊天功能等。其实 2022 年 11 月 ChatGPT 发布以来,我一直是个旁观者,看到好多文章和网友讨论这款 AI 大语言模型驱动的聊天应用,却没有使用和进一步了解它。直到最近我突然醒悟了:这是一次 AI 奇点,是一次技术浪潮,除了拥抱它,别无选择。于是我开始投入时间和精力来研究它,并撰写了几篇学习文章。虽然现在才开始,我相信还不晚。我选择学...
2023-03-27 23:36:46
446
原创 除了聊天还能做什么?ChatGPT 相关应用推荐!
ChatGPT 不仅是一款聊天应用,OpenAI 还开放了 API 用于和 ChatGPT 交互,下面介绍几款优秀的应用,一起看看 ChatGPT 除了能聊天还能做什么。把自己的博客训练成对话机器人将自己的博客文章丢给 ChatGPT 训练,就可以得到一个自己的数字分身,可以和自己对话、互动。与我对话[1] 是网友把自己的博客内容丢给 GPT,训练出的一个博客分身,将博客内容以对话的形式和读者互动...
2023-03-26 23:41:53
4351
原创 OpenAI为什么发布 ChatGPT 插件?追求平台化而非聊天机器人
Our mission is to ensure that artificial general intelligence—AI systems that are generally smarter than humans—benefits all of humanityOpenAI 的愿景是让通用人工智能系统像人类一样聪明,让 AI 造福全人类[1]美国东部时间 3 月 23 号 OpenAI ...
2023-03-25 00:00:36
2240
原创 ChatGPT 漫游指南 - 如何快速体验 ChatGPT
根据 OpenAI 开放地区政策[1],截止到 2023 年 3 月 23 号,ChatGPT 服务 不对中国的大陆、香港和澳门开放,因此大陆的小伙伴们无法直接体验最新的 AI 技术。即便如此,有很多热心网友搭建了 ChatGPT 镜像网站,即把网站部署在大陆可以访问的服务器上,因此只要你有网,就可以愉快地体验 ChatGPT 服务了。经过体验和筛选,我列出几个体验比较好的镜像网站。1. Open...
2023-03-24 00:07:17
4373
原创 ChatGPT 漫游指南 - GitHub 发布 CopiltX 集成 GPT-4
简介美国东部时间 2023 年 3 月 22 号上午 10 点,开源代码托管平台 GitHub 在 博客[1] 中宣布推出 CopilotX,集成 OpenAI 最新的 GPT-4 模型。之前的 GitHub Copilot[2] 是基于 OpenAI 的 Codex 模型开发,它是 GPT-3 模型的低配版,帮助开发者 提高了 55%的开发速度[3]。CopilotX 是一种由 AI 驱动的开发...
2023-03-23 01:50:11
4277
原创 在陌生的城市随机漫步-珠海、澳门游记与攻略
准备考虑到只有周末 2 天有空,所以我决定专注游玩一个地方-澳门。澳门不大,2-3 天就可以游玩大部分景点。香港的话要大很多,等后面有假期了再说。其实,在出发前我还一直在犹豫要不要去,毕竟工作事情多、好基友又想跟我一起搞事情,我一直到周五都还在纠结是否出发,机票、宾馆也没提前预订。直到周五晚下班,我才买了周六早上飞珠海的机票,临时做攻略到半夜,凌晨 4 点起床赶飞机。珠海飞机在珠海降落后我才开始预...
2023-03-20 01:31:03
4777
原创 上海普通码农的年度消费账单:2022 年
我很早我便养成了记账的习惯,随着记账工具的发展,我的记账方式越来越先进和灵活。2022 年已经过去,全年的开支我都完整记录下来,我想介绍我的真实消费数据,方便读者了解上海的物价水平和普通码农的真实消费情况。简介我使用复式记账+文本+工具的方式,使用流行的 Beancount[1] 对账单进行分析和可视化,使用 Git 管理账单版本。我的支出大致分为 5 类:基本生活:涵盖了维持生命和基本生活的开支...
2023-03-04 01:20:27
263
原创 2022 读书总结
2022 年主要阅读了文学类和理财类书籍,增加了几本杂项书籍,具体如下:文史类 4 本《软技能 2-软件开发者职业生涯指南》- 约翰.森梅兹《三体:黑暗森林》-刘慈欣《三体:死神永生》-刘慈欣《浪潮之巅》- 吴军理财类 7 本《还原真实的美联储》- 王健《巴比伦富翁的秘密》- 乔治.克拉森《置身事内:中国政府与经济发展》- 兰小欢《精通以太坊:开发智能合约和去中心化应用》- 安德烈亚斯.M.安东波...
2023-02-27 00:06:07
149
原创 B Start - 哔哩哔哩校招入职成长营
2022 年校招生培训计划于今天正式开始,下午 1-6 点是开营活动,大概分为活动介绍、各业务线负责人介绍业务和 CEO 陈睿发言三大块内容。有些内容我觉得挺有启发的,就记录下来。校招情况2022 年 B 站校招生大概 700 人左右,产品运营和技术类岗位是招聘大头,分别占校招人数的 23%和 45%。从历史上看,2018 年校招生 100 人,到 2022 年 700 ...
2022-07-28 23:57:11
511
原创 ArchLinux Plasma 简洁优雅桌面环境设置
一转眼自己使用 ArchLinux 已经 5 年了,期间自己尝试把桌面环境 Plasma 美化了下,用户体验更接近 MacOS。效果图预备知识ArchLinux 是 Linux 操作系统的一个发行版,它的特点是简洁、轻量、滚动更新。定制化能力也很高,适合动手能力强的小伙伴。而 Plasma 是一个由 KDE 开源社区维护的免费桌面环境,这款桌面环境的定制性也很强,可以自定...
2022-05-02 22:33:59
1258
原创 计算机读研的收获和遗憾
本文记录自己2.5年研究生求学过程中的一些收获与遗憾,希望能给大家一些参考。读研时间线2018.7-2019.3 复习备考阶段这段时间主要在思考要不要考研、复习备考阶段,请参考拙作:计算机工作两年,决定考研的思考过程2019研究生考试的经验和教训2019.3-2019.9 入学前的半年这半年我原计划是找实习赚钱,并且利用赚的钱多出去转转。但是那时候我的目光过于狭隘,只想着...
2022-04-10 00:17:21
573
原创 2021计算机研究生秋招总结
由于读的是专业硕士,按照2019年入学时学校的要求,学制为2.5年,2019.9-2022.3,因此求职的时间安排和3年制的学生有些区别,就是我们只有2021年6月左右开始的秋招,后面2022年3月份的春招机会很少,而且时间上和毕业重合,未必来得及。我的导师对我要求相对宽松,毕业论文的方向需要自己找,我当时是先实习、后写论文的安排,2020.9-2021.7在B站实习(中...
2022-04-04 22:18:23
831
原创 2021读书总结
2021年主要读了些文学类和理财类书籍,技术类书籍好像没怎么看(逃~),具体看的书如下:文史类7本《自卑与超越》- 阿德勒《被讨厌的勇气》- 岸见一郎、古贺史健《摩根写给儿子的32封信》-...
2022-01-05 23:56:02
475
原创 如何定制Kubernetes调度算法?
随着云计算和容器技术的发展,以docker为核心的容器技术迅速在开发者和科技公司中应用,Kubernetes凭借丰富的企业级、生产级功能成为事实上的容器集群管理系统。可是k8s的通用性削弱...
2021-12-01 14:38:55
1460
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人