- 博客(265)
- 资源 (10)
- 收藏
- 关注
原创 “一句话,生成一个App”:我体验了阿里的“灵光”AI
最后我随手拍了张八宝粥的照片问它,它不光能识别出图片内容,还提供了好几个玩法选项,比如解读图片、让图片动起来,或者进行魔法改图。它主打的就是用说人话的方式,把你脑子里的想法变成能看、能玩、能用的东西,而不是给你一堆需要慢慢消化的文字。它还能根据你拍的照片,按照你的指令进行创作,比如让你拍的玩偶“动起来吃草”。更绝的是,如果你对做出来的应用不满意,都不用复杂操作,直接开口跟它说你想怎么改,灵光就能听懂,然后自动帮你把应用改好。生成的应用不是摆设,你可以真的用,还能保存下来随时打开,甚至根据新想法让它再修改。
2025-11-18 20:12:56
935
转载 三款AI效率神器,视频翻译、会议记录、舆情分析一键搞定!
这款工具集视频翻译、配音和语音克隆于一身,支持横屏和竖屏格式,能在B站、小红书、抖音、微信视频、快手、YouTube、TikTok等主流平台完美呈现。这款以隐私为先的AI会议助手完全运行在你的本地计算机上,所有数据都不会离开你的设备。今天给大家推荐三款超实用的AI工具,从视频翻译到会议记录再到舆情分析,每一款都能极大提升你的工作效率,而且操作简单,上手就会!只需几次点击,就能将原始视频转化为精美的跨平台内容,真正实现端到端的工作流程!:能解析短视频内容,提取天气、日历、股票等结构化信息。
2025-11-16 12:04:02
30
原创 AI歌曲能好听嘛?要不,来听听
打开智谱清言的官网(https://chatglm.cn/),不用复杂操作,就像和人聊天一样,把想表达的事情说清楚就行。比如一位35岁失业的朋友,他就直接输入“想写一首35岁职场人失业、被房贷压着的歌词,前面要够憋屈,后面得有点不服输的劲儿”。智谱清言这点挺好,说改哪里就改哪里,也不用花钱,挺实在。选择风格,比如《三十五岁的路口》选“blues”就挺合适,其他效果比较好的有:funk、juzz、future bass 这几个效果比较好;点击生成,等三五分钟,带唱和伴奏的MP3就出来了。
2025-11-15 19:37:10
350
原创 30分钟搞定!这款开源工具让AI帮你盯全网热点,再也不用刷遍11个平台了
打开抖音、微博、知乎、B站,热搜列表翻不完,真正有用的信息却藏在里面;今天分享一个彻底解决这个问题的开源神器「TrendRadar」,AI加持的舆情监控工具,35个平台热点一网打尽,还能智能分析趋势,零基础半小时就能搭建,让你从"被动刷信息"变成"主动收干货"!这款开源工具不用花钱,零基础也能上手,赶紧试试,让AI帮你盯热点、做分析,把省下来的时间用在更有价值的事情上!测试:进入Actions页面,找到"Hot News Crawler",点击"Run workflow",1分钟后就能收到测试消息。
2025-11-14 22:06:34
487
原创 把知识库塞进 MP4,压缩 100 倍还能毫秒级检索,这款黑科技绝了
当大家都在比拼向量数据库的集群规模、优化算法复杂度时,Memvid偏偏捡起了30年历史的二维码和视频编码技术,用「文本→二维码→视频」的简单链路,解决了知识库存储和检索的核心痛点。:调用ffmpeg工具压缩,默认生成MP4格式,支持H.265编码(体积再减30%-50%),利用视频编码对重复图案的天然优势,实现极致压缩。简单来说,Memvid是一个基于Python的「二维码视频AI记忆库」,把复杂的知识库变成了可播放、可传输的视频文件。其实整个过程就像「给知识拍电影」,每帧画面都是一个藏着信息的二维码。
2025-11-13 07:30:21
232
转载 当理想主义相遇:锤子科技与OpenSSL的热血传奇
就靠这点钱,他们居然硬撑了十五年,全靠两个全职“镖头”死扛:一个是英国人史蒂夫·汉森,图论数学博士,典型的“技术宅”,说话都脸红,却为了OpenSSL辞掉高薪工作,年薪砍到只剩两万美元;这一标准的出台,如同在平静的湖面投入了一颗石子,激起了层层涟漪,无数公司看到了商机,纷纷投身于提供评估服务的行业,一个全新的行业应运而生。这种信任,让他和他的团队成员们,感受到了自己的工作是有价值的,是被认可的,也让他们更加坚定了守护 OpenSSL 的决心。在开源的世界里,他们虽然从未谋面,但却有着深厚的默契和信任。
2025-11-06 20:06:34
40
原创 滑动窗口的最大值(双端队列最优解+多语言实现)
在算法面试中,“滑动窗口的最大值”是高频考点之一,它不仅考察对滑动窗口思想的理解,更考验对数据结构(如双端队列)的灵活运用。掌握该思路后,不仅能解决本题,还能应对类似的“滑动窗口极值”问题(如最小值、第k大值等),在面试中做到举一反三。若题目改为“求滑动窗口的最小值”,只需将双端队列的“单调递减”改为“单调递增”——队列头部始终是当前窗口的最小元素下标,入队时删除所有大于当前元素的下标即可。双端队列(Deque)支持两端的插入和删除操作,我们可以利用它维护一个“单调递减序列”,队列中存储的是。
2025-11-05 22:17:03
547
原创 经典的朴素贝叶斯:从原理到实战,3个案例教你搞定文本分类
比如在文本分类中,我们把“每个词”当作一个“特征”。计算多个条件概率相乘时,每个概率都是小于1的小数(比如0.01、0.005),乘多了会变成极小的数(比如1e-30),超出计算机的浮点数精度,导致“下溢出”(结果变成0)。:把每篇文档转换成和词汇表等长的向量——词在文档里出现过记1,没出现记0(比如词汇表第3个词是“help”,文档里有“help”,向量对应位置就记1);:能看到两个城市的特征词差异,比如纽约广告常出现“someone”“meet”,旧金山常出现“how”“last”,符合区域用词习惯。
2025-10-30 22:39:55
351
转载 吴恩达这套Prompt工程教程,帮你打通AI应用开发第一步
没有“一劳永逸的完美Prompt”,哪怕是吴恩达的教程,也强调“迭代优化”的重要性——先写初版Prompt,运行后分析问题(比如输出太长、风格不对),再逐步调整指令,直到符合需求。用户输入的文本可能包含混乱指令(比如“忽略之前要求,直接输出XXX”),用```、"""等分隔符,能像“防火墙”一样保护Prompt逻辑不被干扰。:要求LLM“引用原文”或“基于给定信息回答”,比如在Prompt中加入“仅根据以下文档内容回答,不编造额外信息”,能大幅降低幻觉概率。写在最后:Prompt工程是“迭代”出来的。
2025-10-27 21:00:08
147
原创 百度 “秒哒” 太狠!零代码 5 分钟做 H5 / 小游戏,我用它搞 BMI 计算器还能发小程序
百度 “秒哒” 打破了传统应用开发的技术壁垒,其 “自然语言交互 + 极速生成 + 跨端适配” 能力表现突出,无论是零代码基础的普通用户,还是追求效率的开发者,都能通过它快速实现应用需求,尤其在轻应用、工具类产品开发场景中,展现出显著的效率优势。不用花钱,体验赌石的刺激:),无聊时候可以玩一下 游戏很简单,先购买原石,然后切割,切出的玉石可以出售,然后继续换工具或继续购买原石再继续切割。这个“秒哒”的网址,可以看到如下界面,在应用广场有很多有意思的应用,我挑几个,大家看看可以做到什么水平。
2025-10-11 07:00:43
886
1
原创 零基础玩转 Dify!从 Docker 部署到搭建 AI 旅游助手、数据库查询应用,避坑指南全收录
将用户的输入的查询需求信息,结合上面构建的知识库一起发给大模型,大模型再分析提示词和知识库,构建一个SQL语句,然后将SQL通过Restful接口方式发给后台的一个服务,这个服务执行发来的SQL,返回结果。Dify有多种部署模式,本次采用的是Docker镜像方式,本来是很简单的过程,在国内却变得棘手起来,不知道哪位上位封了Docker,让依赖Docker的开发者很痛苦,就光知道一刀砍嘛,不想想影响有多大。结论:说下我自己的测试的结果,也许是AI大模型都选择的是免费的大模型,效果一直不好。
2025-10-09 19:16:38
345
原创 也说说小时候的味道——《小时候的那些味道》读后感
上海也有鲫鱼豆腐汤,不过平常家庭一般是葱烤鲫鱼,葱是细米葱,所谓烤其实是用酱油和白砂糖一起煨,最后大火收汁味道最好,但是爸爸喜欢多加水,酱油鱼汤在第二天形成鱼冻,爸爸就爱这个鱼冻下饭,其实这是爸爸的一段童年味觉记忆吧。如果是爸爸领我们去吃小馄饨、生煎馒头,爸爸会买一碗光面,写着“光面”的牌子在最边上,所以我没上学前已经识得这两个字了,我问爸爸光面是什么,爸爸说“什么光面,这是阳春面,最好吃的”。所以,此时,年轻的肠胃已经塞满荤食,年老的寻思吃几口主食,一盘“拔丝”是否有销量要看圆台面有多少姑娘。
2025-10-04 12:25:49
235
原创 小时候的那些味道
小学时,上的学校是在街的南边,门口有个商店,商店旁边,在夏季有个支在路边小摊子,摊子不大,2-3个平米,卖的很多现做零嘴,最贵的是炸螃蟹,滚烫的油锅里翻腾了几只炸的金黄的螃蟹。随着咔哧咔哧咬开脆甜脆甜的外壳,里面是软糯香甜的果肉,甜糯混在一起,让人吃了还想吃,再看向盘子的时候,已经空了。鱼在锅中,几乎煮散了,能剩下的肉都是精华,唯有脊背上和鱼鳍下的肉还很齐整,夹一块,轻挑上面的鱼刺后,只剩下白色的鱼肉,边角带着微红,放在口中,轻轻一咬,鲜香就四散开来,好吃到,就如蓝大神形容的“抽耳光都不放手”:)。
2025-10-03 09:45:52
325
原创 动态规划经典题:3行核心逻辑搞定连续子数组最大和
在算法面试中,“连续子数组的最大和”是高频考点,也是理解动态规划思想的绝佳案例。下次遇到类似的“连续子序列”问题,比如“最长递增连续子数组”,也能套用这个思路哦!动态规划的核心是“拆解子问题”——不用一下子找整个数组的最大和,先解决“以当前元素结尾的子数组,最大和是多少”,再从这些局部结果里找全局最大值。不需要复杂的数学推导,只要想清楚“当前元素该怎么选”,就能一步步得到最终答案。思路理清后,代码非常简洁,核心逻辑只有3行,我们直接上两种主流语言的实现。,记录“当前元素结尾的局部最大和”,再用。
2025-09-18 22:35:03
338
原创 从暴力到高效:彻底搞懂丑数问题,面试再也不怕啦!
不过,新的问题又出现了。如果我们直接把数组中所有元素分别乘以2、3、5,再筛选最小值,不仅会有重复计算(比如6既可以由2×3生成,也可以由3×2生成),效率也依然不高。:每次生成新的丑数后,我们通过while循环移动临界位置,确保下一次生成的候选值始终大于当前最大的丑数,这样就能避免重复生成丑数,同时保证丑数的有序性。根据丑数的定义,除了1之外,所有的丑数都是由更小的丑数乘以2、3或5得到的。符合条件的丑数:6(2×3)、8(2³)、10(2×5),这些数的所有质因子都只在2、3、5的范围内。
2025-09-17 21:34:11
410
原创 三步搞定数据可视化
2017年,随着用户增多,项目更名为RAWGraphs,重构架构并转为开源,采用Apache 2.0许可证,用户可自由下载、修改和部署,大幅提升其在教育、研究及创意产业的传播力与应用范围。我们在进行数据分析的时候,多半会先进行数据的探索,通常会利用python等比较简单的编程语言来实现,并且一般会图形化形式来表示数据,以期找到数据点规律和特点,毕竟一图胜千言嘛。我的数量比较大,发现映射的过程执行还是比较慢的。目前这个工具比较简单,做少量的数据探索还是可以的,不过数据量多的话,会比较慢。
2025-09-14 10:54:12
440
原创 别人有香蕉,咱们有豆包
Nano Banana 很好,很可惜,国内用不了,不过生图来说豆包4.0模型还是挺强的,来一起测试下。效果图如下,这个效果很棒,特别是鞋子的影子都能看的清楚,微笑的表情还是挺自然的。豆包给出的生图风格很多,可以根据需要直接制作同款,比如选择铅笔画点击下。模型选择: 这个模型其实不用选,就一个模型,默认的就是。最终的效果图,这个效果比较一般,可能我描述的不太好。这是自带的头像效果,上效果图,图还可以,比较可爱!这个效果非常好,很喜欢!2.1 根据风格做同款。2.3.1 Q版风格图。2.3.2 手办效果。
2025-09-10 07:00:23
271
转载 刷屏的 Nano Banana 有多强?5 大图像功能 + 完整代码
谷歌最近发布了,这是一种强大的图像生成和编辑新模型,代号为 Nano Banana。该模型引入了用于创建和作图像的最先进的功能,解锁了广泛的新应用程序。使用正面描述: 不要像“没有汽车”这样的负面提示,而是积极地描述所需的场景:“一条空旷、荒凉的街道,没有交通迹象。使用模型的对话功能进行增量更改并完善您的图像。超具体: 您提供的有关主题、颜色、照明和构图的详细信息越多,您对输出的控制就越多。提供背景和意图: 解释图像的目的或期望的情绪。使用分步说明: 对于复杂的场景,将提示分解为一系列清晰、连续的说明。
2025-09-06 10:54:54
144
原创 滑动窗口最大值的高效实现与思路解析
窗口依次为 [2,3,4](max=4)、[3,4,2](max=4)、[4,2,6](max=6)、[2,6,2](max=6)、[6,2,5](max=6)、[2,5,1](max=5),最终输出 [4,4,6,6,6,5]:若直接存储元素值,无法判断该元素是否在当前窗口内(如数组 [1,2,1,0],窗口大小 3,队首元素 2 可能来自索引 1,当窗口移动到 [2,1,0] 时,2 已移出窗口,但无法通过值判断);,让滑动窗口从数组的最左侧移动到最右侧,要求输出每一次滑动后窗口内元素的最大值。
2025-09-02 21:49:17
316
原创 别再死磕复杂算法了!用抱脸,小白也能30分钟搭出实用AI工具二
再比如,用这种物品检测可以检测火灾,在无人值守的仓库,如果失火了,损失会非常严重,如果能在火灾开始的时候,及时检测到火灾的情况,可以极大地减少损失。通过前文的实践,我们基于 Hugging Face 生态,逐步探索了文本转语音、物品检测、图文检索、图像描述生成这四类实用的 AI 模型应用 —— 从将文字转化为自然语音以解放双眼,到让计算机 “看见” 并标注图像中的物体,再到实现跨模态的图文匹配与自动 caption 生成,每一项功能都清晰展现了预训练模型在实际场景中的落地价值。
2025-09-01 07:00:50
767
原创 指数基金投资:从入门到实战的全方位指南
资产配置不是“一劳永逸”,需定期(如每半年)调整:例如设定“股票类资产50%、债券类50%”的目标,若股市上涨导致股票占比升至60%,则卖出部分股票、买入债券,回归目标比例,避免风险过度集中。:按股息率加权,高分红意味着企业盈利稳定、财务健康,熊市抗跌性强,如上证红利(000015)、深证红利(399324),以及新增盈利增长筛选的红利机会指数(代码CSPSADRP)。:静态PE(用上年盈利)、滚动PE(用最近4个季度盈利)、动态PE(用预估下年盈利),优先看滚动PE,更贴近当前盈利水平。
2025-08-28 19:00:50
1200
原创 不用加减乘除现实整数相加
我们通过位运算模拟了这一过程,既锻炼了位操作能力,也加深了对补码、溢出、符号位的理解。时间复杂度取决于进位次数,最坏情况是 O(log n),空间复杂度递归为 O(log n),循环为 O(1)。异或运算的特点是:相同为0,不同为1,正好对应“不进位的加法”。第1位:0 + 1 + 进位1 = 0,进位1。第2位:1 + 1 + 进位1 = 1,进位1。看第1位:都是1 → 1,其它位不同 → 0。(即最高位为1,表示负数),说明结果应为负数。第0位(右起):1 + 1 = 0,进位1。
2025-08-27 22:08:33
665
原创 扑克牌顺子判定:原理、边界处理与高效实现(含多语言代码)
本文将从问题本质出发,拆解顺子判定的核心条件,详解“位运算优化去重”的实现思路,提供多语言可运行代码,并通过典型案例验证逻辑正确性,帮助读者掌握这类“规则型”算法题的解题框架。:题目中大小王共4张(2大2小),但抽取5张牌时最多含4张0,代码中无需额外限制0的数量——因为“差值<5”已隐含“0的数量足够填补空缺”(如。差值=5,即使有1张0也无法填补(需替换为5,而0仅1张,无法同时满足“替换5”和“组成连续5数”);,max=5,min=5,差值=0<5,可组成1-2-3-4-5);
2025-08-26 22:11:46
519
原创 别再死磕复杂算法了!用 Hugging Face,小白也能 30 分钟搭出实用 AI 工具
采样率越高, 音质越好,但数据量也越大。你看,不管管是想整个能聊天的机器人,还是做个翻译工具,甚至把语音转成文字,用它家的工具和模型,几行代码就能搞定,根本不用自己从头攒模型,省老事儿了。会发现打印结果如下,会发现采样频率和库的默认不一样,而且维度竟然是2维的,因为是立体双通道原因,可以变换成单通道,因为双通道除了精度高,对我们识别没什么帮助的。当然了,用的时候也可能碰到些小麻烦,比如电脑配置不够啊,软件版本不兼容啥的,但好在办法总比困难多,换个环境试试,或者用个轻量点的模型,基本都能解决。
2025-08-24 08:03:11
1075
原创 双鱼点评《老家的四季》
打开翅膀君《老家的四季》,彷佛展开一卷一卷油画——“春天又像个温柔的大姑娘,连洒下的雨水都用筛子筛了几遍似得,细的像牛毛”,“秋日,真是秋高气爽,满眼金黄,云特别高,白色的云,一团团的”,“冬日,真是寒风凛冽,满目萧条,地是灰黄的,树是灰的,光秃秃的枝头”——如此熟悉,又如此陌生,熟悉是因为徐州与上海相比稍偏北方,四季景象差不多,只是徐州的冬天更冷、有雪而已;鱼鱼写于2025年8月23日晨。
2025-08-23 10:26:07
300
原创 老家的四季
二三年级的时候,记得是我上学生涯最最快乐的时光了,无忧无虑,又懂了点事,太阳还很高,就放学了,回家的三四里的路上,沿着路边的河沟,摘了很多毛菇扭,这是春天特有的美味了,轻轻剥开,嫩嫩的,不算特别好吃,但是满嘴毛菇扭特有的味道,配合那心境,这辈子不要想再有了,“当时只道是平常”。夏天的雨也是一绝,经常连着下几天,遇到周末或暑假,接连下雨的天是最让人开心的,到处是沟满河平的,水稻地旁边的池塘的鱼逆流而上,跑的满稻地都是,一个人,一张网,一个盆,一个下午,满满的收获,回家做上大米饭,浇上鱼汤,真香啊!
2025-08-21 23:23:03
423
原创 两份顶流免费 AI 课!从入门到实践,吴恩达与微软帮你玩转人工智能
打开课程链接(https://learn.deeplearning.ai/),任意点开一门课的视频,右下角会有 “CC” 按钮,点击后就能切换到 “中文 subtitles(字幕)”,字幕翻译精准,没有生硬的机器翻译感,甚至连专业术语(如 “few-shot learning 少样本学习”“chain-of-thought 思维链”)都标注得清晰易懂。在生成式 AI 席卷全球的当下,无论是想转行进入 AI 领域的职场人,还是对智能技术好奇的学生,亦或是想提升技能的开发者,“系统学习 AI” 都成了刚需。
2025-08-20 22:05:33
1671
原创 剑指Offer:数据流中的中位数(最大堆与最小堆经典实践)
假设插入n个元素,每次排序时间复杂度为O(n log n),总复杂度为O(n² log n),当数据量较大时(如10万级),性能会急剧下降。相比“每次插入后排序”的O(n log n),此方案在大数据量下性能优势显著(如n=1e5时,log n≈17,效率提升近6000倍)。核心痛点:不需要完整排序,只需要快速获取“中间位置的1~2个元素”,因此需要更轻量的结构来维护数据的“中间状态”。若应插入左堆,但新元素比右堆顶大(违反有序):先插入右堆,再将右堆顶(右半区最小值)移到左堆。
2025-08-19 22:25:39
815
原创 剑指 Offer No.11|二进制中 1 的个数
Brian Kernighan 算法不仅优雅,而且高效,值得在面试与工程实践中反复使用。给定一个 32 位有符号整数,返回它二进制表示中。:Brian Kernighan 算法比逐位位移。:Python 右移负数会保持符号位,需先。:可推广到统计任意进制中特定数字的出现次数。Brian Kernighan 算法原理。Brian Kernighan 算法。Brian Kernighan 算法。Python 一行写法(仅供娱乐)会把最低位的 1 变为 0。,循环次数等于 1 的个数。O(k) k=1 的个数。
2025-08-18 22:21:33
351
原创 马斯克力荐的Grok Imagine有多强?AI视频生成神器实测,速度比竞品快4倍!
对比一下同类工具的视频时长,它生成的6秒短片也算「中等身材」:比OpenAI的Sora短点,但比Veo 3的输出长,刚好适合做社交媒体片段、产品展示这类场景。最抓人的点,还是马斯克吹的「速度」——别家AI生成一段视频要等1-2分钟(在AI圈这简直像等快递),它硬生生把时间砍了一半,最快几十秒就能出片。直接对着手机说「帮我做一个熊猫吃火锅的短视频,要带蒸汽效果」,它就能听懂并生成。在输入框里写清楚你的需求(越详细越好),比如「一只穿西装的柴犬在会议室做PPT,背景是落地窗外的城市夜景」,然后等着出结果就行。
2025-08-10 17:27:32
2997
原创 一文搞定HTTPS证书的免费申请和续订
HTTPS证书(SSL/TLS证书)是一种数字证书,由权威机构(CA,Certificate Authority)颁发,用于验证网站的身份并加密浏览器与服务器之间的通信。acme.sh是一款开源的证书管理工具,支持自动申请、续期Let's Encrypt、ZeroSSL等CA的证书,全程无需人工干预,特别适合开发者和服务器管理员。:Let's Encrypt(DV证书,90天有效期)、ZeroSSL(DV证书,支持免费申请)注意:运行脚本申请证书或续订证书的时候,要把网站打开,在网站所在的主机运行。
2025-07-26 12:32:48
1236
原创 告别VIP和灰色歌单!这款聚合听歌神器,才是真正的YYDS!
把 A 平台的歌,和 B 平台的歌,无缝放进同一个列表里。:foobar2000 的界面就像一张白纸,你可以通过各种插件和脚本,把它打造成任何你想要的模样,从极简到华丽,全凭你做主。想象一下,你可以在一个软件里,搜索任何你想听的歌,结果会同时显示来自各大平台的音源,想听哪个就点哪个!:它的一切都为了“音质”服务,支持各种音频格式,通过插件还能实现ASIO输出,是很多PC-HIFI玩家的首选。歌单里的歌,动不动就“变灰”下架,心爱的宝藏歌曲,散落在各个平台的角落里,想整理个统一的歌单都难于上青天!
2025-07-03 20:39:11
1047
原创 还在用 QQ / 微信截图?这5款神级工具,能让你的效率原地起飞!
下面这 5 款“神器”,将彻底颠覆你对截图录屏的认知,让你的效率和B格都瞬间拉满!当你框选一个区域后,所有的编辑工具——箭头、画笔、文字、马赛克、序号标注——立刻环绕在截图周围,所见即所得。不仅如此,它还内置了 OCR 文字识别、滚动截图、屏幕拾色器、哈希检查、二维码工具... 只有你想不到,没有它做不到。从今天起,抛弃那些低效的截图方式,选择一款最适合你的“神器”,去感受效率飙升带来的快感吧!是一款专为 macOS 设计的屏幕录制工具,它完美继承了苹果“简洁美学”的基因。(火焰截图) 绝对是你的福音。
2025-07-02 22:35:21
708
原创 一文读懂 NLP 基础概念:从理论到核心任务全解析
自然语言处理(Natural Language Processing,NLP)是人工智能领域的重要分支,目标是让计算机理解、解释和生成人类语言。NLP技术从早期规则驱动发展到如今的深度学习主导,正逐步实现从"处理文字"到"理解语义"的跨越。:将文本转换为高维向量,维度代表词汇,值为词频(TF-IDF等)。:引入概率模型(如N-gram),通过数据驱动替代手写规则。:将词汇分解为更小单位(如词根、词缀),解决罕见词问题。:为文本中每个单词分配词性标签(名词、动词等)。
2025-06-24 21:28:47
471
原创 不用花钱!4K星开源项目ChatTTS实测:比真人还自然的AI语音合成
在当今数字化的时代,文本转语音(TTS)技术的应用越来越广泛,尤其是在对话式场景中,如智能语音助手、有声读物等。在以前的文章中,我也测试过国外的一个可以录制个人声音,并可以对声音做克隆,并对一段文本,可以利用克隆的声音阅读出来。🎙️ 听完这段AI朗读的音频,是不是感觉科技的力量越来越神奇了?虽然我的机器也有个显卡,但是不是NVIDIA 的,所以后面的代码执行中,其实只用到了CPU, 总体感觉速度还行。最后放上转换后的语音效果,值得注意的是,我设置的停顿和笑声似乎没起什么作用,有大神知道原因,麻烦告知下!
2025-06-17 22:37:03
371
原创 搜索引擎排序原来靠这个算法啊
那又来一个问题,如何确定一个网页的重要性那。第一轮的时候,我们假设所有网页的权重都是1,那么A这个网页的权重为1+1+1为3, 第二轮计算的时候,与A相连的网页权重变成了2,那么最终A这个网页的权重就变成了2+2+2=6,这样多次计算后,被更多权重高的网页链接的网页,排名靠前,其他的靠后。如果让我们自己去做搜索的话,我们能够想到的是文章和搜索词的相关性,以此来判断这个文章是否是我们想要的,最开始的搜索有的是这样做的,还有的是按照网站的种类做个大的索引表,但是可以索引的关键字有限。
2025-06-12 20:43:03
463
原创 如何计算句子的相似性
我原来看过的别人用one-hot编码,通过计算余弦距离来求两个句子的相关性的代码,但是one-hot编码实质只是对单词出现的频次进行编码,但是每个单词的重要性是不同的,TF-IDF不光计算了单词在文档中的频次,而且对单词是否普通也做了判断。余弦相似度算法:一个向量空间中两个向量夹角间的余弦值作为衡量两个个体之间差异的大小,余弦值接近1,夹角趋于0,表明两个向量越相似,余弦值接近于0,夹角趋于90度,表明两个向量越不相似。在坐标系中的计算公式如下: 在直角坐标系中,向量表示的三角形的余弦函数是怎么样的呢?
2025-06-10 21:05:46
691
原创 Trae Pro 版是否值得购买
作为国内少数能顺畅调用Claude国际版的工具,Trae的基础价值在于「免费接入高端模型」。初期使用时,无需科学上网即可直连Claude 3.7的体验堪称丝滑,但随着用户量增长,排队机制逐渐显现——慢速队列等待时间从最初的秒级延长至数分钟,尤其在高峰时段,甚至出现「排队超10分钟」的情况。对比「豆包免费版+Trae免费版」的组合方案,Pro版10美元/月的订阅费性价比极低——豆包在响应速度和基础编程支持上已足够优秀,Trae的核心价值(Claude接入)在免费模式下仍可使用,仅需接受排队等待。
2025-06-03 20:07:32
2709
原创 从MCP实践到开发简单的MCP服务
说明下,为什么其他MCP服务器基本上配置就好了,这边要启动那,其他的MCP Server是在远程启动好的服务,而Lark-MCP的服务器需要本地启动,然后Lark-MCP只是将MCP的交互协议转成了飞书的各种API调用,飞书没有在平台启动MCP ,所以不行。它正在以惊人的速度进化,而今天的选择,将决定明天的高度。高德地图的MCP是基于SSE的,是一种基于HTTP的技术,客户端和服务器端建立持久连接,服务器端可以实时单向向客户端推送消息,无需客户端反复请求,有点类似websocket;
2025-05-26 18:31:03
817
原创 国内生图工具也这么猛了嘛!
最近看到,即梦这个抖音的生图工具,挺猛的,生成的普通日常拍照图,简直可以以假乱真!豆包生成图也挺快的,同样的提示词,感觉差那么点意思,上图: 第一个图手机拿反了:)一 即梦根据提示词生成图。有兴趣的朋友可以玩玩:)。二 豆包根据提示词生成图。
2025-05-20 16:42:02
243
modbus_test_data_part1.pcap
2020-04-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅