你真的会学习“机器学习”吗?“机器学习”该怎样学?(转载)

本文针对开发人员,提供了一种从实践出发的学习机器学习方法。通过构建项目,如文本自动完成器或车牌识别器,读者可以逐步掌握机器学习的实用技能。文章推荐了fastai课程作为学习资源,并鼓励读者通过实际操作来理解不同模型和ML基础设施。

全文共1956字,预计学习时长6分钟

来源:Pexels

免责声明:以下内容基于笔者对机器学习团队的观察,并非对行业的学术调查。

作为人工智能的核心,机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

如果读者是开发人员,那么可能对机器学习至少有一点兴趣。

“嗯……能够自学预测的算法,这个概念有点……酷。”

然而,如果你真的循规蹈矩去学机器学习,很有可能会在花两周时间学习线性代数和多变量微积分后萌发想要放弃的念头。

这是因为大多数机器学习的入门材料并不是面向开发人员,而是机器学习的研究人员。

因此,对于那些只想用机器学习构建产品的开发人员来说会比较头疼。

想打造产品,还是做研究?

在21世纪末之前,机器学习或多或少只是一个研究问题。道理很简单,没有多少公司在生产中以有价值的方式使用机器学习。

因此,很多机器学习的入门材料都是从这个研究角度来探讨的。它首先从数学角度解释神经网络,解释ML背后的所有理论,比如反向传播和对立网络。

某种程度上来说,非大学附属材料甚至也遵循这种模式。例如,直接取自TensorFlow的“初学者快速入门”:

来源:TensorFlow

如果已经熟悉机器学习背后的数学理论,或者对学习它感兴趣,这种方法就是可行的。然而,如果想主要使用机器学习来构建东西,那它可能不合适。

将编程作为推论使用,这种方法好比通过先学汇编来学习写代码。几乎没有开发人员会这样学习。

注意:如果读者确实通过学汇编学会了代码,那么笔者接受愤怒的评论,并且对读者在运行晦涩的Linux发行版上安装浏览器印象深刻。

学会编码后,读者很可能通过使用高级语言编写hello world实现。然后,随着引入项目一点点复杂,便可根据需要学习越来越多的低级编程。

这种学习模式在软件构建师中很有成效,因为它能优化构建,如果读者对构建推荐引擎比发表论文更感兴趣,下面就是应如何学习ML。

怎样通过构建软件学习ML

来源:Pexels

如果读者是那种通过课程学习最容易取得成效的人,那么能接触到的最好的资源,可能还有这种自上而下、边做边学模式的最积极倡导者,就是fastai的面向(程序员实践深度)课程。

本文不旨在成为fastai的大广告,但可以说,其创始人杰瑞米·霍华德和瑞秋·托马斯组织的几门课程,已经通过让学习者实际构建,深入研究当前构建项目相关的基础理论,再教授开发者深度学习。

或者,如果读者是那种通过自己动手做事情学习得最好的人,那么开始机器学习和其他编程领域是一样的。选一个听起来很有趣的项目加入,笔者在这里列出了初学者友好型NLP项目的列表。

假设读者以这种方式学习,熟悉使用ML构建的好方法是:

  1. 确定目标,比如建立一个文本自动完成器或者车牌识别器。

  2. 找到适合项目的预先训练好的模型,GPT-2或YOLOv3将分别适用于前面提到的项目。

  3. 如果喜欢,甚至可以使用像gpt-2这样的库来微调(根据数据定制)模型。

  4. 最后,将模型部署为微服务。

一旦将模型部署为一个API,它就可以像查询任何其他网络服务一样查询,并围绕它构建应用程序。

实际上可以在 这个项目中看到该过程的实际应用,它是由一个涉及ML的工程师创建的。

通过这种方法,可以了解不同的流行模型体系结构和机器学习方法,以及它们适用于哪些应用程序。了解ML基础设施同样重要,而这对于从模型中构建实际产品至关重要。

一旦可以使用机器学习来构建,就要学习这个理论

如果读者是一名工程师,就可能已经有了某种形式的认证,这意味着 读者已经散列了密码(笔者希望如此)。

设置密码散列时,是否编写了自定义散列算法?花了几周时间学习密码学吗?还是刚才用 bcrypt?

类似地,构建第一个网络应用程序时,花了几周时间学习数据库吗?从头开始写的吗?或者是否使用了最喜欢的框架附带的ORM?

来源:Pexels

同样的逻辑也适用于机器学习。

如果读者是那种喜欢构建软件的人,从使用机器学习构建软件开始,让工具、预先训练好的模型和ML框架抽象出潜在的ML理论。

如果读者仍很好奇或者是项目需要更多的复杂性,那就深入挖掘机器引擎盖下的东西,分析它是如何工作的。

原文链接:https://blog.youkuaiyun.com/duxinshuxiaobian/article/details/105578118?utm_medium=distribute.pc_feed.none-task-blog-alirec-17.nonecase&depth_1-utm_source=distribute.pc_feed.none-task-blog-alirec-17.nonecase

内容概要:本文是一份针对2025年中国企业品牌传播环境撰写的《全网媒体发稿白皮书》,聚焦企业媒体发稿的策略制定、渠道选择与效果评估难题。通过分析当前企业面临的资源分散、内容同质、效果难量化等核心痛点,系统性地介绍了新闻媒体、央媒、地方官媒和自媒体四大渠道的特点与适用场景,并深度融合“传声港”AI驱动的新媒体平台能力,提出“策略+工具+落地”的一体化解决方案。白皮书详细阐述了传声港在资源整合、AI智能匹配、舆情监测、合规审核及全链路效果追踪方面的技术优势,构建了涵盖曝光、互动、转化与品牌影响力的多维评估体系,并通过快消、科技、零售等行业的实战案例验证其有效性。最后,提出了按企业发展阶段和营销节点定制的媒体组合策略,强调本土化传播与政府关系协同的重要性,助力企业实现品牌声量与实际转化的双重增长。; 适合人群:企业市场部负责人、品牌方管理者、公关传播从业者及从事数字营销的相关人员,尤其适用于初创期至成熟期不同发展阶段的企业决策者。; 使用场景及目标:①帮助企业科制定媒体发稿策略,优化预算分配;②解决渠道对接繁琐、投放不精准、效果不可衡量等问题;③指导企业在重大营销节点(如春节、双11)开展高效传播;④提升品牌权威性、区域渗透力与危机应对能力; 阅读建议:建议结合自身企业所处阶段和发展目标,参考文中提供的“传声港服务组合”与“预算分配建议”进行策略匹配,同时重视AI工具在投放、监测与优化中的实际应用,定期复盘数据以实现持续迭代。
先展示下效果 https://pan.quark.cn/s/987bb7a43dd9 VeighNa - By Traders, For Traders, AI-Powered. Want to read this in english ? Go here VeighNa是一套基于Python的开源量化交易系统开发框架,在开源社区持续不断的贡献下一步步成长为多功能量化交易平台,自发布以来已经积累了众多来自金融机构或相关领域的用户,包括私募基金、证券公司、期货公司等。 在使用VeighNa进行二次开发(策略、模块等)的过程中有任何疑问,请查看VeighNa项目文档,如果无法解决请前往官方社区论坛的【提问求助】板块寻求帮助,也欢迎在【经验分享】板块分享你的使用心得! 想要获取更多关于VeighNa的资讯信息? 请扫描下方二维码添加小助手加入【VeighNa社区交流微信群】: AI-Powered VeighNa发布十周年之际正式推出4.0版本,重磅新增面向AI量化策略的vnpy.alpha模块,为专业量化交易员提供一站式多因子机器学习(ML)策略开发、投研和实盘交易解决方案: :bar_chart: dataset:因子特征工程 * 专为ML算法训练优化设计,支持高效批量特征计算与处理 * 内置丰富的因子特征表达式计算引擎,实现快速一键生成训练数据 * Alpha 158:源于微软Qlib项目的股票市场特征集合,涵盖K线形态、价格趋势、时序波动等多维度量化因子 :bulb: model:预测模型训练 * 提供标准化的ML模型开发模板,大幅简化模型构建与训练流程 * 统一API接口设计,支持无缝切换不同算法进行性能对比测试 * 集成多种主流机器学习算法: * Lass...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值