稀缺计算资源如何塑造机器学习优化专家

稀缺计算资源如何塑造Carlos Huertas的职业生涯

在墨西哥蒂华纳读大学时,Carlos Huertas观看《钢铁侠》时对一个角色特别着迷:J.A.R.V.I.S.,这个嵌入托尼·斯塔克装甲中的管家式人工智能助手。尽管只是电影,Huertas知道这预示着实生活中的潜力。

当时他正在下加利福尼亚自治大学攻读计算机工程学士学位。受到J.A.R.V.I.S.令人印象深刻的沟通能力启发,Huertas决定在同一所大学攻读自然语言处理硕士。

用更少资源做更多事

硕士课程充满挑战,因为NLP需要大量硬件资源,而当时Huertas无法获得这些资源。

“那时候,你需要大型机器来实现有趣的事情,但我没有,”他说,“我们的设施非常简陋,只有普通的消费级电脑,所以很难赶上那些拥有更多资源的人所做的事情。”

有限的计算资源迫使他跳出框架思考,开发创造性解决方案来用更少资源做更多事。这一挑战激发了他的热情,在攻读博士学位时,他转向了机器学习优化领域,特别是高维空间的特征选择。

特征选择技术

这个机器学习领域涉及设计算法,帮助机器仅关注与特定任务相关的特征。特征选择的一个使用例子是“猫狗分类”图像分类任务,这是一个经典的机器学习入门项目,涉及将照片分类为包含狗或猫。

这些动物有许多特征,如颜色、身高、体重、尾巴、鼻子形状和眼睛颜色。人类利用他们对世界的知识来理解什么有助于区分它们。例如,大小可能很重要,因为大多数狗往往更大,但尾巴可能不是很有用,因为两种动物都有。

“我们如何确保机器自己学习这一点?特征选择是帮助计算机理解某些特征比其他特征更重要的过程,这样它就可以专注于最重要的东西,在没有太多计算能力的情况下实现相似甚至更好的性能水平,”Huertas说。

用机器学习解决客户问题

Huertas在亚马逊的工作中经常应用特征选择。

买家风险防范团队负责确保亚马逊商店对客户和销售伙伴安全可靠。

“本着我们主要领导原则之一’客户痴迷’的精神,我们不断创新,从未停止为所有客户提供最佳体验的努力,”他指出,“为此,我们识别痛点并用技术解决它们。”

为了正确服务客户,亚马逊在2019年创建了一个团队,专注于缓解客户在寻求账户支持时可能面临的问题;这就是Huertas目前领导的团队。该团队开发机器学习解决方案,帮助客户解决账户问题。

“算法将使用人工智能自行审查案例,并为客户确定正确的行动,”他说,“通过这种方式,我们可以提供更快的支持。”

随着亚马逊的发展,数据量和系统复杂性也在增加。在这种情况下,理解哪些特征与确定问题是否合法相关非常重要。

“这与特征选择完美匹配,我们问:‘我们能否更聪明,选择应该关注的内容,使我们的模型在没有可扩展性问题的情况下表现最佳?’”他说。

Kaggle讨论大师

当Huertas还是博士生时,他加入了Kaggle,一个在线数据科学和机器学习社区。他的目标:使用该平台测试他的一些博士想法,看看它们在现实问题中的表现如何。由于他在平台上的频繁互动,他仍然担任许多同行的导师,他拥有“讨论大师”称号,并曾是论坛中最活跃的五位用户之一——在近500万用户中。

“社区一直非常友好,新人会问很多关于如何入门的问题,”他说。

在Kaggle上,公司推广竞赛以解决现实生活中的机器学习问题。

“当你还是学生时,这特别有用,因为在学术界你不会接触到亚马逊可能拥有的那种问题。无需在那里工作就能接触这些问题,真的有助于你发展技能,”Huertas说。

在其中一次竞赛中,当Huertas还是博士生时,他在全球数千名科学家中进入了前9名。他回忆说,他当时用的是一台“几乎无法运行超过浏览器的”笔记本电脑。这次经历教会了他很多关于约束如何能够赋予力量的知识。

“它迫使我开发自己的软件包。在这个过程中,我了解了幕后的工作原理,”他说。他指出,当人们拥有大量计算能力时,他们可能会忘记优化的重要性,并依赖许多可能像黑匣子一样操作的预构建软件包。

“当你不理解幕后发生的魔法时,很难超越这一点,”他说。

给年轻科学家的建议

他给年轻科学家的建议是始终在现实环境中实践你在学术界学到的东西。他将其与运动相比较:你可以阅读几本关于足球的书,但如果你从未踢过球,踢球将会非常困难。

“将理论付诸实践非常重要,”他说,“如果你还在攻读博士学位,有像Kaggle这样的平台会为你提供数据,以便你可以练习技能。到你完成学业时,你将拥有两到三年在该领域的技术经验,处理实际问题。这将带你走得很远。”
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值