
人工智能
文章平均质量分 84
包含机器学习、深度学习等。
隐私无忧
华为技术有限公司 安全专家,专注信息安全、人工智能领域。
展开
-
自然语言处理(1)—— 语言的本质
人工智能时代,大语言模型层出不穷,但语言的本质是什么呢?本文深入探讨了语言(包括语言和文字)的本质。原创 2025-03-05 20:51:10 · 1621 阅读 · 0 评论 -
自然语言处理(2)—— NLP之百年风雨路
自然语言处理(NLP)的发展史是一部人类试图用机器理解自我的探索史。从20世纪中叶至今,这项技术经历了四个关键阶段,每个阶段都折射出人类认知方式的重大转变。原创 2025-03-17 21:59:17 · 839 阅读 · 2 评论 -
自然语言处理(6)—— 中文分词
汉语词汇是语言中能够独立运用的最小的语言单位,是语言中的原子结构。由于中文缺乏类似英文的空格分隔,分词的准确性直接影响后续任务(如机器翻译、情感分析)的效果。因此,对中文进行分词就显得至关重要。原创 2025-03-22 09:38:41 · 1328 阅读 · 0 评论 -
打造技术文档的“航海宝典”:在代码海洋里导航的艺术
技术文档不仅是知识传承的载体,更是团队协作的桥梁,它在产品成功的背后扮演着至关重要的角色。本文将详细介绍如何撰写一份优秀的技术文档,帮助你成为技术文档撰写的专家。原创 2024-12-07 19:55:15 · 473 阅读 · 0 评论 -
再见,蓝色巨人
近日,IBM中国宣布撤出在华的两大研发中心,这一消息在IT行业内掀起了轩然大波。这一决定不仅直接影响了数百名IT从业者的职业命运,更引发了我们对全球化背景下中国IT产业竞争力和未来发展方向的深刻思考。原创 2024-09-16 19:28:43 · 1570 阅读 · 5 评论 -
让效率飞升的秘密武器:解锁编程高效时代的钥匙
在快节奏的IT行业中,开发者们面对的是日益复杂的项目需求、不断更新的技术栈以及紧迫的交付期限,选择合适的编程工具不仅关乎个人的工作效率,更是团队整体竞争力的体现。原创 2024-09-13 21:16:29 · 706 阅读 · 0 评论 -
全能还是专精?探索“草莓”AI与未来AI市场的双轨并行
近日,OpenAI宣布将在秋季推出代号为“草莓”的新AI模型,这一消息如同春风拂面,不仅因为其从数学殿堂迈向了营销创意的广阔天地,更因为它触及了一个深刻的话题:全能型AI与专业型AI,谁将主导未来的市场与人心?原创 2024-09-02 01:00:35 · 711 阅读 · 0 评论 -
国产游戏崛起:以《黑神话:悟空》为镜的未来展望
《黑神话:悟空》以其惊艳的画面、深邃的文化底蕴和前沿的技术应用,不仅在国内引发了巨大轰动,更在国际舞台上赢得了无数赞誉,成为了国产游戏的一张闪亮名片。原创 2024-09-02 00:52:47 · 1550 阅读 · 0 评论 -
全面解读视频生成模型Sora
2024年2月15日,OpenAI在其官网发布了《Video generation models as world simulators》,提出了作为世界模拟器的视频生成模型Sora。原创 2024-02-20 19:28:30 · 4893 阅读 · 75 评论 -
编程界的“魔术师”:Python中的一行代码艺术
Python作为一种高级编程语言,其简洁明了的语法使得它成为“一行代码魔术师”们的首选工具。本文通过20个Python实例来展示这些魔术师的神奇之处。原创 2023-12-30 21:20:21 · 1987 阅读 · 24 评论 -
机器学习领域经典书籍推荐
机器学习领域的五本经典书籍推荐。原创 2023-11-05 15:14:27 · 6811 阅读 · 58 评论 -
贝叶斯与认知——读《贝叶斯的博弈》有感
贝叶斯公式通过简洁的数学形式,将人类的基本感知与高级推理相结合,定义了人类对世界的认知过程。根据贝叶斯公式,我们不断获取有效的知识,英国靠它破译二战德军密码,医疗业靠它辅助诊断,银行业靠它发放贷款,互联网靠它推荐商品,而人工智能更是靠它实现了飞跃原创 2023-07-06 22:02:19 · 5571 阅读 · 122 评论 -
Python小技巧:蛇形方阵
本文介绍了使用python实现数字蛇形方阵,包括顺时针和逆时针。原创 2023-05-11 20:05:54 · 3084 阅读 · 13 评论 -
Python小技巧:判断输入是否为汉字/英文/数字
判断输入是否为汉字/是否为数字的python实现。原创 2023-04-01 22:28:33 · 7207 阅读 · 6 评论 -
自然语言处理(5)—— 词频统计及Python实现
词频统计是自然语言处理的基本任务,针对一段句子、一篇文章或一组文章,统计文章中每个单词出现的次数,在此基础上发现文章的主题词、热词。本文介绍了词频统计的基本方法,并配有代码实现。原创 2023-03-25 15:58:15 · 4254 阅读 · 0 评论 -
Kaggle实战入门:泰坦尼克号生还预测(进阶版)
泰坦尼克号生还预测是机器学习领域著名的数据科学竞赛平台kaggle的入门经典,本文对该数据的处理、分析、训练、预测进行了全流程介绍。原创 2023-03-21 20:51:35 · 3329 阅读 · 68 评论 -
Python快速入门:类、文件操作、正则表达式
本文概略介绍了Python类、文件操作及正则表达式的基本使用。原创 2023-03-19 17:20:37 · 1792 阅读 · 5 评论 -
Kaggle实战入门:泰坦尼克号生还预测(基础版)
泰坦尼克号生还预测是机器学习领域著名的数据科学竞赛平台kaggle的入门经典。本文对该数据的处理、分析、训练、预测进行了全流程介绍。原创 2023-03-17 20:03:13 · 6052 阅读 · 46 评论 -
Python数据分析(五)—— 一文搞懂Python时间序列
时间序列(Time Series)是一种重要的结构化数据形式,本文详细介绍了使用Python对时间序列进行处理。原创 2023-02-27 19:58:02 · 3806 阅读 · 12 评论 -
自然语言处理(3)—— 自然语言处理的21个基本概念
本文介绍了自然语言处理中的21个基本概念,包括语言、词、分词、词法分析、句法分析、语义分析等。原创 2020-08-15 22:09:52 · 7154 阅读 · 0 评论 -
Gehpi的网络布局
Gephi的布局模块(Layout)可根据某种策略按照需要对节点和边进行排布,使图形既具有合理性,也易于视觉识别。布局算法是Gephi的核心,默认提供12种布局算法,包括力引导布局、辅助编调整布局。原创 2023-02-26 09:51:04 · 6076 阅读 · 25 评论 -
自然语言处理(7)—— 词袋模型:概念及python实现
词袋模型(Bow,Bag of Words)不考虑文本中词与词之间的上下文关系,仅仅只考虑所有词的权重(与词在文本中出现的频率有关),类似于将所有词语装进一个袋子里,每个词都是独立的。生成文本的词袋模型分为三步:- 分词(tokenizing)- 统计词频(counting)- 特征标准化(normalizing)原创 2020-07-05 18:38:25 · 13857 阅读 · 0 评论 -
自然语言处理(8)—— TF-IDF:概念与python实现
TF-IDF(Term Frequency - Inverse Document Frequency)表示“词频-逆文本频率”。词频(TF,Term Frequency )表示给定词语在文件或语料中出现的频率(归一化以屏蔽长短文件的差异);逆文本频率(IDF,Inverse Document Frequency)是一个词语重要性的度量。原创 2020-07-05 18:53:14 · 3399 阅读 · 0 评论 -
Gephi快速入门
Gephi被称为“数据可视化领域的Photoshop”,是一款开源免费跨平台基于JVM的复杂网络分析软件,本文介绍Gephi的基本使用,方便大家快速开展网络分析。原创 2023-02-24 20:29:55 · 7735 阅读 · 21 评论 -
Python快速入门:Python对象
本文介绍了Python的五大常用对象:列表(list)、字典(dict)、集合(set)、字符串(string)、元组(tuple)。原创 2023-02-18 22:41:56 · 2357 阅读 · 15 评论 -
Python小技巧:罗马数字转阿拉伯数字
一个python小程序:实现罗马数字转阿拉伯数字原创 2023-02-13 23:05:08 · 1893 阅读 · 11 评论 -
Python小技巧:计算素数个数
素数(prime number)也叫质数,为大于1的且除1和本身以外不再有其他因数的自然数,与之相对的是合数,素数有无限个,本文使用Python实现计算小于N的素数个数。原创 2023-02-11 10:05:51 · 6957 阅读 · 17 评论 -
隐秘而伟大——纪念图灵诞辰110周年
艾伦·麦席森·图灵(Alan Mathison Turing,1912年6月23日-1954年6月7日),英国数学家、逻辑学家,被称为计算机科学理论之父、人工智能之父,今天正好是其110周年诞辰。《科学美国人》曾这样评价图灵的一生:“个人生活隐秘又喜欢大众读物和公共广播,自信满怀又异常谦卑。一个核心的悖论是,他认为电脑能够跟人脑并驾齐驱,但是他本人的个性却是率性而为、我行我素、无法预见,一点也不像机器输出来的东西。”...原创 2022-06-23 07:45:00 · 1597 阅读 · 2 评论 -
Word2Vec简明教程:入门、原理及代码实现
2013年,Google团队发表了word2vec工具,可以将所有的词向量化,这样就可以定量的去度量词与词之间的关系,挖掘词之间的联系。本文简要介绍了skip-gram(跳字模型)与CBow(连续词袋模型)的原理以及两种高效训练方法Negative Sampling(负采样)和Hierarchical Softmax(层次Softmax),并给出了具体事例以及代码实现。原创 2020-08-13 21:57:48 · 10345 阅读 · 22 评论 -
自然语言处理(4)—— 语言模型
语言模型(Language Model)通过对句子的上下文特征进行数学建模,来回答一个问题:出现的句子是否合理。 语言模型是自然语言的基础,广泛应用于机器翻译、语音识别、拼写纠错、输入法、手写体识别等。原创 2020-07-05 18:13:13 · 2035 阅读 · 0 评论