
2015年度
miniAI学堂
人工智能 学习与分享
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第07章 从文本提取信息
第07章 从文本提取信息7.1 信息提取信息提取结构7.2 分块名词短语分块标记模式探索文本语料库加缝隙块的表示:标记与树7.3 开发和评估分块器读取IOB 格式与CoNLL2000分块语料库简单评估和基准训练基于分类器的分块器7.4 语言结构中的递归用级联分块器构建嵌套结构树树遍历7.5 命名实体识别7.6 关系抽取7.7 小结import nltk, re, pprint回答下列问题:...原创 2019-01-17 11:29:14 · 1064 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第05章 分类和标注词汇
第05章 分类和标注词汇5.1 使用词性标注器5.2 标注语料库表示已标注的标识读取已标注的语料库简化的词性标记集名词动词形容词和副词未简化的标记探索已标注的语料库5.3 使用Python 字典映射词及其属性索引链表VS 字典Python字典定义字典默认字典递增地更新字典复杂的键和值颠倒字典5.4 自动标注默认标注器正则表达式标注器查询标注器评估5.5 N-gram 标注一元标注(Unigram ...原创 2019-01-16 15:46:01 · 1604 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第04章 编写结构化程序
第04章 编写结构化程序4.1 回到基础赋值等式条件语句4.2 序列序列类型上的操作合并不同类型的序列产生器表达式4.3 风格的问题过程风格与声明风格计数器的一些合理用途4.4 函数:结构化编程的基础函数的输入和输出参数传递变量的作用域参数类型检查功能分解文档说明函数4.5 更多关于函数作为参数的函数累计函数高阶函数参数的命名4.6 程序开发Python模块的结构多模块程序误差源头调试技术防御性编...原创 2019-01-16 09:25:51 · 1476 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第03章 加工原料文本
第03章 加工原料文本3.1 从网络和硬盘访问文本电子书处理的HTML处理搜索引擎的结果处理RSS 订阅读取本地文件从PDF、MS Word 及其他二进制格式中提取文本捕获用户输入NLP 的流程3.2 字符串最底层的文本处理字符串的基本操作输出字符串访问单个字符访问子字符串更多的字符串操作链表与字符串的差异3.3 使用Unicode 进行文字处理什么是Unicode?从文件中提取已编码文本在Pyt...原创 2019-01-14 09:26:21 · 3331 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第02章 获得文本语料和词汇资源
第02章 获得文本语料和词汇资源2.1 获取文本语料库古腾堡语料库网络和聊天文本布朗语料库路透社语料库就职演说语料库标注文本语料库在其他语言的语料库文本语料库的结构载入你自己的语料库中文自然语言处理 语料/数据集情感/观点/评论 倾向性分析中文命名实体识别推荐系统2.2 条件频率分布条件和事件按文体计数词汇绘制分布图和分布表使用双连词生成随机文本2.3 更多关于Python代码重用使用文本编辑器创...原创 2019-01-13 16:22:32 · 3476 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第01章 语言处理与Python
第01章 语言处理与Python1.1 语言计算:文本和单词Python入门NLTK 入门搜索文本计数词汇1.2 近观Python:将文本当做词链表链表(list,也叫列表)索引列表变量字符串1.3 计算语言:简单的统计频率分布细粒度的选择词词语搭配和双连词(bigrams)计数其他东西1.4 回到Python决策与控制条件对每个元素进行操作嵌套代码块条件循环1.5 自动理解自然语言词意消歧指代消...原创 2019-01-13 09:54:12 · 2895 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第11章 语言数据管理
第11章 语言数据管理11.1 语料库结构:一个案例研究主要设计特点基本数据类型11.2 语料库生命周期语料库创建的三种方案质量控制维护与演变11.3 数据采集从网上获取数据从字处理器文件获取数据从电子表格和数据库中获取数据转换数据格式决定要包含的标注层标准和工具处理濒危语言时特别注意事项11.4 使用XML语言结构中使用XMLElementTree接口使用ElementTree访问Toolbox...原创 2019-01-18 09:02:09 · 1039 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第10章 分析句子的意思
第10章 分析句子的意思10.1 自然语言理解查询数据库自然语言、语义和逻辑10.2 命题逻辑10.3 一阶逻辑一阶定理证明一阶逻辑语言总结真值模型独立变量和赋值量化量词范围歧义模型的建立10.4 英语句子的语义λ演算量化的NP及物动词再述量词歧义10.5 段落语义层段落表示理论段落处理10.6 小结import nltk如何能表示自然语言的意思,使计算机能够处理这些表示?怎样才能将意思...原创 2019-01-17 21:07:40 · 1409 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第09章 建立基于特征的文法
第09章 建立基于特征的文法9.1 文法特征句法协议使用属性和约束术语9.2 处理特征结构包含和统一9.3 扩展基于特征的文法子类别核心词回顾助动词与倒装无限制依赖成分9.4 小结import nltk怎样用特征扩展上下文无关文法框架,以获得更细粒度的对文法类别和产生式的控制?特征结构的主要形式化属性是什么,如何使用它们来计算?用基于特征的文法能捕捉到什么语言模式和文法结构?9.1...原创 2019-01-17 17:15:25 · 3967 阅读 · 2 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第08章 分析句子结构
第08章 分析句子结构8.1 一些语法困境语言数据和无限可能性普遍存在的歧义8.2 文法有什么用?超越n-grams8.3 上下文无关文法一种简单的文法写你自己的文法句法结构中的递归8.4 上下文无关文法分析递归下降分析移进-归约分析左角落分析器图表分析8.5 依存关系和依存文法配价与词汇扩大规模8.6 文法开发有害的歧义加权文法概率上下文无关文法(probabilistic context-fr...原创 2019-01-17 15:08:40 · 1219 阅读 · 0 评论 -
《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第06章 学习分类文本
第06章 学习分类文本6.1 有监督分类性别鉴定选择正确的特征文档分类探索上下文语境序列分类其他序列分类方法6.2 有监督分类的更多例子句子分割识别对话行为类型识别文字蕴含扩展到大型数据集6.3 评估测试集准确度精确度和召回率混淆矩阵交叉验证6.4 决策树熵和信息增益6.5 朴素贝叶斯分类器潜在概率模型零计数和平滑非二元特征独立的朴素双重计数的原因6.6 最大熵分类器最大熵模型熵的最大化生成式分类...原创 2019-01-16 19:53:31 · 1228 阅读 · 0 评论