本人在使用chatterbot开发项目的过程中需要采用yaml文件作为训练文件,那么就需要配置yaml
1、配置yaml:
很简单,只需要在cmd中输入pip install pyyaml即可。
接下来就是具体的转载内容,非常详细地解决了我的问题,我可以用python中的yaml语法来编写chatterbot的训练文件并用于训练:
YAML语法
提及到语法层面,就得严肃认真一点了。之前看过阮一峰老师关于YAML在JavaScript中的应用,对比在Python中的应用,原理其实是一致的。可以参考一下:
语法规则
总的来说,语法没什么难度,也是人们司空见惯的了。
- 大小写敏感
- 使用缩进表示层级关系
- 缩进时不允许使用Tab键,只允许使用空格。
- 缩进的空格数目不重要,只要相同层级的元素左侧对齐即可
另外,和Python的注释方式一样,以#
号作为注释符,很人性化了吧。
数据结构
YAML本身语法很简单,但是却可以基于此实现比较强大的配置功能。思考一下,作为一个配置文件,可能出现的情况有哪些?
- 一连串类型一致的数据?
- 基本的数据类型?
key-value
组合?
其实,认真的思考一下就会明白了。YAML不是一个凭空捏造的数据格式,而是经过了实际考验的人性化设计的一套规范。针对上面的问题,答案就是YAML本身支持的数据结构了,也很好记忆。
- 列表,数组(一串类型相同或者不同的组合)
- 纯量(类似于原子性,不可再分)
- 对象(键值对的组合,一对一的特性)
列表,数组
类比Python语言,YAML性质与其保持一致。但是书写方式上来说嘛,也可以是不一致的。大致有如下两种:
[]
式:
- 1
- 1
竖-
式:
- 1
- 2
- 3
- 4
- 5
- 1
- 2
- 3
- 4
- 5
注意好符合一开始讲的,语法规则即可。
原子量
也即是纯量,不能再细分的数据结构。类比其他的编程语言,YAML也充分地考虑到了这一点。
-
数值型: 直接书写即可。不区分整型还是浮点型。
-
字符串: 字符串可以加引号,也可以不加。还有相关于换行什么的更多特殊的用法,这里强烈建议阅读以下阮一峰老师的这篇文章:
http://www.ruanyifeng.com/blog/2016/07/yaml.html?f=tt- 单引号内会自动的转义特殊字符,对单引号转义是使用两个单引号,其表示一个原生的单引号。
- 双引号内保持原字符不变。
-
日期,时间:
- 时间: ISO8601 格式。如
2001-12-14t21:59:43.10-05:00
- 日期: 采用复合 iso8601 格式的年、月、日表示。如
1970-01-01
- 时间: ISO8601 格式。如
-
关于强制类型转换: 可以通过两个英文感叹号+新的数据类型的方式来进行强制的类型转换。
如:
- 1
- 2
- 1
- 2
将变为:
- 1
- 1
除此简单的介绍之外,YAML还有很多更为奇妙的语法,但是掌握了这些基础的使用,写一个配置文件基本上就够用了。如果有兴趣的话,可以在深入的研究一下。
YAML应用
这里主要是记录一下YAML在Python语言中的应用。类比于json库,yaml库与其有惊人的相似之处。一个load方法,一个dump方法。顾名知义,也比较的好理解。
案例
下面是从网上找的一个简单的按照YAML语法书写的一个文件,将作为待会的源来使用。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
load
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
所得结果为:
- 1
- 1
理解层面以Python中的dict来理解即可。
dump
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
运行结果:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
同样的,这里也可以看到强制类型转换的身影。
总结
这样的话,类比json库的学习,yaml库也可以很好的被应用了。
使用这样的方式可以最大限度的解耦和代码,实现更高的可移植性。
同样,写配置文件也不一定要用YAML,还可以有很多的选择,比如ConfigParser
了, .ini
了,还可以自定义(借助于正则表达式做好相关的存取即可)。
没有哪种是最好的,只有适合的才是最好的。在不同的场合选择适合自己的配置文件的书写方式即可。