闲话字符编码

C源文件本身是普通的文本文件,既然是文本文件,那他就有自己的字符编码格式。

我们常用的大概是GBK、UTF-8这两种格式。

如果一个utf-8格式的文本文件,是用微软的记事本程序创建的,那么这个文件的开头会有3个字节的UTF-8签名(EF BB BF),也叫做BOM。

BOM是个可选的东东,因此不是所有编辑器程序都会在文件前面加上这东东。

有些程序不识别BOM,把他当正常字符数据处理,就出错了。


好了,接下来看看字符编码对各种事情的影响。

一、C源文件的编码格式

gcc编译C源代码,默认采用utf-8编码处理输入的C源文件。如果C源文件编码格式不是utf-8,则可以通过-finput-charset选项指出源文件编码格式。

否则的话,可能会导致编译失败。

例如,假如源文件a.c是GBK格式,也可以通过如下命令编译此文件。

gcc -c  -finput-charset=GBK  a.c

当出现编译失败时,可以通过MadEdit这个文本编辑器打开源文件,看看他的编码格式到底是什么。

MadEdit工具非常好用,通过他可以手动切换编码格式来解析文本文件。

当我们看到显示出的内容不再是乱码时,就知道文件的编码格式了。

同时,通过选择16进制模式,还能看到每个字符的实际编码值。

通过使用16进制模式,加上手动切换编码格式,我们甚至可以查看目标文件中的字符串常量的值,及其编码格式。


二、目标文件中字符串常量的编码格式

不管C源文件是什么编码格式,gcc生成的目标文件中,对于字符串常量的值,默认总是采用utf-8编码。

当然,我们也可以通过编译选项,指定生成的目标文件中字符串常量值的编码格式。例如,通过如下命令,指定为GBK格式。

gcc -c  -fexec-charset=GBK  a.c 


通过 iconv --list ,可以查看gcc支持的编码格式。


三、程序运行时,输入输出涉及的编码格式

程序运行时,通过printf向终端输出一串字符。printf内部最终实际上是调用write系统调用,将字符串数据到描述符1,描述符1即终端设备。至于能否正常显示,那就要看所写字符串的编码格式与当前终端设备支持的编码格式是否一致了。

Linux系统的终端,默认编码格式可能是utf-8。

如果是通过SecureCRT连接到Liux,那么这就是伪终端。此时,write系统调用将字符串数据通过socket连接发给了SecureCRT程序。此时,SecureCRT就是终端设备。

如果SecureCRT上出现了乱码,可以在SecureCRT中,打开此连接的session options界面,选择terminal,Appearance,fonts,Character encoding,将这个值设置为write系统调用所写的字符串数据的编码格式即可。

printf语句,所输出的字符串,其值可能来自字符串常量,可能来自文本文件,可能来自网络。来自哪里不要紧,总之,要搞清楚数据源的编码格式。




四. windows与Linux对拷文件后,文件名乱码问题
文件名、目录名,也是文本,当然也有自己的编码格式。
不过,这些文本数据,是属于文件系统的数据,归文件系统管理。
这里的编码策略,与文件系统风格有关,与操作系统风格也有关,因此就难以说清了^_^
【CNN-GRU-Attention】基于卷积神经网络和门控循环单元网络结合注意力机制的多变量回归预测研究(Matlab代码实现)内容概要:本文介绍了基于卷积神经网络(CNN)、门控循环单元网络(GRU)与注意力机制(Attention)相结合的多变量回归预测模型研究,重点利用Matlab实现该深度学习模型的构建与仿真。该模型通过CNN提取输入数据的局部特征,利用GRU捕捉时间序列的长期依赖关系,并引入注意力机制增强关键时间步的权重,从而提升多变量时间序列回归预测的精度与鲁棒性。文中涵盖了模型架构设计、训练流程、参数调优及实际案例验证,适用于复杂非线性系统的预测任务。; 适合人群:具备一定机器学习与深度学习基础,熟悉Matlab编程环境,从事科研或工程应用的研究生、科研人员及算法工程师,尤其适合关注时间序列预测、能源预测、智能优化等方向的技术人员。; 使用场景及目标:①应用于风电功率预测、负荷预测、交通流量预测等多变量时间序列回归任务;②帮助读者掌握CNN-GRU-Attention混合模型的设计思路与Matlab实现方法;③为学术研究、毕业论文或项目开发提供可复现的代码参考和技术支持。; 阅读建议:建议读者结合Matlab代码逐模块理解模型实现细节,重点关注数据预处理、网络结构搭建与注意力机制的嵌入方式,并通过调整超参数和更换数据集进行实验验证,以深化对模型性能影响因素的理解。
下载前必看:https://pan.quark.cn/s/da7147b0e738 《商品采购管理系统详解》商品采购管理系统是一款依托数据库技术,为中小企业量身定制的高效且易于操作的应用软件。 该系统借助VC++编程语言完成开发,致力于改进采购流程,增强企业管理效能,尤其适合初学者开展学习与实践活动。 在此之后,我们将详细剖析该系统的各项核心功能及其实现机制。 1. **VC++ 开发环境**: VC++是微软公司推出的集成开发平台,支持C++编程,具备卓越的Windows应用程序开发性能。 在该系统中,VC++作为核心编程语言,负责实现用户界面、业务逻辑以及数据处理等关键功能。 2. **数据库基础**: 商品采购管理系统的核心在于数据库管理,常用的如SQL Server或MySQL等数据库系统。 数据库用于保存商品信息、供应商资料、采购订单等核心数据。 借助SQL(结构化查询语言)进行数据的增加、删除、修改和查询操作,确保信息的精确性和即时性。 3. **商品管理**: 系统内含商品信息管理模块,涵盖商品名称、规格、价格、库存等关键字段。 借助界面,用户能够便捷地录入、调整和查询商品信息,实现库存的动态调控。 4. **供应商管理**: 供应商信息在采购环节中占据重要地位,系统提供供应商注册、联系方式记录、信用评价等功能,助力企业构建稳固的供应链体系。 5. **采购订单管理**: 采购订单是采购流程的关键环节,系统支持订单的生成、审批、执行和追踪。 通过自动化处理,减少人为失误,提升工作效率。 6. **报表与分析**: 系统具备数据分析能力,能够生成采购报表、库存报表等,帮助企业掌握采购成本、库存周转率等关键数据,为决策提供支持。 7. **用户界面设计**: 依托VC++的MF...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值