个人论文
论文中应该包含
理论界的观点
实务界的探索
可以由原来的论文向两个方向推进
一、细化论文, 删除结构化数据分析算法,写通用大语言模型和自己训练的行业小模型对比
原来的论文:机器学习算法在AI时代审计中的应用与挑战,
作为论文来说,太过宽泛,缺少纵深。
建议:
1. 删除随机森林、神经网络等算法,专注于自然语言处理。
2.对比通用大语言模型和自己训练的行业小模型
对比在审计应用层面,大语言模型,如deepseek、chatgpt;和小语言模型,自然语言处理基础模型,如N-gram,P-gram模型,专门拿审计行业专业语料,如审计报告、行业资讯等非结构化数据,观察两者在审计行业应用的效果
通用大语言模型的优势:响应速度快,知识储备丰富
通用大语言模型的劣势:训练成本高,服务器配置要求高
本地行业小语言模型的优势:
1.行业专业性,回复内容精准(核心竞争力)
2.可以采用大模型剪枝和蒸馏,再进行审计语料的训练,大大减少训练成本
3.保障了信息安全,隐私权
本地行业小语言模型的劣势:回复内容局限,响应速度慢
小语言模型拓展:能否实现实时数据监控?
放实际应用的对比,不玩虚的
3.整体框架沿用之前的,背景和算法介绍以及最后的挑战,NLP应用可以稍加修改,加入大模型应用效果
二、个人知识库 投入和需求效果的平衡
在本地部署轻量级或者重量级的DeepSeek个人知识库,成为最近一段时间的潮流。但是,我们如何衡量到底该部署什么体量的模型,这篇文章会为不同种类的用户提出建议
有些时候,模型不是越大越好,模型越大,需要部署在更加昂贵的系统设备上,可能得不偿失;模型太小,模型响应的速度跟不上需求、回答的答案不符合预期。
这些大小模型在具体应用到审计行业时的表现怎么样;到底什么样的审计工作人员人群适合多大的模型,这是文章需要搞清楚的点。
公共论文想法
当下比较火热的,ISACA提出的AI伦理问题
AI治理
起初,是注册会计师独立决策撰写审计报告;现在,越来越多的审计人员开始使用chatgpt等工具生成审计报告。那么,先前的注册会计师撰写的审计报告是具有法律效力的,但是现在,chatgpt没有CPA,那么,它编写的审计报告是否还具有法律效力呢?如果出错了,谁来担任责任? 这是现在很多立法人员关注的点,也是我们可以和法学院同学一起研究的方向(他们一定有人在搞这方向)。
算法审计
对于应用于会计信息系统的算法,是否具备可解释性,是否是公开透明的、没有明显错误的 对于这方面的审计,称为算法审计
使用AI,本质是使用里面装有机器学习算法的黑箱,我们怎么确保这些算法是合法合规的、能生成合法合理的结果?,对这些未知的算法,我们是否需要进行审计,怎么开展审计。
打比赛方向
服务外包
明天参加服务外包大赛的宣讲会,主要是企业命题的,这个比赛不一定要有最后的产品,去年的是用企业给定的数据集,做一些预测分析以及漏洞,最后做一个UI界面展示结果。
大创、互联网+、三创
实习时可以从单位的行业中探索到一些痛点、抽取一些问题,应用到打商赛,例如:知道审计师很难处理海量数据,设计自然语言处理系统。