实验：上传销售文档，deepseek、豆包、文心一言、通义各自计算九月份销售额-优快云博客

文档及问题

文档内容：

问题：九月份销售额是多少

正确答案：2851099

deepseek、豆包、文心一言、Qwen答案汇总

为控制变量，每次均为新对话，无上下文提示

模型名	次数	生成结果	是否正确
deepseek	1	1683650	否
	2	3629999	否
deepseek R1	1	2852099	否
	2	2851099	是
豆包	1	2851099	是
	2	2851099	是
豆包-深度思考	1	2851099	是
	2	2851099	是
Qwen3-plus	1	2601505	否
	2	1574613	否
Qwen3-max	1	3515009	否
	2	3360129	否
Qwen3-max深度思考	1	2851099	是
	2	2851099	是
文心4.5 Turbo	1	2851099	是
	2	2364308	否

实验数据截图

deepseek

deepseek R1

豆包

豆包-深度思考

Qwen3-plus

qwen3-max

qwen3max-深度思考

文心4.5Turbo

四个模型结果小结：

deepseek

计算方式：

先把九月份数据取出，分组相加，前两个相加完与下一个相加，得到一个数再与下一个数相加，以此类推直到最后一个

R1可看到思维链过程

此行出错，原因是什么，我现在还不是很清楚？？如果有大神知道可以评论在下方

豆包

豆包很可以，表现的是四个模型里最好的！

豆包的处理是写python代码进行累加和，无论是不是深度思考，均使用此方法。

回答如下：

好的，我将读取数据集，从中找出九月份销售额。

import pandas as pd

# 读取文件
excel_file = pd.ExcelFile('/mnt/1.xlsx')

# 获取所有表名
sheet_names = excel_file.sheet_names
sheet_names

根据执行结果可知，文件中存在一个工作表，表名为 '2023 年 8 月 - 9 月销售记录 '。接下来我要对这个名为 '2023 年 8 月 - 9 月销售记录 ' 的工作表展开数据探查。

# 获取指定工作表中的数据
df = excel_file.parse('2023年8月-9月销售记录')

# 查看数据的基本信息
print('数据基本信息：')
df.info()

# 查看数据集行数和列数
rows, columns = df.shape

if rows < 100 and columns < 20:
    # 短表数据（行数少于100且列数少于20）查看全量数据信息
    print('数据全部内容信息：')
    print(df.to_csv(sep='\t', na_rep='nan'))
else:
    # 长表数据查看数据前几行信息
    print('数据前几行内容信息：')
    print(df.head().to_csv(sep='\t', na_rep='nan'))

根据执行结果可知，数据集记录了 2023 年 8 月 - 9 月的销售记录。接下来，我将筛选出 9 月份的数据，并对销售额求和。

# 筛选出 9 月份的数据
September_data = df[df['日期'].dt.month == 9]

# 计算 9 月份的总销售额
total_sales = September_data['销售额'].sum()

print('9 月份的总销售额：', total_sales)

根据执行结果可知，9 月份的总销售额为 2851099 元。

Qwen3

非深度思考累加和错误

当我想复盘他的计算过程错误时，他竟然自己检测出来错误，并算出了正确答案

文心一言

计算出正确答案对话是通过写python代码实现的：

具体为：

我将按照以下步骤完成任务：

首先读取Excel文件中的销售记录数据
将日期列转换为datetime类型（虽然数据预览显示已经是datetime64，但为了确保需要确认）
筛选出日期在2023年9月的记录
计算这些记录的销售额总和
打印出九月份的总销售额

以下是完整的Python实现代码：

import pandas as pd  
  
# 读取Excel文件  
df = pd.read_excel('file-728782974428805.xlsx', sheet_name='2023年8月-9月销售记录')  
  
# 确保日期列是datetime类型（虽然数据预览显示已经是，但为了代码健壮性）  
df['日期'] = pd.to_datetime(df['日期'])  
  
# 筛选出2023年9月的记录  
september_sales = df[(df['日期'].dt.year == 2023) & (df['日期'].dt.month == 9)]  
  
# 计算九月份总销售额  
total_september_sales = september_sales['销售额'].sum()  
  
# 打印结果  
print(f"2023年9月份的总销售额为: {total_september_sales}元")

计算错误原因是：

9.2号和9.3号数据未计算在内，列出的21个产品累加和算错。

根据提供的1.xlsx文件中的数据，九月份各产品的销售额如下：