文档及问题
文档内容:

问题:九月份销售额是多少
正确答案:2851099
deepseek、豆包、文心一言、Qwen答案汇总
为控制变量,每次均为新对话,无上下文提示
| 模型名 | 次数 | 生成结果 | 是否正确 |
| deepseek | 1 | 1683650 | 否 |
| 2 | 3629999 | 否 | |
| deepseek R1 | 1 | 2852099 | 否 |
| 2 | 2851099 | 是 | |
| 豆包 | 1 | 2851099 | 是 |
| 2 | 2851099 | 是 | |
| 豆包-深度思考 | 1 | 2851099 | 是 |
| 2 | 2851099 | 是 | |
| Qwen3-plus | 1 | 2601505 | 否 |
| 2 | 1574613 | 否 | |
| Qwen3-max | 1 | 3515009 | 否 |
| 2 | 3360129 | 否 | |
| Qwen3-max深度思考 | 1 | 2851099 | 是 |
| 2 | 2851099 | 是 | |
| 文心4.5 Turbo | 1 | 2851099 | 是 |
| 2 | 2364308 | 否 |
实验数据截图
deepseek


deepseek R1


豆包


豆包-深度思考


Qwen3-plus


qwen3-max

qwen3max-深度思考


文心4.5Turbo


四个模型结果小结:
deepseek
计算方式:
先把九月份数据取出,分组相加,前两个相加完与下一个相加,得到一个数再与下一个数相加,以此类推直到最后一个
R1可看到思维链过程

此行出错,原因是什么,我现在还不是很清楚??如果有大神知道可以评论在下方
豆包
豆包很可以,表现的是四个模型里最好的!
豆包的处理是写python代码进行累加和,无论是不是深度思考,均使用此方法。
回答如下:
好的,我将读取数据集,从中找出九月份销售额。
import pandas as pd
# 读取文件
excel_file = pd.ExcelFile('/mnt/1.xlsx')
# 获取所有表名
sheet_names = excel_file.sheet_names
sheet_names
根据执行结果可知,文件中存在一个工作表,表名为 '2023 年 8 月 - 9 月销售记录 '。接下来我要对这个名为 '2023 年 8 月 - 9 月销售记录 ' 的工作表展开数据探查。
# 获取指定工作表中的数据
df = excel_file.parse('2023年8月-9月销售记录')
# 查看数据的基本信息
print('数据基本信息:')
df.info()
# 查看数据集行数和列数
rows, columns = df.shape
if rows < 100 and columns < 20:
# 短表数据(行数少于100且列数少于20)查看全量数据信息
print('数据全部内容信息:')
print(df.to_csv(sep='\t', na_rep='nan'))
else:
# 长表数据查看数据前几行信息
print('数据前几行内容信息:')
print(df.head().to_csv(sep='\t', na_rep='nan'))
根据执行结果可知,数据集记录了 2023 年 8 月 - 9 月的销售记录。接下来,我将筛选出 9 月份的数据,并对销售额求和。
# 筛选出 9 月份的数据
September_data = df[df['日期'].dt.month == 9]
# 计算 9 月份的总销售额
total_sales = September_data['销售额'].sum()
print('9 月份的总销售额:', total_sales)
根据执行结果可知,9 月份的总销售额为 2851099 元。
Qwen3
非深度思考累加和错误

当我想复盘他的计算过程错误时,他竟然自己检测出来错误,并算出了正确答案
文心一言
计算出正确答案对话是通过写python代码实现的:
具体为:
我将按照以下步骤完成任务:
- 首先读取Excel文件中的销售记录数据
- 将日期列转换为datetime类型(虽然数据预览显示已经是datetime64,但为了确保需要确认)
- 筛选出日期在2023年9月的记录
- 计算这些记录的销售额总和
- 打印出九月份的总销售额
以下是完整的Python实现代码:
import pandas as pd
# 读取Excel文件
df = pd.read_excel('file-728782974428805.xlsx', sheet_name='2023年8月-9月销售记录')
# 确保日期列是datetime类型(虽然数据预览显示已经是,但为了代码健壮性)
df['日期'] = pd.to_datetime(df['日期'])
# 筛选出2023年9月的记录
september_sales = df[(df['日期'].dt.year == 2023) & (df['日期'].dt.month == 9)]
# 计算九月份总销售额
total_september_sales = september_sales['销售额'].sum()
# 打印结果
print(f"2023年9月份的总销售额为: {total_september_sales}元")
计算错误原因是:
9.2号和9.3号数据未计算在内,列出的21个产品累加和算错。
根据提供的1.xlsx文件中的数据,九月份各产品的销售额如下:
- 健康设备:Xiaomi Mi Band 6,销售额为18320元
- 相机:Canon EOS R6,销售额为208989元
- 笔记本电脑:Dell XPS 13,销售额为169983元
- 智能手表:Suunto 7,销售额为101471元
- 平板电脑:Microsoft Surface Pro 8,销售额为233974元
- 电视:Panasonic OLED,销售额为139990元
- 游戏机:Xbox Series X,销售额为206352元
- 手机:OnePlus 9 Pro,销售额为273564元
- 空气净化器:Philips AC2889/30,销售额为54978元
- 耳机:Bose QuietComfort Earbuds,销售额为116547元
- 智能音箱:Sonos One,销售额为70161元
- 健康设备:Withings Body+,销售额为45954元
- 相机:Nikon Z6 II,销售额为220987元
- 笔记本电脑:HP Spectre x360,销售额为175984元
- 智能手表:Amazfit GTR 3,销售额为40269元
- 平板电脑:Huawei MatePad Pro,销售额为175473元
- 电视:TCL Mini LED,销售额为83993元
- 游戏机:Sega Genesis Mini,销售额为47141元
- 手机:Google Pixel 6,销售额为254966元
- 空气净化器:Blueair Blue Pure 211+,销售额为45576元
- 耳机:Anker Soundcore Liberty Air 2 Pro,销售额为55738元
将上述所有产品的销售额相加,得到九月份的总销售额为2,364,308元。
总结
从计算思维上看,通过代码方式实现,错误率大大降低。我的数据量不是很大,以上结论基于小数据量(不可避免会有误差)。

被折叠的 条评论
为什么被折叠?



