2016.5.9 新未来-人工智能论坛

本文深入探讨了人工智能领域的前沿观点,包括洪小文博士从计算机科学角度阐述的「人类+机器=超人」理念,潘建伟院士关于量子计算机可能触及AI意识的见解,以及蒲慕明院士揭示的AI与生命科学的联系。文章强调了跨学科知识的重要性,并指出AI发展的积极方向,即更好地服务于人类生活。

新未来-人工智能论坛
今天旷了一节程序设计课(后来同学讲课上没什么重点(笑)),去听了这个人工智能论坛,感觉收获挺多。

洪小文博士:计算机科学的角度

Human + Machine = Superman

洪院长对人工智能的前景态度乐观,且认为AI威胁论属于未雨绸缪。现今的人工智能,都是建立在Big data和Algorithm之上的,即便AI可以自由地获取各种信息,机器目前(和在未来很长一段时间)也根本不可能自行设计出用于建立learning pattern的算法。所以AI发展只会更好地服务于人类生活,而不会造成各类science fiction里的灾难情节。

潘建伟院士:量子物理学的角度

量子计算机是现在唯一可能触及AI意识的技术。

我对量子科学没有涉猎,潘院士的报告我听得也是糊里糊涂的,但我也发现了量子计算机同现在的计算机的本质性区别。现在的计算机信息都是0,1的排列,任何计算都有着遵循的法则,位之间的简单运算加上人类创造的算法包装成解决问题的程序。但量子不同,在未观测时值处于一种可0可1的状态,而这种特性使得科学家们看到了模拟人类意识的可能。

蒲慕明院士:生命科学的角度

AI的每一次突破性进展背后都有生命科学的突破。

蒲院士介绍了人类大脑有关思考、记忆等活动的机理,并且指出了几次突破对于人工智能的启发性作用。
从中我体会到,任何一门学科,都有可能从看似无关的学科中获取灵感,在本科阶段我应该注意培养自己的交叉学科知识。其实,这种能力也是USTC所强调的。

你遇到了这个结果: ``` Variable | Obs Mean Std. dev. Min Max -------------+--------------------------------------------------------- rd_expense | 0 ``` 👉 **`Obs = 0`** 意味着:虽然变量存在,但 **Stata 认为它没有有效数值(全是缺失值)!** 即使你在 `list` 中看到像 `2,922,592,250` 这样的数字,但转换失败了。 --- ## 🔍 问题定位:`destring` 失败 → `rd_expense` 转换后变空 你之前运行了: ```stata destring rd_expense, replace ignore(",") ``` 但可能返回了类似这样的提示: > `rd_expense has all characters not allowed; specify force to proceed` 或者根本没有报错,但实际变成了全 `. `(缺失值),所以现在 `summarize` 显示 `Obs=0`。 --- ## ✅ 正确解决方案:先检查原始字符串格式,再清理转换 ### 📌 原因分析 你的 `rd_expense` 是 `str14` 类型,而数值如 `2,922,592,250` 共有 **13 位数字 + 3 个逗号 = 16 字符**,超过了 `str14` 的长度限制! 👉 所以 Stata 实际上存储的是被截断的内容,比如: - `"2,922,592,"` (不完整) - 或 `"2922592250"`(无逗号但超长) 导致 `destring ... ignore(",")` 无法识别为合法数字。 --- ## ✅ 分步解决方法(确保成功转换) ### ✅ 步骤 1:查看真实内容(是否被截断?) ```stata list year rd_expense in 1/10, clean noobs ``` 输出可能是: ``` 2016 2,922,592, 2017 3,207,976, ... ``` 👉 看到末尾是 `,` 或中间断裂 → 确认是 **字段太短导致数据损坏** --- ### ✅ 步骤 2:扩展变量长度(修复截断问题) 由于原数据是 `str14`,我们需要先转成更长的字符串类型。 ```stata * 方法一:用 tostring + recode 强制扩展 generate str20 rd_temp = rd_expense ``` 如果不行,说明原始数据已损毁。这时需要手动修复。 --- ### ✅ 步骤 3:从 Excel 重导入,避免字段截断 这是最根本的解决办法! #### 推荐操作流程: 1. **回到原始 Excel 文件** 2. 删除所有千分位逗号(让数字变成纯数字) - 使用 Excel 的“查找替换”:将 `,` 替换为空 3. 将列格式设为“数值” 4. 在 Stata 中使用: ```stata import excel "your_file.xlsx", sheet("Sheet1") firstrow clear ``` 👉 这样会自动识别为数值型,不会变成字符串! --- ### ✅ 替代方案:在 Stata 内部尝试修复(适用于未完全损坏的数据) 如果你不能重导,可以试试以下代码: ```stata * 创建临时变量,去掉逗号并尝试转数字 generate str20 rd_clean = subinstr(rd_expense, ",", "", .) // 去掉所有逗号 destring rd_clean, replace rename rd_clean rd_expense_new ``` ✅ 解释: - `subinstr(..., ",", "", .)`:把字符串中的所有 `,` 删除 - `destring`:转换为数值 - 变量 `rd_expense_new` 是真正的数字 然后测试: ```stata summarize rd_expense_new twoway line rd_expense_new year, sort ``` 应该就能成功了! --- ### ✅ 示例:完整修复流程 ```stata * 1. 清理字符串:去逗号 generate str20 temp = subinstr(rd_expense, ",", "", .) * 2. 转为数值 destring temp, replace rename temp rd_expense_clean * 3. 验证 summarize rd_expense_clean list year rd_expense rd_expense_clean, clean * 4. 设置时间序列 tsset year * 5. 画图 twoway line rd_expense_clean year, sort title("研发投入变化趋势") ytitle("研发费用(元)") * 6. 回归示例 gen ai_lag = L.ai_mentions regress rd_expense_clean ai_lag ``` --- ## 💡 提示:如何避免未来再次出错? | 做法 | 推荐 | |------|------| | 导入数据前清除千分位逗号 | ✅ 必须做 | | 使用 `.csv` 或 `import excel` 而非复制粘贴 | ✅ | | 导入后立即 `describe` 和 `sum` 检查类型 | ✅ | | 对财务数据统一命名为 `*_amount` 并转为 `double` | ✅ | --- ## 🧪 补充验证:确认你现在能做什么 运行下面这段代码,看是否成功: ```stata * 清除当前数据(测试用) clear * 手动输入一个小例子(模拟你的数据) input str15 rd_expense_str year "2,922,592,250" 2016 "3,207,976,641" 2017 "3,151,129,874" 2018 end * 清理并转换 generate str20 rd_clean = subinstr(rd_expense_str, ",", "", .) destring rd_clean, replace rename rd_clean rd_expense * 查看结果 list, clean summarize rd_expense * 成功!可以继续分析 twoway line rd_expense year, sort ``` ✅ 如果这段能跑通,说明你知道该怎么修了。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值