AI
文章平均质量分 56
Mirza_Zhao
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
IProgress not found. Please update jupyter and ipywidgets.Transformers 导入预训练模型报错
项目场景:使用Huggingface的Transformers第一次导入预训练模型的时候会报这个错。问题描述:第一次运行demo的时候需要下载预训练模型,接着就会卡在这一步。网上看了一些,说什么卸载jupyter重装、或者重新安装ipywidgets的,都不管用。ImportError:IProgress not found. Please update jupyter and ipywidgets.原因分析:本质上却少了相关的包,直接pip install IProgress或原创 2021-11-11 15:24:26 · 6180 阅读 · 6 评论 -
Huggingface Transformers 安装报错 ImportError: /lib64/libc.so.6: version `GLIBC_2.18‘ not found
项目场景:近期安装transformers的时候发现了这个报错,之前transformers 3.5.0用的很流畅,这次突然遇到这个问题。问题描述:这种import error一般不是“缺胳膊少腿”,就是版本不匹配原因分析:按照头痛医头,脚痛医脚的思路,先去看看缺的这个包是咋回事。报错日志不难发现是tokenizers在调用GLIBC 2.18的时候找不到。简单了解了一下GLIBC一个Linux的c运行库(glibc_百度百科),再看一下服务器现有的GLIBC版本,确实没有2..原创 2021-10-24 18:11:14 · 3924 阅读 · 1 评论 -
CTR预估AUC=0.99问题记录
项目场景:最近在做CTR预估,同时有4个业务的一起做,之前在其他平台使用的机器学习没有问题。换到新的深度学习平台,用DNN和DeepFM做auc高的吓人。问题描述:模型从一开始就可以稳定收敛,无论是测试集还是训练集都可以稳定在0.99的auc。设定定时任务离线训练了数天后发现,偶尔会有几天auc突然变成0.5,之后有会变成0.99。 原因分析:遇到这个问题头也是大的,之前没做过这块的工作。只能一个个原因排查:是不是训练数据过拟合?答:但是在测试集上也有很高的auc很显然不是过拟合。原创 2021-07-22 19:30:54 · 3574 阅读 · 8 评论 -
UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 246-247: ordinal not in range
项目场景:在集群上写pyspark的时候遇到了这个问题问题描述:在进行df.show()操作的时候,由于数据中有中文,所以报错Traceback (most recent call last): File "20210622_1259_test.py", line 13, in <module> df.show(100)……UnicodeEncodeError: 'ascii' codec can't encode characters in position 246-原创 2021-06-22 17:42:30 · 512 阅读 · 0 评论 -
org.apache.spark.SparkException: Job aborted due to stage failure: Serialized task 9:0 was 1373316
项目场景:使用Pyspark做数据清晰的时候,从小数据到大数据转换的时候报了这个错。问题描述: org.apache.spark.SparkException: Job aborted due to stage failure: Serialized task 9:0 was 137331649 bytes, which exceeds max allowed: spark.rpc.message.maxSize (134217728 bytes). Consider increasing spar原创 2021-06-16 12:04:57 · 4163 阅读 · 0 评论 -
PySpark Dataframe 对列取log对数
项目场景:提示:这里简述项目相关背景:例如:项目场景:示例:通过蓝牙芯片(HC-05)与手机 APP 通信,每隔 5s 传输一批传感器数据(不是很大)问题描述:提示:这里描述项目中遇到的问题:例如:数据传输过程中数据不时出现丢失的情况,偶尔会丢失一部分数据APP 中接收数据代码:@Override public void run() { bytes = mmInStream.read(buffer); mHandler.obtainMessage(READ_DATA, bytes,原创 2021-06-03 11:27:38 · 5822 阅读 · 4 评论 -
Transformers转ELECTRA到pytorch报错:module ‘tensorflow_core.keras.activations‘ has no attribute ‘swish‘
项目场景:利用Transformers转ELECTRA模型的时候,遇到了一些问题。ELECTRA用的是讯飞哈工大的模型。问题描述:执行转换脚本:python3 transformers-master/src/transformers/convert_electra_original_tf_checkpoint_to_pytorch.py \--tf_checkpoint_path chinese_electra_base_L-12_H-768_A-12/ \--config_file原创 2020-11-11 17:40:09 · 1647 阅读 · 6 评论
分享