poi获取excel单元格内容与实际内容不相同(mysql中批量导入数据)

poi简析单元格时,报错解决:

https://blog.youkuaiyun.com/fz13768884254/article/details/82767297

其他poi相关文档:

https://blog.youkuaiyun.com/fz13768884254/article/details/82706936

https://blog.youkuaiyun.com/fz13768884254/article/details/82703959

https://blog.youkuaiyun.com/fz13768884254/article/details/82707117

项目中需要导入批量数据,导入时id列单元格格式均设置为文本格式,导入时将单元格格式转换为数字类型,这个导入过程都正常,但是后来发现,导入的同一条数据,excel中的id和数据库中导入的id时不一致的。

具体情况:

获取id值,表格中设置为文本类型。

 poi简析后将单元格设置为数字类型:

cell_0.setCellType(Cell.CELL_TYPE_NUMERIC);

刚获取值时:

设置数字类型后,再取值时:

 

 

@Override
    public void setCellType(int cellType) {
        int prevType = getCellType();

        if(isPartOfArrayFormulaGroup()){
            notifyArrayFormulaChanging();
        }
        if(prevType == CELL_TYPE_FORMULA && cellType != CELL_TYPE_FORMULA) {
            getSheet().getWorkbook().onDeleteFormula(this);
        }

        switch (cellType) {
            case CELL_TYPE_BLANK:
                setBlank();
                break;
            case CELL_TYPE_BOOLEAN:
                String newVal = convertCellValueToBoolean() ? TRUE_AS_STRING : FALSE_AS_STRING;
                _cell.setT(STCellType.B);
                _cell.setV(newVal);
                break;
            case CELL_TYPE_NUMERIC:
                _cell.setT(STCellType.N);
                break;
            case CELL_TYPE_ERROR:
                _cell.setT(STCellType.E);
                break;
            case CELL_TYPE_STRING:
                if(prevType != CELL_TYPE_STRING){
                    String str = convertCellValueToString();
                    XSSFRichTextString rt = new XSSFRichTextString(str);
                    rt.setStylesTableReference(_stylesSource);
                    int sRef = _sharedStringSource.addEntry(rt.getCTRst());
                    _cell.setV(Integer.toString(sRef));
                }
                _cell.setT(STCellType.S);
                break;
            case CELL_TYPE_FORMULA:
                if(!_cell.isSetF()){
                    CTCellFormula f =  CTCellFormula.Factory.newInstance();
                    f.setStringValue("0");
                    _cell.setF(f);
                    if(_cell.isSetT()) _cell.unsetT();
                }
                break;
            default:
                throw new IllegalArgumentException("Illegal cell type: " + cellType);
        }
        if (cellType != CELL_TYPE_FORMULA && _cell.isSetF()) {
			_cell.unsetF();
		}
    }
<xml-fragment r="A5" t="n" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships" xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:x14ac="http://schemas.microsoft.com/office/spreadsheetml/2009/9/ac" xmlns:main="http://schemas.openxmlformats.org/spreadsheetml/2006/main">
  <main:v>8423</main:v>
</xml-fragment>

类是于,先拿到文本值,在转换时,将文本内容对应一个数字格式的值,k-v形式存储,当获取数字类型时,就是直接拿key,而我们需要的是value的值,因此就会存在问题。

解决方法:文本类型的单元格,也设置为文本类型,当转换为java对象后,再进行类型转换。 

                //excel中设置为文本类型
                Cell cell_0 = row.getCell(0);
                //再进行一次单元格设置,设置为文本类型
                cell_0.setCellType(Cell.CELL_TYPE_STRING);
                Map<String, String> map = Maps.newHashMap();
                //在java中将字符串转换为对应的数据类型
                map.put("id", Double.valueOf(cell_0.getStringCellValue()).longValue()+"");

 这样就可以解决,导入前后因为简析数据类型不一致而导致的数据不一致问题。

 

### 线性回归使用梯度下降法实现的方法及原理 #### 方法概述 为了在线性回归中应用梯度下降法,目标是最小化模型预测值与实际观测值之间的差异。这通常通过最小化均方误差(MSE)作为损失函数来完成[^1]。 #### 定义线性假设 设有一个简单的单变量线性回归问题,其中输入特征为 \(X\) ,输出标签为 \(y\) 。线性关系可表示为: \[ h_\theta(x)=\theta_0+\theta_1x \] 这里 \(h_\theta(x)\) 是关于参数向量 \(\theta=[\theta_0,\theta_1]\) 的假设函数[^2]。 #### 初始化参数并计算初始成本 在开始迭代之前,先初始化权重(即θ),一般设置为零或很小的随机数。接着利用当前设定好的θ去估计样本的目标值,并据此算出整个训练集中所有实例的成本总和——平均平方差[MSE]。 #### 计算梯度更新规则 对于每一个参数 θj (j=0, j=1),按照下面的方式调整它: \[ \theta_j := \theta_j - \alpha \frac{\partial}{\partial \theta_j} J(\theta_0, \theta_1) \] 这里的 α 表示学习率;\(J(\theta_0, \theta_1)\) 则代表我们的代价/损失函数,在这里是 MSE 函数。具体来说就是对每个参数求偏导数以获得该方向上最陡峭的方向,从而指导我们如何改变参数使得下一次计算出来的MSE更小一些[^3]。 #### 编写Python代码实现上述过程 下面是基于纯 Python 和 NumPy 库编写的简单例子,用于演示如何运用批处理方式下的梯度下降来进行一元线性拟合: ```python import numpy as np def compute_cost(X, y, theta): m = len(y) predictions = X.dot(theta) square_err = (predictions - y)**2 return 1/(2*m)*np.sum(square_err) def gradient_descent(X, y, theta, alpha, num_iters): m = len(y) cost_history = [0]*num_iters for iteration in range(num_iters): prediction = X.dot(theta) errors_x1 = (prediction-y)*X[:,0] errors_x2 = (prediction-y)*X[:,1] theta[0][0] -= alpha*(1/m)*errors_x1.sum() theta[1][0] -= alpha*(1/m)*errors_x2.sum() cost_history[iteration] = compute_cost(X,y,theta) return theta,cost_history data=np.loadtxt('F:\\python\\机器学习\\data\\梯度下降求解逻辑回归\\梯度下降\\data\\logireg_data.txt',delimiter=',') m=len(data) X=data[:,:-1].reshape(m,1) ones=np.ones((m,1)) X=np.hstack([ones,X]) y=data[:,-1:] iterations = 1500; alpha = 0.01; theta = np.zeros([2,1]) theta ,cost_history=gradient_descent(X,y,theta,alpha,iterations) print("Theta found by gradient descent:") print(theta) ``` 此段程序首先加载了一个CSV文件中的数据集,然后执行了批量梯度下降算法来寻找最佳拟合直线的斜率和截距[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值