使用java调用deepseek,调用大模型,处理问题。ollama

在这里插入图片描述
废话不多,直接上代码

@Test
    public void test7171111231233(){
        // url:放请求地址
        String url = "http://localhost:11434/api/generate";
        HttpRequest request = HttpUtil.createPost(url);
        Map<String, String> headers = new HashMap<>();
        String authorization = "";
        headers.put("Authorization", authorization);
        request.addHeaders(headers);
        JSONObject jsonObject = new JSONObject();
        jsonObject.put("model","deepseek-r1:1.5b");
        jsonObject.put("prompt","3*4 结果是什么,不要分析和解读。");
        jsonObject.put("stream",false);
        // 封装参数,对象转json
        String body = JSONUtil.toJsonStr(jsonObject);
        // 发送请求
        String infoStr = request.body(body).timeout(30000).execute().body();
        System.out.println();
    }

这里请求的时候ollama提供的api,指定你
1下载好的模型就行
2输入问题
3发送请求

安装ollama,傻瓜式安装
https://ollama.com/download
下载安装就行
在这里插入图片描述
安装deepseek
在这里插入图片描述
我这里选择的是1.5b毕竟是测试
在这里插入图片描述
复制命令,在终端中运行就行,首次会下载指定的模型。
在这里插入图片描述
在这里插入图片描述
这里就是已经安装好了。我这里是第二次打开,所以直接对话,第一次会有进度条,下载,5分钟后就好了。

然后就可以自己写一个代码测试一下了。

### Java 调用 OllamaDeepSeek 性能优化 当Java应用程序调用Ollama使用DeepSeek模型时,性能可能会受到多种因素的影响。为了提高效率并减少延迟时间,可以考虑以下几个方面: #### 1. 网络连接配置 确保网络环境稳定且带宽充足,因为每次请求都需要通过互联网传输数据到远程服务器进行推理计算[^1]。 #### 2. 并发控制策略 合理设置并发线程数以充分利用多核CPU资源而不至于造成过多上下文切换开销;同时也要注意避免因过度竞争而导致的锁争用现象发生[^3]。 #### 3. 缓存机制应用 对于重复性的查询操作可引入本地缓存层(如Redis),这样能够有效降低对外部服务依赖度的同时也加快响应速度[^2]。 #### 4. 批量处理技术 如果业务场景允许,则尽可能采用批量提交方式代替单次频繁交互模式,以此减少整体耗时并提升吞吐率。 ```java // 示例代码展示如何实现简单的批处理逻辑 public class BatchProcessor { private static final int BATCH_SIZE = 10; public void processRequests(List<String> requests) throws InterruptedException { List<List<String>> batches = partition(requests, BATCH_SIZE); for (List<String> batch : batches) { sendBatchToServer(batch); // 发送一批请求给OLLAMA API Thread.sleep(500); // 设置适当间隔防止过载 } } private List<List<String>> partition(List<String> list, int size){ List<List<String>> result = new ArrayList<>(); for(int i=0; i<list.size();i+=size){ result.add(list.subList(i, Math.min(i + size, list.size()))); } return result; } } ``` 以上方法可以帮助改善Java程序调用Ollama及其下的DeepSeek模型的速度问题。当然具体效果还需根据实际应用场景做相应调整和测试验证。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

谷咕咕

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值