PerfXCloud开箱使用体验

最新推荐文章于 2024-12-13 14:15:29 发布

原创最新推荐文章于 2024-12-13 14:15:29 发布 · 1.3k 阅读

CC 4.0 BY-SA版权

文章标签：

创建账号

首先访问PerfXCloud的官网，使用手机号或者邮箱注册，整个注册的过程很简单（好评）。

注册完毕，登陆账号，进入到控制台，目前版本的页面比较简单，一目了然。目前登陆送20w余额，笔者深度使用了十余天，调用了2800次，仅使用了120元。可以看到调用模型的成本极低，就算20w消耗完了，也可以使用邮箱注册小号（薅羊毛）。所以，目前PerfXcloud可以说是完全免费。

PerfXCloud当前的核心功能就是提供大模型调用服务，所以了解平台支持哪些模型是很有必要的。

访问模型广场处，能够看到目前已经适配和支持的22款模型。其中不仅有大语言模型，还有embdding模型，从模型类型中可以推测出，后续应该还会推出视觉模型和多模态模型。值得一提的是，PerfXCloud上支持的超大参数的大模型72B、110B（好评）。

PerfXCloud支持使用 Open API 调用，并支持使用 Access Token 的方式进行服务鉴权。访问令牌页面，就可以创建令牌啦。令牌的创建非常灵活，可以设置该令牌支持的模型、额度、IP等。

看得出PerfXCloud想要兼容 OpenAI ，甚至连 Token 的前缀（sk-）都保持了一致，这样在一些开源软件中，是可以符合老版本 OpenAI SDK 或者兼容的 SDK 的验证规则的。点击界面中的复制令牌按钮，就能够得到模型调用的API key啦，格式和长度类似于下面：

sk-WS8iKdZVBNpSQxxxxxxxxx7615114727Be134338B0519378

在平台上快速使用模型有两个方案，分别是网页端的体验中心和使用API进行调用。

想要在PerfXCloud上快速体验到大模型，最简单的方法就是访问体验中心，体验中心也就是模型的聊天页面。

目前体验中心仅支持语言模型，可以选择你想使用的大模型，然后在聊天输入框输入内容，发送消息，就能够看到推理飞快的响应结果。此外，还可以设置模型的参数，如：max_tokens、stream、temperature、prompt等，用户可以对比不同参数的结果（好评）。

相比在平台上体验模型chat的功能，更多的使用场景肯定是使用 API，在各种软件中使用平台提供的模型能力，比如：langchain、dify、llama-index，或者各种 ChatWeb、RAG、Agent应用里。

调用大模型的方法很简单，可以在模型广场处查看模型详细，例如查看Qwen2-72B-Instruct-GPTQ-Int4的详细页面。

可以看到平台提供了模型的调用案例，目前有crul的方式和python。例如调用Qwen2-72B-Instruct-GPTQ-Int4的方法如下：

可以看出，PerfXCloud上调用大模型的方式就是OpenAI的调用方法，所以可以很丝滑的将PerfXCloud接入到各种使用OpenAI接口开发的软件中，仅需要修改下base_url。

PerfXCloud提供了详细的使用文档和生态应用案例视频。

目前生态应用案例视频共有12个，包含了热门的开源大模型应用项目，比如：ChatGPT-Web、Dify等，此外还有入门级的大模型开发项目。根据这些案例视频可以很容易的学会如何从OpenAI切换到PerfXCloud，并且为小白入门大模型应用开发提供了案例（好评）

这篇文章就先写到这啦，总的来说PerfXCloud还是很值得使用的。上手门槛低，支持主流的大参数模型，重要的是目前完全免费。当然PerfXCloud目前也存在一些局限性，比如：模型单一、功能单一等，但目前还在测试阶段，让我们保持耐心，期待它未来的发展吧。