创建账号
首先访问PerfXCloud的官网,使用手机号或者邮箱注册,整个注册的过程很简单(好评)。
注册完毕,登陆账号,进入到控制台,目前版本的页面比较简单,一目了然。目前登陆送20w余额,笔者深度使用了十余天,调用了2800次,仅使用了120元。可以看到调用模型的成本极低,就算20w消耗完了,也可以使用邮箱注册小号(薅羊毛)。所以,目前PerfXcloud可以说是完全免费。
当前支持的模型
PerfXCloud当前的核心功能就是提供大模型调用服务,所以了解平台支持哪些模型是很有必要的。
访问模型广场处,能够看到目前已经适配和支持的22款模型。其中不仅有大语言模型,还有embdding模型,从模型类型中可以推测出,后续应该还会推出视觉模型和多模态模型。值得一提的是,PerfXCloud上支持的超大参数的大模型72B、110B(好评)。
获取令牌(API key)
PerfXCloud支持使用 Open API 调用,并支持使用 Access Token 的方式进行服务鉴权。访问令牌页面,就可以创建令牌啦。令牌的创建非常灵活,可以设置该令牌支持的模型、额度、IP等。
看得出PerfXCloud想要兼容 OpenAI ,甚至连 Token 的前缀(sk-
)都保持了一致,这样在一些开源软件中,是可以符合老版本 OpenAI SDK 或者兼容的 SDK 的验证规则的。点击界面中的复制令牌按钮,就能够得到模型调用的API key啦,格式和长度类似于下面:
sk-WS8iKdZVBNpSQxxxxxxxxx7615114727Be134338B0519378
使用模型
在平台上快速使用模型有两个方案,分别是网页端的体验中心和使用API进行调用。
体验中心
想要在PerfXCloud上快速体验到大模型,最简单的方法就是访问体验中心,体验中心也就是模型的聊天页面。
目前体验中心仅支持语言模型,可以选择你想使用的大模型,然后在聊天输入框输入内容,发送消息,就能够看到推理飞快的响应结果。此外,还可以设置模型的参数,如:max_tokens
、stream
、temperature
、prompt
等,用户可以对比不同参数的结果(好评)。
API调用
相比在平台上体验模型chat的功能,更多的使用场景肯定是使用 API,在各种软件中使用平台提供的模型能力,比如:langchain、dify、llama-index,或者各种 ChatWeb、RAG、Agent应用里。
调用大模型的方法很简单,可以在模型广场处查看模型详细,例如查看Qwen2-72B-Instruct-GPTQ-Int4的详细页面。
可以看到平台提供了模型的调用案例,目前有crul的方式和python。例如调用Qwen2-72B-Instruct-GPTQ-Int4的方法如下:
可以看出,PerfXCloud上调用大模型的方式就是OpenAI的调用方法,所以可以很丝滑的将PerfXCloud接入到各种使用OpenAI接口开发的软件中,仅需要修改下base_url
。
文档和案例教程
PerfXCloud提供了详细的使用文档和生态应用案例视频。
目前生态应用案例视频共有12个,包含了热门的开源大模型应用项目,比如:ChatGPT-Web、Dify等,此外还有入门级的大模型开发项目。根据这些案例视频可以很容易的学会如何从OpenAI切换到PerfXCloud,并且为小白入门大模型应用开发提供了案例(好评)
最后
这篇文章就先写到这啦,总的来说PerfXCloud还是很值得使用的。上手门槛低,支持主流的大参数模型,重要的是目前完全免费。当然PerfXCloud目前也存在一些局限性,比如:模型单一、功能单一等,但目前还在测试阶段,让我们保持耐心,期待它未来的发展吧。