- 博客(79)
- 收藏
- 关注
原创 高性价比GPU租用平台的全方位指南(2025版)
作为国内知名算力平台之一,凭借,成为高校、科研机构及AI企业的首选。以下从功能解析、价格优势、服务亮点三大维度,带你看懂智星云的核心竞争力。
2025-04-03 17:55:15
376
原创 【智星云算力】Boss不让对外讲的四个隐藏功能,一定要牢记并收藏!
算力市场-控制台-领优惠券,每周一的上午都会更新新的优惠券,领完再去租用实例,又能省很多钱。宝子们,只要你是用智星云GPU的,这四个功能一定要知道,否则就亏大了!预计今年4月中旬这个功能就会上线,现在退款还是建议在官网直接联系客服。发起申请后,只要退款理由充分,有专人审核将款项原路做退款。目前的积分商城以电子商品、日常用品为主,都是用得上的产品。*迁移需要选择到期保留磁盘,当前实例已选择保留磁盘。平时我们在租用GPU所产生的费用,都会转化成积分。控制台-实例-更多-迁移实例就可以一键迁移了。
2025-03-26 16:58:46
203
原创 【分享】免费的DeepSeek R1+RAG本地知识库,即开即用!
智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/找到刚刚新建的AI助理,点击聊天位置的“蓝色+”,输入你的问题,开始使用Agent助理。点击“新增文件-本地上传”,上传你的PPT,PDF,word等文件,然后“确定”输入名字后,拉到底部,点击“确定”
2025-03-19 15:32:12
384
原创 一分钱不花,5分钟搞定QwQ-32B部署,中小团队可以考虑。
320亿参数的千问QwQ-32B,在数学推理、代码生成能力完全能够比肩DeepSeek R1 671B满血版,在AIME24评测分数几乎持平,LiveCodeBench还更高!支持部署到(chatbox, cherry chat, open webui, anythingllm)电脑客户端+APP移动端。第二步:一键部署到chatbox, cherry chat, open webui, anythingllm等软件。第一步:创建API密钥,支持创建多个API,可以分给团队的每位成员进行单独部署。
2025-03-13 16:12:13
314
原创 【分享】千问 QwQ-32B在线版,推理速度太快了!100个token/秒
将“API域名”及“模型名”分别粘贴到chatbox的API域名及自定义模型中。第二步,举例chatbox,点击复制API密钥到chatbox设置中。*注意将模型从DeepSeek R1切换成qwq 32b。第四步,点击保存,点击“新对话”就可以使用了。第一步,创建API密钥(支持创建多个), anythingllm等。无需代码,API一键部署!第三步,找到API调用信息。支持对话及文件上传分析。QwQ-32B性能比肩。
2025-03-11 09:23:15
285
原创 DeepSeek满血版云端私有化部署实测数据首次公开,支持知识库!
综合各并发级别的测试数据,deepseek-R1 模型在低并发(5、15)下响应较快,但随着并发数提高(25至55),系统吞吐量虽不断提升,但平均延时及每token生成时间也随之增加,特别是在高并发下尾部延时明显上升,模型在高并发环境下能够稳定处理请求。测试指标涵盖整体耗时、吞吐量、每秒请求数(QPS)、平均响应延时、首 token 响应时间(TTFT)、每个输出 token 生成耗时(TPOT)、以及输入/输出 token 数量等。下表为各并发场景下的核心指标(平均吞吐量单位:tokens/s;
2025-03-07 15:53:52
405
原创 DeepSeek R1满血无量化版,DeepSeek V3在线免费平台分享
2.使用时,点击“R1深度思考”前显示白色,为DeepSeek V3模型,点击后变成蓝色则进入了DeepSeek R1深度思考模式。DeepSeek V3&R1满血版均已在智星云算力上线,支持PC端+移动端。1.进入网页后,选择箭头所指DeepSeek-R1 671B WEB 模型。✔️DeepSeek R1-671B满血版,推理超智能!✔️DeepSeek V3没有推理链,秒答超流畅!简单问题用V3,复杂问题找R1!
2025-02-24 14:29:38
177
原创 DeepSeek R1-671B满血版免费平台
过去的两周,AI和算力行业上演了一场魔幻现实大戏:无数平台高举「DeepSeek满血版免费」大旗疯狂引流,用户只能在反复宕机的官方服务器与性能缩水的「阉割克隆体」间疲于奔命。智星云GPU算力平台接入DeepSeek R1满血版API,支持在线直接使用,也可以调用API,通过Chatbox一键部署。当我问智星云API版本DeepSeek和DeepSeek官网同一个问题时,它们的表现惊人的一致。这次,真·满血版(DeepSeek R1 671B)来了!点击保存(注意看图标红部分,要与智星云提供的信息保持一致)
2025-02-20 14:18:13
440
原创 智星云第1期:19个用户常见问题
如用户未能及时充值续费,磁盘释放,则不能找回。A:一般申请开发票后三个工作日内能开出,其中高校一般申请的是普票,企业申请的是专票,如不一样请和财务确认好再平台上申请。**A:**如何充值和对公转账,在平台:控制台 / 账户充值,可选择支付方式,有微信支付、支付宝支付、对公支付,三种方式。**A:**释放后选择“租用结束后保留全部磁盘”可以找回,选择“租用结束后删除全部磁盘”则不能找回,如下图所示。**A:**国外源下载慢是因链路问题导致,建议使用VPN解决,平台不提供VPN服务,需用户自行解决。
2025-02-18 09:52:03
732
原创 DeepSeek-R1满血版(671B),智星云API部署教程
智星云GPU算力平台推出DeepSeek R1满血版API,通过Chatbox即可一键部署。安装步骤第一步:PC端进入官网注册,找到DeepSeek R1的API信息。
2025-02-17 17:05:35
343
原创 一招解决deepseek R1卡顿难题,完全的0卡顿满血版!
在通过租用算力这种方式时,有个部署环境和下载AI插件的过程,需要10~20分钟,如果不保留磁盘那么实例到期后,你再次开启实例,就要再次去等待部署和下载,保留磁盘后一键启动实例,就不再需要等待部署,可直接使用deepseek,所以这里是建议保留磁盘。实际上,Deepseek目前卡顿的主要原因其实就是算力不足,无论是官网还是硅基流动API,都是采用的算力池的模式,几千万人都在“一锅搅马勺”吃饭,怎么可能不卡呢。Deepseek官网好歹隔半小时还能刷出来一个回复,然后硅基流动API,第一条提问就没有然后了。
2025-02-07 14:05:08
765
原创 GPU成本降低65%!这套DeepSeek企业部署方案,正在被AI行业疯传
硬件需求:4-8张A100 80G,搭配DeepSpeed Zero-3优化,可处理30B参数模型。集群规模:64-128张H100,通过InfiniBand互联,实现3-4周内完成训练。企业级(百万级+):H100集群+InfiniBand网络,支持千亿参数模型。显存需求:70B模型约需140GB显存(INT8量化),需多卡并行或模型切分。70B+参数:需大规模集群(如64+张GPU),适合头部企业或云服务商。7B-13B参数:适合中小型企业,需中等算力(如8-32张GPU)。
2025-02-05 15:22:59
2312
原创 干货分享 | 认识AI,从100个AI热词开始
从基础概念到高级技术,AI的应用已经渗透到我们生活的方方面面,从智能手机的语音助手到自动驾驶汽车到金融分析,AI正以前所未有的速度改变着我们的世界。智星云小光为大家汇集了100个AI热词,带领大家对AI人工智能有个全面的认识。
2024-12-20 15:04:51
797
原创 智星云OpenAPI已上线,有需要的赶紧马住
智星云OpenAPI已上线,有需求的请直接打开API文档接入。也可以在智星云算力市场中查看:控制台-OpenAPI
2024-12-19 17:42:22
352
原创 智星云技术文档:GPU测速教程
在智星云平台上进行GPU测速教程,可以帮助用户了解所使用的GPU实例的计算性能,从而优化应用配置或选择更适合的实例类型。
2024-12-13 16:14:04
423
原创 智星云新手须知:如何选择GPU
智星云平台分配GPU、CPU、内存的机制为:按租用的GPU数量成比例分配CPU和内存,算力市场显示的CPU和内存均为每GPU分配的CPU和内存,如果租用两块GPU,那么CPU和内存就x2。此外GPU非共享,每个实例对GPU是独占的。
2024-12-13 13:57:09
675
原创 智星云新手须知:13个常见问题
智星云新手须知是智星云的常见问题包括账号、开票、授信申请、折扣福利、实例启动、上传/下载、如何设置端口、程序显示Killed停止等方面,旨在为用户提供解决方案和操作指导。
2024-12-10 16:02:12
1198
原创 【平台更新公告】:发票系统优化升级 & 新增微信扫码登录功能
1.开具发票系统调整: 新版本中,开具发票功能仅支持已消费金额的开具。对于老版本中的充值金额开具需求,请联系客服人员协助处理。2. 新增微信扫描登录功能: 为提升用户体验,平台现已支持微信扫描登录。用户可以在“控制台—我的账号—安全中心”绑定微信,实现快速扫码登录。
2024-10-25 17:36:23
232
原创 国内算力浪费竟然超过50%,提升算力利用率方法曝光
近日,在百度智能云技术论坛上,许多人关注到了一个新的问题:在大模型训练中,算力的有效利用率不足50%。这意味着企业在训练过程中,有超过一半的算力资源被浪费。
2024-10-18 15:53:05
511
1
原创 ollama使用llama3.1案例
平台管理和调度超过1000台GPU服务器,服务器类型包含H800、 A800、 V100、 4090、3090、 3080、2080TI、1080TI 等英伟达全系列服务器,和多种国产信创GPU服务器,公司团队对各种类型及品牌的GPU服务器有着丰富组装和运维经验。算力方面可以通过智星云来实现,智星云是安诺其集团全资子公司上海亘聪信息技术有限公司旗下的GPU算力平台。我们可以在命令行中与他交互。就这么简单就能运行起来了。当然我们也可以用接口访问。我们会看到一个注册页面。是我们开放的端口之一。
2024-08-14 16:51:14
1423
原创 人类AI编年史,值得收藏!
1943年,美国神经生理学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts),基于人类大脑的神经网络,发表了《A logical calculus of ideas immanent in nervous activity(神经活动中内在思想的逻辑演算)》论文,提出了一个形式神经元的计算机模型,并将其取名为M-P(McCulloch&Pitts)模型。这个程序具有“学习能力”,可以通过对大量棋局的分析,逐渐辨识出“好棋”和“坏棋”,从而提高自己的下棋水平。
2024-08-06 19:12:06
2546
原创 Meta开源「分割一切」2.0模型,视频也能分割了
在其前身的基础上,SAM 2 的诞生代表了领域内的一次重大进步 —— 为静态图像和动态视频内容提供实时、可提示的对象分割,将图像和视频分割功能统一到一个强大的系统中。Meta 多次强调了最新模型 SAM 2 是首个用于实时、可提示的图像和视频对象分割的统一模型,它使视频分割体验发生了重大变化,并可在图像和视频应用程序中无缝使用。SAM 2 仍然是一个庞大的模型,也只有像 Meta 这样的能提供强大硬件的巨头才能运行,但这种进步还是说明了一些问题:一年前,这种快速、灵活的分割几乎是不可能的。
2024-08-06 18:37:50
795
原创 马斯克揭晓超算中心,训练FSD与机器人,网友:算力遥遥领先
供应商中,余承东今年也在智选车发布会上,不断更新云端算力数据,6月底华为用于ADS迭代的算力已达3.5E FLOPS,按照过往增长速度来看,明天的享界S9发布会上可能会突破4E FLOPS。Dojo首次亮相于2021年特斯拉的AI Day,三年来不断发展,据马斯克此前透露,Dojo 1今年年底将拥有相当于8000张H100的算力,“不算多,但也并非微不足道。关于这一超算集群,马斯克此前披露过多条信息,包括其硬件来源,巨额投入,以及需要的耗电量,同样惊人。
2024-08-06 16:23:39
911
原创 免费不限次!智谱清影一上线就被玩疯了,国产AI视频生成卷起来了。
而后,智谱在CogView的基础上延伸,于2022年提出并开源了在业界颇具影响力的文生视频模型CogVideo,这项工作被Meta提出的 Make-A-Video、Google的 Phenaki 和 MAGVIT、微软的女娲 DragNUWA、英伟达的 Video LDMs 等视频生成模型所引用。而一个能帮助用户高效提供创意参考的前提是,模型能很好的理解并遵循用户的指令,之后才是视频生成的质量、时长、清晰度等其他因子,其余的就得交给“抽卡大法”了。但如果配合上高级提示词技巧+抽卡大法,瑕疵问题能大大改善。
2024-08-06 15:25:27
681
原创 六大AI视频测评,到底哪个最适合你?
onestory.art的界面还是非常直观的,用户只需要根据文字提示就能操作了,而且特别贴心的一点是,如果遇到不懂的操作,点击一下就会有超级详细的视频讲解,完全保姆级操作,而且他能根据你输入的一句话自动生成故事分镜,这也太智能了吧,AI分镜真的厉害!pika的视频,总感觉听不懂用户的指令,无法准确的生成理想的视频内容,而且对于输入描述的准确性要求高,需要提供非常清晰和准确的描述,否则可能生成不符合预期的结果。生成的视频是否紧密围绕给定的主题,不出现偏离或无关的内容。
2024-07-30 14:53:59
2922
原创 终于有人把大模型的内部一致性和自反馈讲明白了!
因此,本研究旨在通过提出内部一致性的理论框架,为这些现象提供统一的解释,并介绍一种有效的自我反馈框架,以挖掘和提升LLMs的内部一致性,从而提升其推理能力和减少幻觉内容。自反馈框架可以通过加强模型对语料库先验的拟合来增强模型的一致性,从而消除不确定性,提高一致性,整体改善了模型性能。大模型的“自我反馈”(Self-Feedback)是一个理论框架,旨在通过模型的自我评估(Self-Evaluation)和自我更新(Self-Update)来提升其内部一致性,进而改善其推理能力和减少幻觉文本的生成。
2024-07-25 17:49:21
712
原创 快手可灵全球上线,无需排队,我们终于向全世界输出中国Sora
在价格上,算下来是1条高性能5s视频是0.5rmb,也就是5毛钱,如果你玩跑失败了的话,也是不扣钱的,对比Runway的Gen3和Luma,这个价格还是很实惠的。AI Chat最好的是ChatGPT和Claude,AI绘图最好的是Midjourney,AI声音最好的是11Labs,就连套壳,最好最全的也是国外的POE。不过这也正常,为爱发电,肯定走不远的,而且我一个视频等一个小时,也特么挺离谱的,早收费早好,也可以保证付费用户的试用体验。而且最最最最最关键的是,终于可以TMD去水印了!
2024-07-25 17:16:02
822
原创 dynslam的安装
opencv需要设置版本, 如果是2.x 要在cmakelist里改对应版本, 中间加个2.有可能源码单词错误:glDrawFrustrum -> glDrawFrustum。原因, 一定要从DynSlam的git链接中去找对应的依赖库。下载opencv2.4.9。
2024-07-25 16:14:22
288
原创 GPU无法调用的解决方式
③显存有占用,但是GPU占用率一直为0。这种case可以分两种,一种安培架构的GPU(30系列的卡、A40、A100、A5000等)需要使用CUDA11.X。另一种case为代码未使用GPU,只不过import框架和构建网络时,框架会分配显存,因此看到的情况就是显存有占用,但是未使用GPU。②显存有占用,GPU占用率不为0,但是波动较大,此时正常使用了GPU,可以优化程序使GPU利用率更高。①显存无占用,那么可能是安装的框架为非GPU版本。*以上红色框标记的分别为显存占用和GPU使用率。
2024-07-25 16:05:36
1744
原创 基于ssh的链接异常解决方法
一般原因为HOST冲突,比如此类情形: 在同一个地区租用了A和B两个实例,由于A和B只是HOST名称相同端口不同,于是VSCode在ssh/config文件中写入的配置信息HOST别名一模一样,当A关机而B实例开机时,连接B实例会导致VSCode错误连接A,导致连接失败。此时解决方法为:删除报错信息中的known_hosts、config文件(本地文件,每个人看到的路径可能不同),如果是rsa密钥的权限错误,Windows用户请修改密钥的权限为只读,Linux/Mac 执行chmod 600 rsa文件。
2024-07-18 13:56:20
512
原创 jupyter notebook连接linux
本文主要介绍智星云主机windows系统、Ubuntu系统下如何配置jupyter密码和启动jupyter,部分软件执行位置可能有所不同,请自行修改至合适位置。
2024-07-18 11:54:53
653
原创 “萝卜快跑”市场、算力、技术、大模型解析!
而规划大模型,基于对大量人驾数据的训练学习,正在实现从拟人到超越人的跃升,逐步形成在强交互场景更完善的安全处理能力,以及预判和规避潜在风险的能力。可租可买,随用随开,按小时计费,环境可以保存,huggingface,github访问速度快,同时支持镜像定制,边缘计算、量子计算、绿色计算、高性能计算和混合云计算等均可支持。在早期的行为决策算法,工程师想出所有可能的“if-then 规则”的组合,然后再用基于规则的技术路线对汽车的决策系统进行编程,这种方式难以穷举所有可能的情形。Cruise LLC(美国)
2024-07-12 13:59:46
1335
原创 2032年,计算能力市场规模将达到 813 亿美元!
计算能力市场在2023 年的价值为457 亿美元,预计到 2032 年将达到813 亿美元,预测期内的复合年增长率 (CAGR) 为6.8%。这一增长主要得益于对高效计算不断增长的需求和虚拟化技术的进步。IT 行业的不断多样化和扩张也为市场扩张做出了重大贡献。此外,对混合高性能计算 (HPC) 解决方案的偏好正在上升,进一步推动了市场增长。计算能力统计到2023 年,在人工智能和高性能计算增长的推动下,全球计算能力预计将达到1.1 zettaflops 。2024年,全球AI应用对算力的需求预计将
2024-07-11 17:56:15
444
原创 AI赛道成功的“小”AI平台,都在做什么?
例如“姓氏头像”模板的应用,只需要接入AI光影字的API,就可以预先配置关键词和参数,即使是完全不了解AI的小白用户也能轻松一键生成,然后去小红书、抖音发布内容积累粉丝,最终实现变现的目标。这也正是意间ai在过去的半年里,在AI绘画的基础上,走出来的一条通路,大约有三家友商接入了API做同样的事情,而且衍生出了一些细小的新的垂直领域,目前运营状况良好。很多AI博主都是全职,博主式AI创作者的推广意愿高,老带新,师傅带徒弟,也是AI圈的普遍规则现象,所以在裂变式的增长方面一直很有搞头。
2024-07-10 17:22:19
250
原创 算力租赁指南:如何找到最适合你的算力平台?
优秀的算力租赁商不仅拥有专业团队,能迅速响应并解决技术难题,还会提供详尽的文档和教程,帮助用户高效地管理和优化资源。因此,在选择时,不仅要考虑单价,还要结合自身需求量和使用频率,综合评估长期成本,寻找性价比最高的方案。不仅满足了用户对高性能计算的基本需求,还提供了极具竞争力的成本效益、无忧的客户服务和严格的数据安全保障,使其成为1000家企业和3000国内高校的理想算力合作伙伴。7*18小时服务模式,随用随开,按小时计费,环境可以保存,huggingface,github访问速度快,同时支持镜像定制。
2024-07-04 16:18:58
972
原创 当我问AI,智星云算力有什么特点时,答案出乎意料!
另外就是一些更具体的特点没有展现出来,比如GPU丰富,拥有1080TI、2080TI、3060 、 A10、 A40 、 V100 、A100 、A800、H100、H800等英伟达全系列产品。唯一的错误是在“分钟计费”这里,之前确实是按分钟计费过,今年改成了按小时计费,大约一小时0.75元起。随用随开,按小时计费,环境可以保存,huggingface,github访问速度快,同时支持镜像定制。7*18小时服务模式,任何问题均有客服及时处理,并且未用完的余额支持随时退款等。
2024-07-02 17:00:32
333
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人