
NLP
NLP
dev.null
这个作者很懒,什么都没留下…
展开
-
DeepSeek 是否被过度吹捧了?
DeepSeek 的确取得了不错的成果,不过可能没有媒体宣传和人们想象中那么重大。它的轰动性主要在于以低廉的成本达到了前沿模型相近的效果,但是并没有显著超越其它前沿模型,而它的低廉成本也是存在争议的,可能是因为进行了蒸馏训练等原因导致成本被低估了。然而,由于一些技术以外的因素,围绕其的宣传可能存在夸大成分。因此,业界应保持理性,客观评估其技术实力和市场影响。二、国内民众由于众所周知的原因无法访问国外前沿模型,导致民众误认为 DeepSeek 遥遥领先于国外的模型,也就是说大多数民众存在信息滞后的情况。原创 2025-03-17 22:50:45 · 236 阅读 · 0 评论 -
在离线情况下如何使用 Python 翻译文本
建议根据实际需求选择方案:对质量要求高的场景使用Argos或HuggingFace方案,对资源受限的环境使用词典方案。所有方案都需要提前在有网络的环境下完成模型/词库的下载部署。原创 2025-03-15 22:54:11 · 504 阅读 · 0 评论 -
大语言模型的潜力是否被高估
关于大语言模型(LLM)的潜力是否被高估,目前学术界和产业界存在显著分歧。一、技术能力的争议:潜力与局限并存。原创 2025-03-13 22:30:54 · 369 阅读 · 0 评论 -
如何本地部署llm
总结一下,本地部署LLM的关键步骤包括准备硬件环境、安装依赖、加载预训练模型、优化性能、创建API服务并进行部署。如果有任何问题或具体的实现细节,随时告诉我!LLM通常需要大量的计算资源。特别是像GPT、BERT之类的模型,它们需要较强的GPU或TPU支持。如果模型非常大,或者你计划部署多个模型实例,可能需要考虑负载均衡和资源管理工具,如Kubernetes等。大多数LLM都有预训练模型可供使用。接口,你就可以发送文本并得到模型的推理结果。原创 2025-02-23 18:51:50 · 518 阅读 · 0 评论 -
哪些办法可以判断程序员技术面试时是否使用了AI辅助
特别是一些简单的问题,却要“思考”好久。有时候选人为了掩盖停顿,会先复述问题,或者先模棱两可地回答一下,然后突然“灵光一现”,回答正确答案(AI这时生成好了)。针对这种情况,可以使用一些方法来判断,例如,发送一些AI相对较难识别的代码块图片,让候选人说出运行结果和解释,候选人如果和之前的对答如流有明显的反差,则可能是用了AI。因此,面试官应综合考虑候选人的整体表现,包括非语言线索,如肢体语言和面部表情,以做出更全面的判断。:如果候选人的回答过于流畅、结构清晰,且缺乏个性化细节,可能是AI生成的内容。原创 2025-02-11 23:20:33 · 171 阅读 · 0 评论 -
deepseek和chatgpt对比
总的来说,ChatGPT 更注重生成和互动,而 DeepSeek 则偏重于信息检索和深度分析。两者有不同的应用重点,具体选择取决于你的需求。DeepSeek 和 ChatGPT 都是自然语言处理领域的工具,但它们的设计目标和功能有所不同。原创 2025-02-11 21:01:54 · 1295 阅读 · 0 评论 -
目前,机器翻译英译日的效果远低于英译中
来源: https://scholar-press.com/uploads/papers/W8VFe2jz0Iz7wVY3lNvzeXeOyjAQU8gZMbXCewzD.pdf。原创 2025-02-06 20:27:36 · 161 阅读 · 0 评论 -
除了网页,还有哪些方式可以访问deepseek r1
例如,微软已将 DeepSeek 的 AI 模型集成到 Azure 云平台,用户可以在 Azure 上使用 DeepSeek R1。:DeepSeek 已推出适用于 iOS 和 Android 的移动应用,用户可以通过这些应用在手机上直接使用 DeepSeek R1。:开发者可以通过 DeepSeek 提供的 API,将 R1 模型的功能集成到自己的应用程序或平台中,实现自动化的数据检索和处理。请注意,使用 DeepSeek R1 时,可能需要注册账户,并遵守相关的使用条款和隐私政策。原创 2025-02-05 22:58:47 · 501 阅读 · 0 评论 -
如何获取 DeepSeek 多模态大模型 Janus-Pro-7B
DeepSeek 团队近期开源了新一代多模态模型 Janus-Pro-7B,该模型在图像生成和多模态理解方面表现卓越,超越了OpenAI的DALL-E 3,并在基准测试中取得了优异成绩。Janus-Pro-7B 的代码和模型参数已经分别在 github 和 huggingface 上开源,我们拉取到本地后就能运行使用了。由于模型比较大,约为15G,下载比较耗时,请耐心等待。下载成功后就可以进行下一步使用了,将在下一期分享。原创 2025-01-29 00:21:03 · 6930 阅读 · 0 评论 -
如何构建一个 GraphRAG 系统
构建一个。原创 2025-01-24 23:43:57 · 1075 阅读 · 0 评论 -
Supervised Fine-Tuning(监督式微调)
Supervised Fine-Tuning(监督式微调) 是机器学习和深度学习领域中的一个重要概念,尤其是在自然语言处理(NLP)和计算机视觉等领域中被广泛使用。以下是对这个概念的详细介绍:Supervised Fine-Tuning 是指在有监督学习框架下,通过给模型提供标注过的数据(labelled data),对一个已经预训练的模型(pre-trained model)进行进一步的调整和优化。这种方法通常用于将一个通用模型(general model)适配到特定任务或领域中,例如从自然语言生成模型原创 2025-01-05 17:52:39 · 1023 阅读 · 0 评论 -
如何看待deepseek-v3的发布
在多个基准测试中,DeepSeek-V3的表现超越了此前的所有开源模型,甚至超过了OpenAI的GPT-4o(8月发布),接近Anthropic的Claude 3.5 Sonnet(10月发布)。此外,DeepSeek-V3的成功也显示出,即使在硬件资源有限的情况下,通过数据与算法层面的优化创新,仍然可以实现高效的模型训练和推理。总的来说,DeepSeek-V3的发布展示了中国在人工智能领域的快速进步,特别是在模型性能提升和训练成本降低方面的创新,为未来人工智能技术的发展提供了新的思路。原创 2024-12-30 20:23:48 · 1255 阅读 · 0 评论 -
依图科技简介
公司专注于计算机视觉、语音识别和自然语言处理等核心AI技术,致力于推动AI技术在医疗、安防、金融等领域的落地应用。尽管面临挑战,依图科技凭借其强大的技术实力,仍然在国内AI行业占据重要地位。如果你对依图科技的具体产品或某一领域的应用感兴趣,可以告诉我,我可以为你提供更详细的信息!(YITU Technology)是中国一家全球领先的人工智能(AI)公司,成立于。原创 2024-12-26 22:26:54 · 945 阅读 · 0 评论 -
无法解析导入“langchain.text_splitter” Pylance
Pylance 的“无法解析导入”错误表明 VS Code 的 Python 分析器未能找到指定模块。如果已经安装,但问题仍然存在,确保安装在当前 Python 环境中。路径与 Pylance 使用的 Python 解释器路径一致。Pylance 有时无法识别动态加载的模块。如有进一步问题,请提供更多上下文信息,例如 Python 和。Pylance 使用的 Python 解释器可能与安装。替换为需要的版本号。原创 2024-12-05 20:48:16 · 627 阅读 · 0 评论 -
openai assistants api 创建的自定义 assistant 的 function 功能并不是调用外部服务,而是通过自定义的 prompt 创建的 function
容易让人误以为 function 和 GPTs 的 actions 是同样的功能,但是其实function并不调用外部服务,而是自定义的 prompt 创建的 function。原创 2024-11-28 22:55:14 · 144 阅读 · 0 评论 -
chatgpt plus 可以用国内银行卡支付吗
不支持国内银行卡支付。可能和没有开启国际支付有关,但是可能开启了国际支付仍然不可支付。原创 2024-10-31 21:47:25 · 473 阅读 · 0 评论 -
能够通过API访问GPTs吗
截止目前(2023.1.17)是不行的。即使你的账号是plus,可以通过API访问GPT-4等模型,但是GPTs目前只对网页或者APP开放。原创 2024-01-17 22:34:14 · 943 阅读 · 0 评论 -
用python微调gpt-3.5
语料:gpt_trainning.jsonl(至少需要10条,否则微调模型会失败)原创 2023-11-26 22:37:03 · 1351 阅读 · 0 评论 -
ChatGPT距离通用人工智能有多远
我们可以看到,ChatGPT的确具有一定的学习能力,能够根据用户的少量指示或者示例改变自己的回复,但是这种能力是较弱的,和人类有不小的差距,尤其是涉及逻辑推理的部分。自然语言只是真实世界的一个片面映射,即使是人类也会被误导和迷惑。ChatGPT虽然可以通过与人类对话等形式完善自身,但是没有形成闭环,一旦脱离技术人员的帮助,它的进化就容易卡在一个瓶颈,因为它的底层技术还不足以支持它只通过语料就不断进化,到一定程度必然需要改变底层技术,而即使在未来,ChatGPT也很难获得改变自己底层技术的能力。原创 2023-03-03 14:38:50 · 253 阅读 · 0 评论 -
免费的聊天机器人API
http://api.qingyunke.com/调用方法:效果还不错,只是返回有点慢。https://www.ownthink.com调用方法:原创 2022-07-05 17:19:40 · 5902 阅读 · 0 评论 -
修改pyunit_time使得其支持‘xx~xx月’的时间文本
因为需要使用时间文本转换为标准时间的功能,考察多种第三方包后选择了pyunit_time,但是还是有很多不尽人意的地方,所以把整个包拷出来,自己修改以满足需求。今天发现pyunit_time不支持‘’的表述,例如“”只会识别出9月,但是“”是可以识别出“6月”和“9月”,因此将“”转成“”就可以了,其实本质上也是个时间单位省略的问题。下面是原始代码(所在文件是/pyunit_time/filters.py):它采用的是正则匹配的方式,pattern调用了之前准备好正则表达式,像“x年”、‘x月’等,单独的原创 2022-07-05 15:05:52 · 144 阅读 · 0 评论 -
从入门到精通之专家系统CLIPS(一)CLIPS初识与概述
这几年,人工智能技术在国内越来越火,大部分都是神经网络算法一类的,其实人工智能技术还有一个重要分支—专家系统。专家系统是一个智能计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。也就是说,专家系统是一个具有大量的专门知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题,简而言之,专家系统是一种模拟人类专家解决领域问题的计转载 2022-06-21 10:15:28 · 2673 阅读 · 0 评论 -
认知语言学之框架与脚本
本PPT介绍了认知语言学中的框架与脚本,参考了德国语言学家温格瑞尔(Ungerer F)的《认知语言学导论》。原创 2022-06-14 21:11:22 · 390 阅读 · 0 评论