
架构
文章平均质量分 83
javastart
专注于大数据 AI
展开
-
深入解析大型应用架构:以dify为例进行分析
Dify 是一款开源的大语言模型(LLM)应用开发平台,旨在简化和加速生成式 AI 应用的创建和部署。它融合了后端即服务(Backend as a Service, BaaS)和 LLMOps 的理念,使开发者能够快速搭建生产级的生成式 AI 应用。即使是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。。让我们开始看代码吧(先摸清楚代码的“骨骼”)原创 2025-04-04 14:11:32 · 760 阅读 · 0 评论 -
docker mirrors (适合中国宝宝的镜像源)
在国内的访问速度极慢. 当时大家主要还是依赖国内的一些镜像源: 如中科院或alipapa etc. 但是今年逐渐所有的国内镜像站也逐渐关闭. 在墙内的小伙伴想要拉取镜像变成了很困难的事情。如果你正在使用 orbstack. 你也可以直接在 ~/.orbstack/config/docker.json 中编辑配置,然后用 orb restart docker 重启引擎。注: 视频中使用的是 orb. 基本操作和直接使用 docker 相同. 具体细节可以查看下面的配置方法.更多 orb 细节, 见。原创 2024-07-07 18:33:10 · 1481 阅读 · 0 评论 -
深度包检测(DPI)详细介绍
DPI(Deep Packet Inspection)深度包检测技术是在传统IP数据包检测技术(OSI L2-L4之间包含的数据包元素的检测分析)之上增加了对应用层数据的应用协议识别,数据包内容检测与深度解码。既可以检测2~4层,又可以检测应用层。原创 2023-03-02 14:01:28 · 3078 阅读 · 0 评论 -
Linux cached memory(缓存内存)
细心的朋友会注意到,当你在linux下频繁存取文件后,物理内存会很快被用光,当程序结束后,内存不会被正常释放,而是一直作为caching.这个问 题,貌似有不少人在问,不过都没有看到有什么很好解决的办法.那么我来谈谈这个问题.在我命令执行结束后,used为244MB,free为4MB,buffers为8MB,cached为174MB, 天呐都被cached吃掉了.别紧张,这是为了提高文件读取效率的做法.那么有人说过段时间,linux会自动释放掉所用的内存,我们 使用free再来试试,看看是否有释放>?转载 2022-10-05 10:49:21 · 1736 阅读 · 0 评论 -
性能指标理解-CPU load average
但现在硬件越来越便宜,核数庞大的机器也越来越大,如遇到机器的CPU核数很大,那么剩余的30%部分也越大,这个时候可以适当的调整下,只要不要到整个核数都用满。这三个字是要结合起来看的,如果机器持续在一段时间内都是load很高的,那么也许机器性能下降了,可能需要进一步排查问题,也许是要增加机器了。放出定义:load average 表示的是CPU的负载,包含的信息不是CPU的使用率状况,而是在一段时间内CPU正在处理以及等待CPU处理的进程数之和的统计信息,也就是CPU使用队列的长度的统计信息。转载 2022-09-23 16:52:46 · 708 阅读 · 0 评论 -
HTTP/2 和 Websocket
HTTP/2 和 Websocket原创 2022-08-17 08:23:42 · 1107 阅读 · 0 评论 -
商业智能BI分析报表很慢是什么原因?应该如何优化?
商业智能BI分析报表很慢是什么原因?应该如何优化原创 2022-08-11 15:05:00 · 269 阅读 · 0 评论 -
MySQL案例:binlog_row_image如何取舍
前言在MySQL数据库中,binlog是非常关键的日志文件,相关参数也是非常多;其中,binlog_row_image是一个很重要但又容易被忽略的参数。binlog_row_image参数,决定了binlog是如何记录前镜像和后镜像的,这也就会直接影响到数据闪回、主从复制等。概念首先,我们先介绍一下前镜像和后镜像:(1)前镜像(before image):记录修改前的内容(2)后镜像(after image):记录修改后的内容binlog_row_image参数,只在ro...转载 2021-03-05 18:23:47 · 773 阅读 · 1 评论 -
[MySQL 5.7]:binlog --statement
binlog解析1:statement1、配置文件设置:my.cnf[mysqld] binlog_format='statement'2、优缺点对比: 优点: binlog 文件小 日志中包含原始SQL,方便统计审计 缺点: 导致主从不一致 对一些系统函数不能准确复制或不能复制,在不同server上执行,返回的结果是不同的,则会造成数据不一致。 3、测试:查看事物隔离级别:设置事物隔离级别为默认RR 注意:5.7版本RC级别下不能设置为binlo...转载 2021-03-04 13:35:03 · 732 阅读 · 1 评论 -
Linux性能优化-磁盘I/O延迟很高
目录安装环境分析问题安装环境安装 bcc,docker启动dockerservice docker start运行环境如下docker中有三个文件分别如下io_app.py#!/usr/bin/env python# -*- coding: UTF-8 -*-import osimport uuidimport randomimport shutilfrom concurrent.futures import ThreadPoolExecu...转载 2021-01-13 16:02:45 · 535 阅读 · 0 评论 -
Docker Swarm Mode
目录Docker Swarm Mode. 1 1. Docker Swarm Mode简介... 3 1.1 Swarm mode基本概念... 3 1.1.1 Swarm.. 3 1.1.2 Node. 4 1.1.3 Services和tasks. 4 1.1.4 Load balancing. 4 1.1.5 Swarm mode跨主机使用... 6 2. Docker Swarm Mode基本操作... 6 2.1 示例环境及组件... 6 2.2 Docker安...转载 2020-08-20 17:44:36 · 1140 阅读 · 0 评论 -
MySQL 对于千万级的大表要怎么优化?
作者:互联网编程链接:https://www.zhihu.com/question/19719997/answer/549041957来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。修改回答,老有人说我是发广告,好吧,知乎不适合我这种玩第一我不是阿里,腾讯员工,而且我也没必要帮他们发广告 第二,阿里云国内第一,世界第三,不需要我这种小白发广告,本身...转载 2020-05-02 16:39:16 · 2632 阅读 · 0 评论 -
根据数据冷热程度分层存储,让HDFS更高效
摘要: 随着大数据技术相关技术的发展和普及,越来越多的公司开始使用基于开源Hadoop的平台系统,同时,越来越多的业务和应用也在从传统的技术架构迁移到大数据平台上。在典型的Hadoop大数据平台中,人们使用HDFS作为存储服服务Hadoop一、背景随着大数据技术相关技术的发展和普及,越来越多的公司开始使用基于开源Hadoop的平台系统,同时,越来越多的业务和应用也在从传统的技术架...转载 2020-04-19 19:14:07 · 3680 阅读 · 0 评论 -
使用Python「秒开」100GB+数据
本文转载自公众号量化投资与机器学习如果你50GB甚至500GB的数据集,打开他们都很困难了,更别说分析了。在处理这样的数据集时,我们通常采用3种方法。第一种对数据进抽样:这里的缺点是显而易见的,样本数据能否代表整个数据。第二种使用分布式计算:虽然在某些情况下这是一种有效的方法,但是它带来了管理和维护集群的巨大开销。想象一下,必须为一个刚好超出RAM范围的数据集设置一个集群,比...原创 2020-03-13 13:38:47 · 341 阅读 · 0 评论 -
hdfs 中 CentOS,清理缓存(drop_caches)规划
读写文件时,Linux内核为了提高读写效率与速度,会将文件在内存中进行缓存,这就是Cache Memory(缓存内存)。即使程序运行结束后,Cache Memory也不会自动释放。这就会导致程序频繁读写文件后,可用物理内存会很少。其实这缓存内存(Cache Memory)在你需要使用内存的时候会自动释放,所以不必担心没有内存可用。如果你希望手动去释放Cache Memor...原创 2020-03-12 11:18:03 · 1531 阅读 · 0 评论 -
java中堆外内存详解
堆外内存和堆内内存堆外内存又称为直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域.一直以来是Javaer们难以关注的一片领域,今天我们就一起探索一下这片区域究竟隐藏着什么东东????JVM可以使用的内存分外2种:堆内存和堆外内存.我们先看一下我们已经相对来说十分熟悉的堆内内存:Java堆(JAva He...转载 2020-03-11 16:03:13 · 1286 阅读 · 0 评论 -
Python风格规范
分号Tip不要在行尾加分号, 也不要用分号将两条命令放在同一行.行长度Tip每行不超过80个字符例外:长的导入模块语句 注释里的URL不要使用反斜杠连接行.Python会将圆括号, 中括号和花括号中的行隐式的连接起来, 你可以利用这个特点. 如果需要, 你可以在表达式外围增加一对额外的圆括号.Yes: foo_bar(self, width, h...转载 2020-02-28 08:56:59 · 300 阅读 · 0 评论 -
GTX 2080TI TensorFlow GPU基准测试:2018年最佳GPU
有人经常问,深度学习的最佳GPU是什么?近日Lambda给出了答案,他们通过比较研究人员常用的前5个GPU来获得答案(测试结果也考虑到了成本和性能): RTX 2080 Ti RTX 2080 GTX 1080 Ti Titan V Tesla V100 · 结 · 果 · 总 · 结 · 截至2018年10月8日,N...转载 2018-10-12 19:23:20 · 12058 阅读 · 1 评论 -
Redis Sentinel初体验
自Redis增加Sentinel集群工具以来,本博主就从未尝试过使用该工具。最近在调研目前主流的Redis集群部署方案,所以详细地看了一遍官方对于Sentinel的介绍并在自己的台式机上完成了三Redis实例+三Sentinel实例的部署,这里做一下简单的总结。 首先,下载安装Redis。目前随Redis 2.8发布的Sentinel版本被antirez称为Sentinel 2,是在Se转载 2015-11-19 10:35:19 · 1830 阅读 · 0 评论 -
转 传统MySQL+ Memcached架构遇到的问题
传统MySQL+ Memcached架构遇到的问题 实际MySQL是适合进行海量数据存储的,通过Memcached将热点数据加载到cache,加速访问,很多公司都曾经使用过这样的架构,但随着业务数据量的不断增加,和访问量的持续增长,我们遇到了很多问题: 1.MySQL需要不断进行拆库拆表,Memcached也需不断跟着扩容,扩容和维护工作占据大量开发时间。 2.Memcached转载 2014-10-29 10:59:46 · 823 阅读 · 0 评论 -
haproxy配置示例和需要考虑的问题
本文目录:1. 配置haproxy需要考虑的事情2. 配置haproxy提供反向代理功能haproxy是一个非常优秀的负载均衡工具,它的特性非常丰富,功能也非常非常强大,要想好好使用它,将它的功能和性能挖掘出来,多多阅读官方手册是必不可少的。本文提供一个简单的配置示例,后面将分别开文章详细解释它的配置文件、cookie会话保持、stick table的功能、haproxy主主模型的复制(repli...转载 2018-04-19 14:31:36 · 448 阅读 · 0 评论 -
挖财基于大数据的信贷审批系统实践
挖财基于大数据的信贷审批系统实践时间 2016-09-24 16:01:40 代码说原文 http://h2ex.com/1607主题 大数据 HBase 数据库大家好,今天给大家带来的分享是基于大数据的信贷审批系统。首先先自我介绍,我真名是曹静静,花名是叫曹宝, 早期 在淘宝的数据平台做海量数据的中间件,然后在Morgan Stanley的全球清算中心任职转载 2016-09-25 18:18:48 · 7605 阅读 · 0 评论 -
Hadoop平台架构--存储篇
Hadoop平台架构--存储篇Jan 25, 2016 | hadoop暂无评论刚刚开始使用Hadoop集群的时候,目录没有有个规范,大家都根据自己的喜好创建各种不同的目录,权限控制也没有开启,随着应用越来越多,使用的人员也多了起来,导致目录混乱,终于在新规划集群的时候,对目录做了规范和权限控制.下面简单介绍一下我们HDFS目录规范和HDFS存储规划,写在Hadoo转载 2016-09-14 15:14:58 · 2394 阅读 · 0 评论 -
powerdesigner 使用技巧(整理中)
1.PowerDesigner显示注释字段有关问题原创 2014-08-05 15:31:57 · 797 阅读 · 0 评论 -
配置Memcache服务器并实现主从复制功能(repcached)
配置Memcache服务器并实现主从复制功能(repcached)作者: 字体:[增加 减小] 类型:转载 repcached是日本人开发的实现memcached复制功能,它是一个单 master单 slave的方案,但它的 master/slave都是可读写的,而且可以相互同步,如果 master坏掉, slave侦测到连接断了,它会自动 listen而成为 ma转载 2014-10-07 14:10:11 · 725 阅读 · 0 评论 -
Memcache查看运行状况
Memcache查看运行状况2011-08-24 15:31:49 分类: 系统运维MemcacheMemcache是danga.com的一个开源项目,它是一个高性能的分布式的内存对象缓存系统,通过在内存里维护一个统一的巨大的Hash表,能够用来存储各种格式的数据。查看当前的memcache连接数:[root@mem1 ~]# netstat转载 2014-10-07 16:53:05 · 614 阅读 · 0 评论 -
一步完成 MySQL 向 Redis 迁移
从mysql搬一个大表到redis中,你会发现在提取、转换或是载入一行数据时,速度慢的让你难以忍受。这里我就要告诉一个让你解脱的小技巧。使用“管道输出”的方式把mysql命令行产生的内容直接传递给redis-cli,以绕过“中间件”的方式使两者在进行数据操作时达到最佳速度。一个约八百万行数据的mysql表,原本导入到redis中需要90分钟,使用这个方法后,只需要两分钟。不管你信不信,反正转载 2014-10-08 20:08:56 · 722 阅读 · 0 评论 -
国内外三个不同领域巨头分享的Redis实战经验及使用场景
国内外三个不同领域巨头分享的Redis实战经验及使用场景发表于2013-10-07 09:03| 34588次阅读| 来源优快云| 26 条评论| 作者仲浩云计算大数据NoSQLRedis新浪微博PinterestViacom 摘要:随着数据体积的激增,MySQL+memcache已经满足不了大型互联网类应用的需求,许多机构也纷纷选择Redis作为其架构上的补充,下面转载 2014-10-29 11:02:20 · 1057 阅读 · 0 评论 -
memcached 缓存参数的详解
memcached 缓存参数的详解(2013-03-18 17:39:17)转载▼ 分类: 缓存学习http://bbs.youkuaiyun.com/topics/390379625protected static MemCachedClient mcc = new MemCachedClient();转载 2015-03-12 09:54:59 · 2195 阅读 · 0 评论 -
”Connection reset by peer“引发的思考
”Connection reset by peer“引发的思考 闲来无事,把之前写的一个游戏服务器框架(《一个java页游服务器框架》),部署到阿里云服务器上,测试运行了下,结果看到后台log中打印出了“Connection reset by peer”。出于好奇疑问就查了一下相关资料,网上说一般有这几种: ①:服务器的并发连接数超过了其承载量,服务器会将其中一转载 2015-03-12 09:57:25 · 16073 阅读 · 0 评论 -
redis 3.0 cluster 集群 学习之路篇(资料汇总)
特殊说明:由于不能主人不允许转载,只能挂连接 http://zhoushouby.blog.51cto.com/9150272/1560346转载 2015-04-07 15:24:43 · 1310 阅读 · 0 评论 -
网易云音乐的推荐音乐方式与算法漫谈
网易云音乐的推荐音乐方式与算法漫谈字数3131 阅读8588 评论13 喜欢70网易云音乐在我看来在各方面都是较为出色的音乐APP,网上也有各种体验报告、产品分析,但都比较偏向交互和前端。所以,我决定对其靠后端大功能“推荐音乐和算法”稍作一些探讨。也是因为个人喜好问题,包括我做PD的时候,也喜欢接一些靠后端的项目,所以本文也不太涉及到界面交互方面的东西。网易云音乐希望面向的受众转载 2015-11-07 13:49:59 · 5262 阅读 · 1 评论 -
大数据技术的事件处理上应该如何选择Linux服务器?
大数据技术的事件处理上应该如何选择Linux服务器?大数据技术的事件处理,在系统资源使用上,需要很强的计算能力,如何选择Linux服务器?希望获得:通用方法关注问题7回答8评论8 回答按赞同排序按时间排序loveryue 软件开发工程师 , IBM晓黎转载 2015-11-07 20:44:11 · 1146 阅读 · 0 评论 -
Hadoop/Yarn/MapReduce内存分配(配置)方案
Hadoop/Yarn/MapReduce内存分配(配置)方案以horntonworks给出推荐配置为蓝本,给出一种常见的Hadoop集群上各组件的内存分配方案。方案最右侧一栏是一个8G VM的分配方案,方案预留1-2G的内存给操作系统,分配4G给Yarn/MapReduce,当然也包括了HIVE,剩余的2-3G是在需要使用HBase时预留给HBase的。Configu转载 2015-09-22 15:07:29 · 995 阅读 · 0 评论 -
Hadoop的内存配置
Hadoop的内存配置有两种方法:利用手动安装hadoop的帮助脚本;手动计算yarn和mapreduce内存大小进行配置.此处只记录脚本计算方法:用wget命令从hortonworks上下载脚本python hdp-configuration-utils.py wget http://public-repo-1.hortonworks.com/HDP/tools/2.1.1.0/h转载 2015-09-22 16:25:07 · 4251 阅读 · 0 评论 -
最完整的Elasticsearch 基础教程
最完整的Elasticsearch 基础教程2014-10-21 15:32:01| 发布人:PHP_PentaKill| 浏览(9472)| 评论(1) 翻译:潘飞(tinylambda@gmail.com)基础概念 Elasticsearch有几个核心概念。从一开始理解这些概念会对整个学习过程有莫大的帮助。转载 2015-11-21 14:11:12 · 5962 阅读 · 3 评论 -
互联网金融系统技术沙龙:小米风控实践
互联网金融系统技术沙龙:小米风控实践原创 2016-06-24 邓文俊 高可用架构导读:最近上映的魔兽世界有一句话“光明源于黑暗,黑暗涌现光明”,和互联网金融的安全风控领域非常相似。在 6 月 19 日,微博商业产品部联合小米支付等金融技术团队策划了首届互联网金融系统沙龙,围绕在互联网金融过程中碰到系统安全等问题与业界展开分享及交流。本文是邓文俊在沙龙上的演讲,授权高可用架构首转载 2016-06-27 13:21:21 · 2057 阅读 · 0 评论 -
电商异步消息系统的实践
声明:本文为《从程序员》7月期原创投稿文章,未经许可禁止任何形式的转载。 作者:王晓宇,小米网平台研发部软件研发工程师。2015年入职小米,主要负责电商后端仓储物流相关的业务系统开发。曾在西门子中国研究院,从事软件研发工作,拥有两年以上的软件开发相关经验。曾使用过的编程语言主要有Java与PHP,拥有多年的服务器开发经验以及MySQL优化经验,对电商相关业务与系统架构具有一定的了解以及自己的见转载 2016-08-04 13:13:21 · 3379 阅读 · 0 评论 -
单日峰值2T发送量邮件营销平台实践经验
声明:本文来自京东张开涛的微信公众号(kaitao-1234567),授权优快云转载,如需转载请联系作者。 作者:刘锟洋,独立博主,系统架构师。就职于京东成都研究院,做过A/B Test,精准营销平台,会员营销平台。公司内部开源小组发起人,内部开源过多个开源项目,对性能全链路优化和分布式服平台有浓厚兴趣。 责编:钱曙光,关注架构和算法领域,寻求报道或者投稿请发邮件qianshg@csdn转载 2016-09-13 18:41:41 · 1776 阅读 · 0 评论 -
12亿条出行记录背后的纽约故事
12亿条出行记录背后的纽约故事转载 2016-09-13 18:59:07 · 1127 阅读 · 0 评论