
杂类
爱知菜
Renjie Wei
展开
-
Power BI 的 各种限制 和 DataFlow模式
当大量Dataset同时刷新时,会导致Gateway节点内存不足。可以使用PowerBI Data Flow对DataSet进行分段刷新来绕开这个问题。Direct Query不再有DataSet相关的限制,但是它有一个100万行的数据量查询限制。分页报表的交互性能比较差,且直连某些数据源(比如Redshift)时性能较差。原创 2022-09-05 16:24:37 · 1761 阅读 · 0 评论 -
一个动力密集型产业的预算的数据分析建模过程
对于一个劳动力密集型产业来说,做预算判断未来的财月的运营成本,往往可以简化成下面这个公式:成本= 员工数目 * 人均开销其中人均开销包括薪资,培训费用和办公费用,这个些费用往往比较固定或者易于计算,可以视为定量.于是,剩下的变量就是员工数目又叫HeadCount. 预测成本的关键就在于预测员工数目.员工数目取决于工作量,比如售后行业都会对员工的工作进展通过一个软件记录追踪,原创 2022-09-05 15:52:39 · 395 阅读 · 0 评论 -
CRM大数据在零售(快销)行业的应用
快销行业有线下的门店,随着电商的兴起,大多也有线上的网店。很多快销的品牌也搭建了自己的会员系统,在微信或者支付宝里都能领会员卡。在这样的大背景下,就诞生了很多大数据的分析需求来提高市场营销的成果和精准度,即标题所说的CRM大数据。基于数据分析的顾客分类通过购买频率和购买渠道,对顾客进行一个笼统的基本分类,比如上图中的4个分类。Customer指有购买记录的顾客。App Member Customer指有线会员账号,且一年至少购买一次的顾客。Repeat Customer指A.原创 2021-09-06 15:07:55 · 2434 阅读 · 0 评论 -
Ubuntu下putty复制粘贴&Samba Status_Access_Denied error
发现我Xubuntu(Linux rav009-desktop 5.8.0-53-generic #60~20.04.1-Ubuntu SMP Thu May 6 09:52:46 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux)的环境下负责原创 2021-08-11 17:53:06 · 1082 阅读 · 0 评论 -
nvidia cuda windows下gpu内存管理
mxnet 出现cuo'wuRuntimeError: CUDA out of memory. Tried to allocate这表示显卡内存不足,搜索怎么释放显卡的内存的时候,大多都是linux下的解决方法。windows下可以这样做:打开cmd窗口,输入nvidai-smi查看显卡使用情况如图可以看到下边有个PID表示进程id,然后打开任务管理器,点击详细信息,根据pid找到需要释放的进程结束即可。————————————————版权声明:本文为优快云博主「安娜是个少年」的原创文章,遵原创 2021-06-06 21:29:13 · 958 阅读 · 1 评论 -
在centos上用mysql作数据库 搭建airflow
注意点:1. airflow 默认用sqlite作数据库,2.0版本的airflow对sqlite的版本要求较高(>3.15)2. airflow可以不用sqlite,用其他数据库3. 环境变量 "AIRFLOW_HOME" 很重要,执行airflow命令时,读取配置文件的路径就是根据该环境变量确定。建议配置到 /etc/profile4. 根据你python的版本要下一个constraints-X.X.txt的文件,用于安装。以下假设AIRFLOW_HOME=/opt/ai.原创 2021-05-08 17:35:06 · 236 阅读 · 0 评论 -
使用TortoiseGit,如果每次clone/push/pull都出现totoisegitplink的密码输入框,就需改下面这个配置 从totoisegitplink.exe 改
输入命令,生成秘钥sshkey,引号中为注释,这里为自己注册gitlab的邮箱。使用TortoiseGit,如果每次clone/push/pull都出现totoisegitplink的密码输入框,就需改下面这个配置 从totoisegitplink.exe 改成 ssh.exe修改TortoiseGit默认ssh.exe文件位置,改为自己安装的git文件夹中的ssh.exe并点击确定。...原创 2021-02-22 17:47:05 · 434 阅读 · 0 评论 -
关于linux账户的提权、免密sudo和 kerberos联动
linux普通用户获取root级别权限,有两种方法:一个提权,即编辑 /etc/passwd,把自己的uid改成0,uid可以直接用命令id查看 还一个sudo,即编辑 /etc/sudoer(等效于命令 visudo),把自己加入到可以sudo的用户列表,还可以配置免密sudo另外在有配置kerberos体系的系统中,理论上每个linux用户在kinit后应该有独立的kerberos账号,如果该linux账号是经过“提权”的,可能会发生kerberos账号被串用的情况...原创 2020-08-26 11:15:58 · 371 阅读 · 0 评论 -
azcopy linux 安装使用说明(blob)
azcopy 有过一次大的命令行接口更新:7.x的版本 命令形如: azcopy --source .... --destination ...10.x的版本 命令形如:azcopy copy10.x的版本有子命令安装说明:wget -O azcopy.tar.gz https://aka.ms/downloadazcopy-v10-linuxtar -xf azc...原创 2020-01-02 12:15:52 · 4250 阅读 · 0 评论 -
windows 实现 java1.6和 java1.8 切换
https://blog.youkuaiyun.com/asd051377305/article/details/81879872问题背景公司项目中应用到的jdk环境为1.6,最近在家学习IntelliJ IDEA中sdk多环境配置时,想安装Jdk1.8,作为学习基础。那么问题来了,公司项目扩展不支持jdk1.8,为了既能满足公司项目开发环境,又能满足学习jdk1.8的需要,当然不能每一次都进行jdk的安装和卸载,需要探索另一种新方法。分析问题为了多快好省的解决当前的问题,我的想法是在windows中同时转载 2020-08-11 18:38:35 · 1371 阅读 · 0 评论 -
azkaban的用户配置和重启 笔记
假设azkaban安装在:/usr/local/azkaban/配置用户:编辑/usr/local/azkaban/azkaban-web-server/conf/azkaban-user.xml权限列表:ADMIN Grants all access to everything in Azkaban.READ Gives users read only access to every proj...原创 2020-07-16 17:52:21 · 1312 阅读 · 0 评论 -
Linux 显示隐藏目录或隐藏文件的占用空间
du -sh .[!.]*du命令用来看文件size.[!.]* 是正则式, 意思是第一位是点, 第二位是除了点以外的字符, 第三位是任意字符或者不存在后面可以再加一个" *"来包括非隐藏文件后面还可以接 sort -h来对占用空间进行排序(sort 的 -k2 可以指明根据第二列来排序)下面这条命令就是显示所有隐藏文件和非隐藏文件的大小并根据占用空间排序的语句d原创 2016-11-06 00:12:24 · 40797 阅读 · 1 评论 -
查sqlserver版本信息, 实例名, 服务器名以及SP,trigger等object的定义,列出表名
select @@serviceNAME select @@version select @@SERVERNAME查询某段SP, trigger的定义select triggers.name as [触发器],tables.name as [表名],triggers.is_disabled as [是否禁用],triggers.is_instead_of_trigge转载 2017-07-03 14:39:32 · 1501 阅读 · 0 评论 -
Ubuntu 14.04 Broadcom B43网卡失效的解决办法(附解决过程)
1. 查看ubuntu版本:cat /etc/issue2. 看网卡型号:主菜单->软件与更新->附加驱动 3. 谷歌搜索得到结果:sudo apt-get purge bcmwl-kernel-source broadcom-sta-common broadcom-sta-sourcesudo apt-get install b43-fwcutt原创 2016-10-12 23:03:08 · 2211 阅读 · 0 评论 -
ubuntu16+virtualbox 安装 hadoop(共享目录, tar, 改主机名hostname)杂记
VirtualBox虚拟机访问windows上的共享目录, 参考下面的链接:http://www.cnblogs.com/xing901022/p/5774677.html简单来说就是安装一个增强功能(菜单栏里, 设备->安装增强功能),然后在ubuntu弹出的文件夹窗口里执行命令行语句:sudo ./VBoxLinuxAddtion.run再mount之前在virtualbox里配置好的共...原创 2017-05-09 12:37:53 · 824 阅读 · 0 评论 -
Agile Methodologies & Scrum Framework
Scrum is one of the frameworks following the guideline of agile methodologies.In Scrum, iteration is equal to sprint.An epic story can be defined as a large undefined user story that needs to be b转载 2017-07-20 16:28:01 · 598 阅读 · 0 评论 -
MySql Workbench 快捷键配置示例(F5执行)
转自: http://blog.youkuaiyun.com/stableboy/article/details/45887035C:\Program Files\MySQL\MySQL Workbench 6.3 CE\data, 找到文件 main_menu.xml修改执行 = F5 com.mysql.wb.menu.query转载 2017-07-06 15:32:17 · 942 阅读 · 0 评论 -
判断自己的网络是不是公网IP
登录http://www.ip138.com 网站看获取的IP地址登录http://ip.qq.com 看获取的IP地址登录万网http://www.net.cn/static/customercare/yourip.asp 查看获得的IP地址(如万网获取IP是二个,则是IP经运营商转换的内网环境)转载 2017-07-02 21:22:12 · 10182 阅读 · 0 评论 -
SSH 免密码登录 Openwrt 路由器
ssh-keygen ssh-copy-id 免密码转载 2017-04-17 21:29:59 · 3395 阅读 · 0 评论 -
Ubuntu16.04 display setting (xfce4-display-settings) segmentation fault 闪退
xfce segmentation fault 闪退 display原创 2017-05-08 20:57:44 · 3603 阅读 · 0 评论 -
mdx 各类典型语句的集锦
mdx 经典语句原创 2014-05-21 17:53:07 · 3599 阅读 · 1 评论 -
Ubuntu 禁更新某些package的方法
dpkg -l |grep -i "软件包名" --查看系统中与"软件包名"相关联的包.要选定需要延迟升级的软件包:sudo echo “package hold” | dpkg --set-selections例如要延迟升级apache2软件包:sudo echo “apache2 hold” | dpkg --set-selections取消转载 2016-06-18 20:01:06 · 886 阅读 · 0 评论 -
搭建web.py+apache2.4+wsgi的网站
apache24 windows x64 web.py wsgi原创 2016-10-11 12:31:15 · 2800 阅读 · 0 评论 -
WINDOWS 用命令行 查进程pid 和 杀进程
tasklist | moretaskkill /F /PID 4896原创 2016-06-11 20:46:18 · 12225 阅读 · 0 评论 -
SSIS package 怎么在debug运行时看变量值
右键一个控件可以下断点当package运行起来后, 点击菜单栏的debug按钮出现的子菜单里才会有 watch !!!!!!!原创 2016-04-23 09:36:02 · 8561 阅读 · 0 评论 -
Linux 显示系统信息的命令
1. Kernel nameTo reveal the kernel name, you can use -s parameter.# uname -sLinuxThe output will be same with uname without parameter.2. Kernel releaseIf you need to know wha转载 2017-12-18 14:28:23 · 656 阅读 · 0 评论 -
Virtualbox 为ubuntu增加硬盘空间 分区
扩容VBoxManage.exe 这个exe文件可以对各类虚拟机的vdi, vmdk文件进行操作在CMD中执行# 查看信息"D:\Program Files\Oracle\VirtualBox\VBoxManage.exe" showhdinfo "E:\Ubuntu Virtual Disk\office.vmdk"# 30000MB, 只能比当前的容量大,否则报错,dynamic vdi...原创 2018-05-11 21:02:36 · 1391 阅读 · 0 评论 -
向HIVE导入windows平台(dos类型)的日志
把windows的日志复制到linux目录下, 可以先用file,head,tail等命令查看文件概况.使用dos2unix命令将文件转成unix格式由于HIVE的时间类型只支持timestamp, 所以我们要把日志中的时间列转成timestamp这里我们使用awk命令(原始时间格式: 2014-02-01 14:09:34.000000):head sample_data.txt | awk '...原创 2018-05-15 11:58:12 · 732 阅读 · 0 评论 -
VS2010编译时拿老版本的代码运行,出现"source code is different..."解决办法
http://www.byywee.com/page/M0/S544/544290.htmlBuild->Configuration ManagerCheck whether all project allows to build when the Configuration is Debug.把要一起编译的项目勾上原创 2013-04-09 11:12:50 · 1679 阅读 · 0 评论 -
Redis 杂记(安装,conf,还原rdb,查看key过期时间)
Redis有两个linux和windows两个版本,截至本文发表时,linux是5.05,而windows的版本不是官方的,版本为3.2。这两个版本的redis的dump.rdb文件并不兼容。Linux的redis安装:下载官网的压缩包,tar xzvf 解压,cd进入src目录,make install启动: redis-server /dir/redis.confco...原创 2019-06-26 13:32:18 · 2169 阅读 · 0 评论 -
系统吞吐量(TPS)、用户并发量、性能测试概念和公式
转自:http://www.ha97.com/5095.htmlPS:下面是性能测试的主要概念和计算公式,记录下:一.系统吞度量要素:一个系统的吞度量(承压能力)与request对CPU的消耗、外部接口、IO等等紧密关联。单个reqeust对CPU消耗越高,外部系统接口、IO影响速度越慢,系统吞吐能力越低,反之越高。系统吞吐量几个重要参数:QPS(TPS)、...转载 2019-06-22 23:23:44 · 431 阅读 · 0 评论 -
安全库存公式的解析
安全库存公式:在计算安全库存公式时,其实我们面对的是两个正态分布:1. 供应周期的正态分布2. 需求的正态分布安全库存就是在这两个正态分布的上下浮动过程中能覆盖一定供应水平的一个标准差。举例来说,标准正态分布的x取值范围在(-1.96,1.96)之间的时候,能覆盖95%的情况,所以当安全库存>1.96倍的标准差时,能提供一个95%的服务水平。正态分布有可加性,所...原创 2019-04-22 10:12:49 · 10615 阅读 · 0 评论 -
Cloudera Manager 简介
Cloudera Manager 简称 CM, 是企业级的大数据集群安装/升级/管理平台, 帮助用户通过网页上的简单操作控制整个集群.其功能如下:1. 提供一个software repository, 方便在各个节点上安装大数据的组件2. 批量配置3. 集群监控4. 集群升级/回滚/备份5. 配置HA6. SNMP消息转发7. 安全(sentry & ker...原创 2019-01-15 14:14:16 · 2234 阅读 · 0 评论 -
Oracle 和 AWS Redshift 获取 数据库所有表名和列名的
Oracle表名区分大小写。select table_name from user_tables where table_name like '%xxxxx%';select OWNER, TABLE_NAME, COLUMN_NAME from all_tab_columns where COLUMN_NAME LIKE '%xxxxx%'; AWS Redshift...原创 2018-11-19 11:20:30 · 2044 阅读 · 0 评论 -
Kettle Number & BigNumber Format
在Spoon的文件栏, Edit->Edit Kettle Properties files将 KETTLE_DEFAULT_BIGNUMBER_FORMAT 项配置为0.#####否则的话, 默认Kettle对它认为是BigNumber的列 ,把0 会强行写成0.0, 造成不必要的冗余...原创 2018-11-05 19:13:02 · 3971 阅读 · 0 评论 -
CDH 大数据疑难解决一则
起因: Hive查询变慢观察: Cloudera Manager中某个Datanode报错, Health Chart每隔几分钟有红色不健康状态观察日志: 在 /data/log/hadoop-hdfs/hadoop-cmf-hdfs-DATANODE-dw-slave01-te.uniqlo-test.cn.log.out 中发现大量日志警告, 带有"Force-closing" , ...原创 2018-11-02 17:44:51 · 633 阅读 · 0 评论 -
一段批处理, 遍历文件夹里的csv文件压缩, 压缩包的文件名是源文件名的截取
echo offSETLOCAL ENABLEDELAYEDEXPANSIONset work_path=F:\somefolderF: cd %work_path% for /R %%s in (*.csv) do ( set fname=%%secho !fname:~-30,10!"C:\Program Files\7-Zip\7z.exe" a !fname:~-30,1...原创 2018-10-15 18:26:40 · 452 阅读 · 0 评论 -
企业级大数据的安全方案 & Kerberos 的 expire 及 renew说明
企业级大数据集群有两个层面的安全系统:一个是每一台服务器的本地有个linux的账户系统,这个可以批量处理配置。为每个服务器建立一个本地的账号和组。用这个账号去SSH登录。另一个就是大数据集群,即Hadoop的账号系统,是Hadoop通过 Kerberos 协议实现的。Kerberos是一个协议,而具体实现这种协议的组件有几个,一般比较广泛使用的是FreeIPA(顾名思义:免费的)。所以在每...原创 2018-12-04 18:38:42 · 1497 阅读 · 0 评论 -
一句命令行 判断hive CDH 版本
locate */hive/lib/hive*jar转自: https://blog.youkuaiyun.com/sinat_27339001/article/details/78438947 locate */hive/lib/hive*jar | grep hive-exec转载 2018-09-27 18:33:44 · 1027 阅读 · 0 评论 -
一段 VB 代码自动运行图形界面程序 发送按键指令
用于ETL流程中, 有不支持命令行, 只能GUI交互的程序要实现自动化调用 可以参考下面这段VB.启动了程序, 还在5秒后自动按了一下回车键.Dim ShellSet Shell=WScript.CreateObject("WScript.Shell")Shell.Run """C:\Program Files (x86)\some.exe"""WScript.Sleep 5000...原创 2018-09-25 13:13:37 · 1040 阅读 · 0 评论