- 博客(12)
- 资源 (2)
- 收藏
- 关注
原创 Spark常见算子
这里,从源码的角度总结一下Spark RDD算子的用法。单值型Transformation算子map /** * Return a new RDD by applying a function to all elements of this RDD. */ def map[U: ClassTag](f: T => U): RDD[U] = withScope { ...
2019-06-10 00:13:05
237
原创 java实现spark(1)
用java实现简单的Spark例子。数据很简单,是一个被预先处理的日志文件,包括时间、电话号,上行流量和下行流量。一行为一条记录,不同数据之间用制表符隔开。样本类样本类是为了将日志文件的一条记录封装起来package com.icesun.java.accessLog;import java.io.Serializable;public class LogInfo impleme...
2019-06-09 22:00:16
369
原创 pytorch实现数据数据读取
本文原地址为 www.zicesun.com icesuns.github.io在学习的过程中,遇到很多的问题.在训练模型的时候,需要对数据进行读取操作.本篇文章,介绍pytorch如何自定义数据dataset和dataloader.在pytorch中,提供了Dataset这个类,负责对数据进行抽象,一次调用只返回第一个同样本.而Dataloader提供了对一个对一个batch的数据操作,还有...
2019-03-29 19:36:52
1841
原创 学习之路——Spark(3)——Spark RDD内部结构
本文原地址在 www.zicesun.com icesuns.github.ioSpark是一个基于分布式内存的大数据计算框架,RDD (Resilient Distributed Dataset)是Spark最重要的一个数据抽象。这篇文章记录了我对RDD的一些理解,有不足和错误的地方,请留言指正。什么是RDDRDD (Resilient Distributed Dataset),弹性分...
2019-03-29 19:35:01
327
原创 转载——学习之路——Spark(2)
本文转载于 www.zicesun.com icesuns.github.io本文讲介绍如何搭建spark集群。搭建spark集群需要进行一下几件事情:集群配置ssh无秘登录java jdk1.8scala-2.11.12spark-2.4.0-bin-hadoop2.7hadoop-2.7.6上述所有的文件都安装在/home/zhuyb/opt文件夹中。服务器服务器是...
2019-03-29 19:32:50
177
原创 Spark 简介
转载于 www.zicesun.com之前看了一些Spark的相关内容,我觉得很有必要进行总结一下,不然都搭不起自己的知识框架。Apache SparkApache Spark™是用于大规模数据处理的统一分析引擎,是一个实现快速通用的集群计算平台。它是由加州大学伯克利分校AMP实验室 开发的通用内存并行计算框架,用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用的MapReduce计...
2019-03-29 19:27:28
189
原创 统计学习方法(1)——感知机实现(学习算法的原始形式)
最近在看李航老师的《统计学习方法》,打算实现每一个算法。置于算法的具体介绍和讲解,此处不做详细介绍,需要了解算法内容的同学,可以看一下书上的对应章节。这次实现数据参照书中第二章例2.1实现了感知机学习算法的原始形式#!/usr/bin/env python# -*- coding:utf-8 -*-# author= icesunimport numpy as np# 感知机学习...
2018-10-27 16:29:09
615
原创 20180610-reinforcement-learning-MDP
【转自本人个人博客 icesuns】 Reinforcement Learning(2)——MDPs 上一篇文章强化学习——简介简单介绍了一下强化学习的相关概念。这篇博客将引入 马尔科夫决策过程(Markov Decision Processes, MDPs)对强化学习进行建模。这篇文章,将对马尔科夫决策过程以及Q-leaning进行介绍。马尔科夫过程 定义: 若随机过程 {Xn,...
2018-06-15 10:15:21
319
原创 reinforcement-learning-1
转载于icesuns的《Reinforcement Learning(1)》强化学习简介强化学习(英语:Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。强化学习涉及很多学科,...
2018-06-04 14:41:16
343
原创 kubenetes集群配置之kubeadm自动创建集群
kubeadm自动创建集群kubeadm自动创建集群一 更新apt-get源二 安装docker 和kubenetes三 配置kubenetes3.1 注意事项3.2 配置master节点3.3 配置子节点最近在做一个比赛,需要部署在kubenetes集群上。手动创建集群需要配置很多环境文件,容易出现各种问题,因此。我们在利用kubenetes自动部署...
2018-04-08 16:10:15
1551
原创 tensorflow-GPU安装 | cudnn安装问题
1、关于tensorflow-gpu安装的问题,教程很多,可以参考tensorflow-gpu的安装 2、安装tensorflow的时候,pip安装下组速度很慢,可以更换pip源(pypi国内源)加快下载速度. 大致的方法如下:pip install tensorf...
2018-03-25 14:20:17
420
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人