普通网友-优快云博客

原创最全大模型学习路线与建议_大模型学习路径，2024年最新大数据开发入门

不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！LLaMA 系列模型核心原理详解（LLaMA/Alpaca/Vicuna/BaiChuan/LLaMA2/BaiChuan2）大模型Tuning技术详解（Prompt-Tuning/Instruction-Tuning/P-Tuning）GPT 系列模型核心原理详解（GPT1/GPT2/GPT3/GPT4/InstructGPT）大模型微调中的核心要素。

2024-05-16 04:24:36 563

原创最全大数据面试(4)，2024年最新大数据开发软件开发面试题

分治和规约体现在mapreduce 框架中，就是map +reducemap是对一份大的数据集，切成小份后各个击破，里面封装着对每一条数据的处理逻辑，对于一些简单的应用来说把每一条数据转化成为想要的样子，就可以直接输出，不需要reduce 过程。但是，每条数据之间有交集，需要做聚合汇总，就必须有reduce 阶段。

2024-05-16 04:24:03 1066

原创最全大数据集群配置前置工作（jdk的安装）(1)，阿里+头条+腾讯等大厂大数据开发笔试题目分享

现在在root目录下就能看到jdk文件了。

2024-05-16 04:23:31 1159

原创最全大数据集群搭建之Linux安装Hive2(1)，腾讯大数据开发开发面试凉凉

Hive临时文件，用于存储每个查询的临时/中间数据集，通常在完成查询后由配置单元客户端清除。HiveServer2服务支持多线程多用户同时连接，还同时还支持JDBC连接。JDBC驱动：org.apache.hive.jdbc.HiveDriver。HiveServer2服务支持多线程多用户同时连接，还同时还支持JDBC连接。JDBC驱动：org.apache.hive.jdbc.HiveDriver。使用MySQL作为hive的元数据Metastore数据库。HiveServer2 webUI 监听主机。

2024-05-16 04:22:58 689

原创大数据最新使用gs_probackup进行openGauss数据库物理备份与恢复(1)，2024年最新缓存架构技术

物理备份与恢复适用于数据量大的场景，主要用于全量数据备份恢复，也可对整个数据库中的WAL归档日志和运行日志进行备份。openGauss提供了三种物理备份与恢复相关的工具：gs_backup、gs_basebackup和gs_probackup。三个工具的对比见下图。本篇主要介绍gs_probackup工具。它对openGauss 实例进行定期备份。可用于备份单机数据库或者数据库实例主节点，为物理备份。可备份外部目录的内容，如脚本文件、配置文件、日志文件、dump文件等。支持增量备份、定期备份和远程备份。

2024-05-15 19:36:35 451

原创大数据最新使用Coze工作流(二)_coze 工作流，阿里巴巴大数据开发面试都问些什么

你可以在 Code 节点内使用 IDE 工具，通过 AI 自动生成代码或编写自定义代码逻辑，来处理输入参数并返回响应结果。LLM 节点是扣子提供的基础节点之一，你可以使用该节点的大语言模型处理文本生成任务。创建工作流后，你可以通过拖拽的方式将节点添加到画布内，并按照任务执行顺序连接节点。工作流提供了基础节点供你使用，除此之外，你还可以添加插件节点来执行特定任务。清晰明确的工作流名称和描述，有助于大语言模型更好的理解工作流的功能。该节点是一个 if-else 节点，用于设计工作流内的分支流程。

2024-05-15 19:36:02 721

原创大数据最新从双非到大数据开发工程师，我是如何上岸阿里大厂的？(1)，5年经验大数据开发程序员面试27天

笔试这东西，做的多了，感觉自然就来了，不会的就暴力，凑子集，凑着凑着也就A了。由于我严重低估了学习大数据技术栈所需要的时间，同时开发环境总是存在问题，加之八月份硬盘离奇烧掉，导致九月份开始秋招投递，严重耽误秋招进程，成功翻车。我立即作出了改变，对熟悉的关键技术进行了深化，将不足加以补充，同时面试过程中尝试让自己更加主动，主动去介绍、主动展现自我优势、主动与面试官聊天，面试也愈加轻松、熟练。十月中旬，我第一个offer下来了，待遇高于大厂白菜，十分吸引人，公司是两个超一线大Leader新创办的公司。

2024-05-15 19:35:29 351

原创大数据最新从0到1项目搭建-框架搭建(附源码)_从零到一搭建一个项目，大厂大数据开发高级多套面试专题整理集合

创建常量包constant。通用常量返回状态码HttpStatus/\*\*\* 返回状态码\*\*//\*\*\* 操作成功\*//\*\*\* 对象创建成功\*//\*\*\* 请求已经被接受\*//\*\*\* 操作已经执行成功，但是没有返回数据\*//\*\*\* 资源已被移除\*//\*\*\* 重定向\*//\*\*\* 资源没有被修改\*//\*\*\* 参数列表错误（缺少，格式不匹配）\*//\*\*

2024-05-15 19:34:56 419

原创华为云云耀云服务器L实例评测｜在Docker环境下部署Hive数据库_docker 安装hive(2)

(img-BIVJeiyI-1715733464354)]上传mysql jdbc驱动到宿主机/mnt/docker_share。(img-G8MMklHZ-1715733464354)]复制mysql的驱动程序到hive/lib下面。dbserver连接hive。

2024-05-15 08:38:06 519

原创华为云云耀云服务器L实例评测｜在Docker环境下部署Hive数据库_docker 安装hive(1)

这是Maynor华为云云耀云服务器L实例评测｜单节点环境下部署ClickHouse21.1.9.41数据库华为云云耀云服务器L实例评测｜伪分布式环境下部署hadoop2.10.1华为云云耀云服务器L实例评测｜在Docker环境下部署Hadoop云耀云服务器L实例是新一代的轻量应用云服务器，专门为中小企业和开发者打造，提供开箱即用的便利性。云耀云服务器L实例提供丰富且经过严格挑选的应用镜像，可以一键部署应用，极大地简化了客户在云端构建电商网站、Web应用、小程序、学习环境以及各类开发测试等任务的过程。

2024-05-15 08:37:30 456

原创十年项目经验面试官亲传大数据面试__大数据面试独孤九剑_九剑前端

以上便是十年项目经验面试官亲传大数据面试独孤九剑~愿你读过之后有自己的收获,如果有收获不妨一键三连一下~既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新需要这份系统化资料的朋友，可以戳这里获取点，真正体系化！**

2024-05-15 08:36:54 917

原创十年项目经验面试官亲传大数据面试__大数据面试独孤九剑_九剑前端(1)

本项目涉及的业务数据包括订单、运输、仓储、搬运装卸等物流环节中涉及的数据、信息。由于多年的积累、庞大的用户群，每日的订单数上千万，传统的数据处理技术已无法满足企业需求。因此通过大数据分析可以提高运输配送效率、减少物流成本，更有效地满足客户服务要求，并对数据结果分析，提出具有中观指导意义的解决方案。

2024-05-15 08:36:17 1021

原创【MybatisPlus】最全面的MybatisPlus通关教程_mybatisplus 菜鸟教程

现有一张User🍀（2）初始化工程创建一个空的 Spring Boot 工程🍀（3）添加依赖说明：使用 mybatis-plus 可以帮助我们节省大量的代码，尽量不要同时导入 mybatis 和 mybatis-plus！🍀（4）连接数据库这一步和 mybatis的相关操作相同！🍀（5）连接mybatis，配置mapper.xml文件采用传统的方式：pojo-dao-service-controller🍀（6）编码🍀（7）编写测试类，进行功能测试。

2024-05-14 23:57:03 1047

原创【MybatisPlus】MP的分页查询、多条件查询以及查询过程中解决null的空值判定_lambdaquerywrapper 不为空

MP这样一款强大的持久层框架处理起来复杂的SQL来也是得心应手，效率极高，快快与我一同领略Plus的独特魅力吧。

2024-05-14 23:56:27 1444

原创【Mock】Neo4j知识图谱数据集Mock、问答训练数据集mock_neo4j数据集

为方便大家熟悉neo4j语法，练习cpl；以及可以作为基于Neo4j知识图谱做NLP问答推荐之类的知识数据，特分享医疗领域医疗知识图谱数据方便大家学习。

2024-05-14 23:55:51 352

原创【Mock】Neo4j知识图谱数据集Mock、问答训练数据集mock_neo4j数据集(1)

为方便大家熟悉neo4j语法，练习cpl；以及可以作为基于Neo4j知识图谱做NLP问答推荐之类的知识数据，特分享医疗领域医疗知识图谱数据方便大家学习。

2024-05-14 23:55:15 277

原创 C++ Json到对象的自动序列化和反序列化工作_c++ json序列化和反序列化(3)

接下来完成演示复杂Json序列化代码，例如：序列化此数据为对象===>{“id”:20,“name”:“zhangsan”,“son”:{“id”:50,“name”:“lisi”},“objectList”:[{“indexID”: “1”,“testData”: “95100000000000991”},{“indexID”: “2”,“testData”: “95100000000000992”}]}可以看到这个json中有普通成员，有对象成员，有对象集合成员，使用我写的序列化依然可以完成正反序列。

2024-05-14 14:37:03 529

原创 C++ Json到对象的自动序列化和反序列化工作_c++ json序列化和反序列化(2)

接下来完成演示复杂Json序列化代码，例如：序列化此数据为对象===>{“id”:20,“name”:“zhangsan”,“son”:{“id”:50,“name”:“lisi”},“objectList”:[{“indexID”: “1”,“testData”: “95100000000000991”},{“indexID”: “2”,“testData”: “95100000000000992”}]}可以看到这个json中有普通成员，有对象成员，有对象集合成员，使用我写的序列化依然可以完成正反序列。

2024-05-14 14:36:27 608

原创 C++ Json到对象的自动序列化和反序列化工作_c++ json序列化和反序列化(1)

接下来完成演示复杂Json序列化代码，例如：序列化此数据为对象===>{“id”:20,“name”:“zhangsan”,“son”:{“id”:50,“name”:“lisi”},“objectList”:[{“indexID”: “1”,“testData”: “95100000000000991”},{“indexID”: “2”,“testData”: “95100000000000992”}]}可以看到这个json中有普通成员，有对象成员，有对象集合成员，使用我写的序列化依然可以完成正反序列。

2024-05-14 14:35:51 804

原创 C#面向对象程序设计课程实验四：实验名称：C#面向对象程序设计基础_c

namespace 实验4_2_

2024-05-14 14:35:15 352

原创 2024年最全【数据结构与算法】【24考研】，32岁的程序员被裁

代码分析：分了四种情况前奇数后偶数交换前偶数后偶数前继续寻找奇数前奇数后奇数后继续寻找偶数前偶数后奇数前后继续寻找标准答案代码分析：老师的代码在我看来思路和我的一直都是寻找奇偶进行交换，但是很明显比我的优化很多，首先在遍历中从千米按先找到一个奇数，然后从从后面找到一个偶数，是单独找，我的是同时找。B. 将一个字符串从中间一分为二，前半段和后半段按顺序交换、若有奇数个字符，中间字符不参与例如：H a p p I n e s s \0。

2024-05-14 05:59:00 897

原创 2024年最全【数据结构与算法】【24考研】(1)，真香

分析：咱们是将偶数移动到奇数之前，也就是说，要把前面的奇数移动到后面，后面的偶数移动的前面，这个时候我就想到了快速排序，快速排序是大小，咱们这里改成奇偶，也就是说咱们要在前部分虚招一个奇数，后半部分找一个偶数，两者交换，当一次遍历完成所有偶数就到奇数前面了。分析：虽然说是前半段和后半段互换，其实是将前半段移动到了后面，可以采取一个一个移动的办法，也可以采取我下面这个，将整个数组逆置，此时咱们想要的前半段，已经到了后面，只不过顺序仍然是反的，再将前半段后后半段分别翻回来就可以了。代码分析：分了四种情况。

2024-05-14 05:58:24 624

原创 2024年最全【数据结构】栈和队列，2024新一波程序员跳槽季

exit(-1);assert(ps);assert(ps);//exit(-1);ps->top++;assert(!ps->top–;assert(ps);assert(!assert(ps);ST st;s ++;

2024-05-14 05:57:48 825

原创 2024年最全【数据结构】手撕八大排序算法，面试建议

考虑极端情况：当数组有n个数时，下标最大值为n-1。

2024-05-14 05:57:12 560

原创 2024年大数据最全用户积分和积分排行榜功能微服务实现_积分排行榜软件架构，2024年最新高级大数据开发都应该知道

server:port: 7006 # 端口spring:name: ms-points # 应用名。

2024-05-13 21:10:37 895

原创 2024年大数据最全玩转大数据：1-推荐算法_混合推荐算法，2024年最新2024大数据开发最新大厂面试真题总结

深度学习是人工智能领域的一个重要分支，它是一种机器学习的方法，通过模拟人脑神经网络的工作方式来进行学习和决策。深度学习模型可以对大量的数据进行学习和处理，从而发掘出数据中的潜在规律和模式。在推荐系统中，深度学习可以用来对用户的行为和偏好进行建模，从而为用户提供更加个性化的推荐服务。推荐系统是一种基于用户行为和偏好的信息过滤系统，它可以根据用户的历史行为和偏好，向用户推荐符合其兴趣和需求的信息。

2024-05-13 21:10:01 979

原创 2024年大数据最全玩转Leaflet-带你吃透Control知识_leaflet controlposition(1)，2024年最新你有过迷茫吗

Leaflet-IconLayers是一个基于Leaflet的带图标的切换控制器，它需要在Leaflet0.7.3以上的版本上使用，浏览器需要在IE9+以上才可以正常访问。。

2024-05-13 21:09:25 404

原创 2024年大数据最全猿创征文｜我的C C++技术成长之路_c++程序员成长之路，大数据开发开发大佬的百度美团快手等大厂Offer收割之旅

特别是这一段逻辑，思考了蛮久，具体代码就不展示了😄不仅是对于实验室中的题目有过痛哭的回忆，自己在其他刷题网站上也是坎坷重重。

2024-05-13 21:08:48 990

原创最新电商项目前台搜索服务es实现(1)，2024BAT大厂大数据开发社招面试题

*** description:商品客户端*//*** 商品全部数据调用* @return*/

2024-05-12 18:13:52 258

原创最新玩转大数据：1-推荐算法_混合推荐算法(1)，大数据开发培训那里好

深度学习是人工智能领域的一个重要分支，它是一种机器学习的方法，通过模拟人脑神经网络的工作方式来进行学习和决策。深度学习模型可以对大量的数据进行学习和处理，从而发掘出数据中的潜在规律和模式。在推荐系统中，深度学习可以用来对用户的行为和偏好进行建模，从而为用户提供更加个性化的推荐服务。推荐系统是一种基于用户行为和偏好的信息过滤系统，它可以根据用户的历史行为和偏好，向用户推荐符合其兴趣和需求的信息。

2024-05-12 18:13:16 416

原创最新猿创征文｜国产数据库，我看好分布式数据库 TiDB_tidb国产数据库，2024网易大数据开发高级面试题及答案

这个特性可以说是分布式数据库最基本的要求，TiDB 允许用户按需对计算、存储分别进行在线的扩容或缩容，避免资源不足和资源浪费的问题。：通常指通过设计减少系统不能提供服务的时间，也就是做到冗余以及自动故障转移。：混合事务分析处理，即联机事务处理(OLTP)、联机分析处理(OLAP)的混合版，可同时实现两种功能。：ACID 事务指数据库在写入资料的过程中，为保证事务正确可靠所必须具备的原子性一致性隔离性持久性。：兼容 Mysql 5.7 协议和 Mysql 生态。

2024-05-12 18:12:40 630

原创最新猿创征文｜【(2)，2024年最新双非渣本大数据开发四年磨一剑

下面的示例演示如何异步写入文件。此代码在 WPF 应用中运行，该应用具有名为 UserInput 的 TextBlock 和已挂接到名为 Button_Click 的 Click 事件处理程序的按钮。文件路径需要更改为计算机上存在的文件。

2024-05-12 18:12:03 371

原创最全大数据驱动的工业互联网平台在工厂生产中的应用与创新(1)，程序员进阶

嘿，朋友们！这里是艾斯视觉，我们拥有超过10年的UI设计和前端开发经验。我们希望通过我们的分享，能给您带来一些帮助和启发。如果您有任何问题或建议，请随时留言、关注并私信我们，让我们一起交流学习！感激不尽！大数据驱动的工业互联网平台是一种基于云计算、物联网和大数据技术的综合性解决方案，它能够实现对工厂生产过程的全面监控、数据收集和分析，从而提高生产效率、降低生产成本、优化产品设计、提升产品质量和客户满意度。

2024-05-12 09:42:09 263

原创最全大数据领域相关术语总结(2)，阿里P8大佬亲自讲解

例如，Google的BERT模型、OpenAI的GPT模型、Facebook的RoBERTa模型等都是目前最为著名的LLM大模型之一，它们使用了大量的训练数据和强大的计算资源，取得了在自然语言处理领域的重大突破。CVR 指的是广告被点击后，用户进行了期望的行为（比如购买、注册、订阅等）的次数与广告被点击的次数之间的比例，通常以百分比的形式表示。例如，在计算机视觉、音频处理、医疗健康等领域，也可以使用类似的方法，使用大量数据和强大的计算资源来训练大型模型，从而实现更加准确和高效的预测和分析。

2024-05-12 09:41:33 396

原创最全大数据面试题_kafka message header(2)，7天拿到阿里大数据开发岗位offer

大家都知道namenode与secondary namenode 的关系，当他们要进行数据同步时叫做checkpoint时就用到了fsimage与edit，fsimage是保存最新的元数据的信息，当fsimage数据到一定的大小事会去生成一个新的文件来保存元数据的信息，这个新的文件就是edit，edit会回滚最新的数据。这样做的好处在于，在map端进行一次reduce之后，数据量会大幅度减小，从而减小传输，保证reduce端能够更快的进行结果计算。一般开启这个会比较好，以防错误删除重要文件。

2024-05-12 09:40:57 436

原创最全大数据面试求职经验总结_大数据专家面试，2024年最新2024大数据开发面经

5)熟练掌握Sqoop（SQL-to-Hadoop）的工作的原理，运作流程，实现数据在各组件之间的传输；6)熟练掌握Kafka分布式消息队列的架构。能够使用Kafka和Flume结合对实时数据进行简单的处理；7)熟练掌握Zookeeper（分布式协作服务）的架构，工作原理；8)能够使用Oozie（工作流程调度器）进行程序流式运行；9)掌握Git管理工具。模板2■ 语言1.Java•熟悉JVM的垃圾清理机制和调优，理解Java多线程的技术;

2024-05-12 09:40:21 461

原创大数据最新大数据SQL面试题 001，大数据开发开发基础教程视频

题目要求计算每个用户的连续登录天数。连续登录天数是指用户连续登录的天数，即从第一天登录开始，没有中断地登录的天数。这个问题涉及到对登录日志表的排序和条件判断，需要使用 Hive SQL 的窗口函数和条件表达式来解决。

2024-05-12 01:04:36 435

原创大数据最新大数据Hadoop之——部署hadoop+hive+Mysql环境（window11(1)，2024大数据开发最新大厂面试真题

10241```

2024-05-12 01:04:01 395

原创大数据最新大数据-玩转数据-FLINK(Yarn模式)的安装与部署_flink安装，大数据开发面试题2024

将安装包上传到hadoop100 /home/hadoop/apps 目录下，没有则创建它。下载 jdk-8u371-linux-x64.tar.gz。规划安装目录：/home/hadoop/apps。规划数据目录：/home/hadoop/data。注：apps和data文件夹需要自己单独创建。配置JAVA_HOME。

2024-05-12 01:03:24 243 1

原创大数据最新大学数据分析课程设计(1)，2024年最新腾讯面试算法题

使用glimpse函数查看所有数据列：可以看到，12个变量，共有537577条数据。这12个变量分别为：User_ID：购物者的编码Product_ID：产品编码Gender：购物者的性别Age：购物者的年龄Occupation：职业City_Category：购物者的居住地点Stay_In_Current_City_Years：在当前城市停留的年数Marital_Status：购物者的婚姻状况Product_Category_1：购买的产品类别。

2024-05-12 01:02:48 341

空空如也

空空如也