- 博客(199)
- 收藏
- 关注
原创 最全大模型学习路线与建议_大模型学习路径,2024年最新大数据开发入门
不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!LLaMA 系列模型核心原理详解(LLaMA/Alpaca/Vicuna/BaiChuan/LLaMA2/BaiChuan2)大模型Tuning技术详解(Prompt-Tuning/Instruction-Tuning/P-Tuning)GPT 系列模型核心原理详解(GPT1/GPT2/GPT3/GPT4/InstructGPT)大模型微调中的核心要素。
2024-05-16 04:24:36
563
原创 最全大数据面试(4),2024年最新大数据开发软件开发面试题
分治和规约体现在mapreduce 框架中,就是map +reducemap是对一份大的数据集,切成小份后各个击破,里面封装着对每一条数据的处理逻辑,对于一些简单的应用来说把每一条数据转化成为想要的样子,就可以直接输出,不需要reduce 过程。但是,每条数据之间有交集,需要做聚合汇总,就必须有reduce 阶段。
2024-05-16 04:24:03
1066
原创 最全大数据集群搭建之Linux安装Hive2(1),腾讯大数据开发开发面试凉凉
Hive临时文件,用于存储每个查询的临时/中间数据集,通常在完成查询后由配置单元客户端清除。HiveServer2服务支持多线程多用户同时连接,还同时还支持JDBC连接。JDBC驱动:org.apache.hive.jdbc.HiveDriver。HiveServer2服务支持多线程多用户同时连接,还同时还支持JDBC连接。JDBC驱动:org.apache.hive.jdbc.HiveDriver。使用MySQL作为hive的元数据Metastore数据库。HiveServer2 webUI 监听主机。
2024-05-16 04:22:58
689
原创 大数据最新使用gs_probackup进行openGauss数据库物理备份与恢复(1),2024年最新缓存架构技术
物理备份与恢复适用于数据量大的场景,主要用于全量数据备份恢复,也可对整个数据库中的WAL归档日志和运行日志进行备份。openGauss提供了三种物理备份与恢复相关的工具:gs_backup、gs_basebackup和gs_probackup。三个工具的对比见下图。本篇主要介绍gs_probackup工具。它对openGauss 实例进行定期备份。可用于备份单机数据库或者数据库实例主节点,为物理备份。可备份外部目录的内容,如脚本文件、配置文件、日志文件、dump文件等。支持增量备份、定期备份和远程备份。
2024-05-15 19:36:35
451
原创 大数据最新使用Coze工作流(二)_coze 工作流,阿里巴巴大数据开发面试都问些什么
你可以在 Code 节点内使用 IDE 工具,通过 AI 自动生成代码或编写自定义代码逻辑,来处理输入参数并返回响应结果。LLM 节点是扣子提供的基础节点之一,你可以使用该节点的大语言模型处理文本生成任务。创建工作流后,你可以通过拖拽的方式将节点添加到画布内,并按照任务执行顺序连接节点。工作流提供了基础节点供你使用,除此之外,你还可以添加插件节点来执行特定任务。清晰明确的工作流名称和描述,有助于大语言模型更好的理解工作流的功能。该节点是一个 if-else 节点,用于设计工作流内的分支流程。
2024-05-15 19:36:02
721
原创 大数据最新从双非到大数据开发工程师,我是如何上岸阿里大厂的?(1),5年经验大数据开发程序员面试27天
笔试这东西,做的多了,感觉自然就来了,不会的就暴力,凑子集,凑着凑着也就A了。由于我严重低估了学习大数据技术栈所需要的时间,同时开发环境总是存在问题,加之八月份硬盘离奇烧掉,导致九月份开始秋招投递,严重耽误秋招进程,成功翻车。我立即作出了改变,对熟悉的关键技术进行了深化,将不足加以补充,同时面试过程中尝试让自己更加主动,主动去介绍、主动展现自我优势、主动与面试官聊天,面试也愈加轻松、熟练。十月中旬,我第一个offer下来了,待遇高于大厂白菜,十分吸引人,公司是两个超一线大Leader新创办的公司。
2024-05-15 19:35:29
351
原创 大数据最新从0到1项目搭建-框架搭建(附源码)_从零到一搭建一个项目,大厂大数据开发高级多套面试专题整理集合
创建常量包constant。通用常量返回状态码HttpStatus/\*\*\* 返回状态码\*\*//\*\*\* 操作成功\*//\*\*\* 对象创建成功\*//\*\*\* 请求已经被接受\*//\*\*\* 操作已经执行成功,但是没有返回数据\*//\*\*\* 资源已被移除\*//\*\*\* 重定向\*//\*\*\* 资源没有被修改\*//\*\*\* 参数列表错误(缺少,格式不匹配)\*//\*\*
2024-05-15 19:34:56
419
原创 华为云云耀云服务器L实例评测|在Docker环境下部署Hive数据库_docker 安装hive(2)
(img-BIVJeiyI-1715733464354)]上传mysql jdbc驱动到宿主机/mnt/docker_share。(img-G8MMklHZ-1715733464354)]复制mysql的驱动程序到hive/lib下面。dbserver连接hive。
2024-05-15 08:38:06
519
原创 华为云云耀云服务器L实例评测|在Docker环境下部署Hive数据库_docker 安装hive(1)
这是Maynor华为云云耀云服务器L实例评测|单节点环境下部署ClickHouse21.1.9.41数据库华为云云耀云服务器L实例评测|伪分布式环境下部署hadoop2.10.1华为云云耀云服务器L实例评测|在Docker环境下部署Hadoop云耀云服务器L实例是新一代的轻量应用云服务器,专门为中小企业和开发者打造,提供开箱即用的便利性。云耀云服务器L实例提供丰富且经过严格挑选的应用镜像,可以一键部署应用,极大地简化了客户在云端构建电商网站、Web应用、小程序、学习环境以及各类开发测试等任务的过程。
2024-05-15 08:37:30
456
原创 十年项目经验面试官亲传大数据面试__大数据面试独孤九剑_九剑前端
以上便是十年项目经验面试官亲传大数据面试独孤九剑~愿你读过之后有自己的收获,如果有收获不妨一键三连一下~既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新需要这份系统化资料的朋友,可以戳这里获取点,真正体系化!**
2024-05-15 08:36:54
917
原创 十年项目经验面试官亲传大数据面试__大数据面试独孤九剑_九剑前端(1)
本项目涉及的业务数据包括订单、运输、仓储、搬运装卸等物流环节中涉及的数据、信息。由于多年的积累、庞大的用户群,每日的订单数上千万,传统的数据处理技术已无法满足企业需求。因此通过大数据分析可以提高运输配送效率、减少物流成本,更有效地满足客户服务要求,并对数据结果分析,提出具有中观指导意义的解决方案。
2024-05-15 08:36:17
1021
原创 【MybatisPlus】最全面的MybatisPlus通关教程_mybatisplus 菜鸟教程
现有一张User🍀(2)初始化工程创建一个空的 Spring Boot 工程🍀(3)添加依赖说明:使用 mybatis-plus 可以帮助我们节省大量的代码,尽量不要同时导入 mybatis 和 mybatis-plus!🍀(4)连接数据库这一步和 mybatis的相关操作相同!🍀(5)连接mybatis,配置mapper.xml文件采用传统的方式:pojo-dao-service-controller🍀(6)编码🍀(7)编写测试类,进行功能测试。
2024-05-14 23:57:03
1047
原创 【MybatisPlus】MP的分页查询、多条件查询以及查询过程中解决null的空值判定_lambdaquerywrapper 不为空
MP这样一款强大的持久层框架处理起来复杂的SQL来也是得心应手,效率极高,快快与我一同领略Plus的独特魅力吧。
2024-05-14 23:56:27
1444
原创 【Mock】Neo4j知识图谱数据集Mock、问答训练数据集mock_neo4j数据集
为方便大家熟悉neo4j语法,练习cpl;以及可以作为基于Neo4j知识图谱做NLP问答推荐之类的知识数据,特分享医疗领域医疗知识图谱数据方便大家学习。
2024-05-14 23:55:51
352
原创 【Mock】Neo4j知识图谱数据集Mock、问答训练数据集mock_neo4j数据集(1)
为方便大家熟悉neo4j语法,练习cpl;以及可以作为基于Neo4j知识图谱做NLP问答推荐之类的知识数据,特分享医疗领域医疗知识图谱数据方便大家学习。
2024-05-14 23:55:15
277
原创 C++ Json到对象的自动序列化和反序列化工作_c++ json序列化和反序列化(3)
接下来完成演示复杂Json序列化代码,例如:序列化此数据为对象===>{“id”:20,“name”:“zhangsan”,“son”:{“id”:50,“name”:“lisi”},“objectList”:[{“indexID”: “1”,“testData”: “95100000000000991”},{“indexID”: “2”,“testData”: “95100000000000992”}]}可以看到这个json中有普通成员,有对象成员,有对象集合成员,使用我写的序列化依然可以完成正反序列。
2024-05-14 14:37:03
529
原创 C++ Json到对象的自动序列化和反序列化工作_c++ json序列化和反序列化(2)
接下来完成演示复杂Json序列化代码,例如:序列化此数据为对象===>{“id”:20,“name”:“zhangsan”,“son”:{“id”:50,“name”:“lisi”},“objectList”:[{“indexID”: “1”,“testData”: “95100000000000991”},{“indexID”: “2”,“testData”: “95100000000000992”}]}可以看到这个json中有普通成员,有对象成员,有对象集合成员,使用我写的序列化依然可以完成正反序列。
2024-05-14 14:36:27
608
原创 C++ Json到对象的自动序列化和反序列化工作_c++ json序列化和反序列化(1)
接下来完成演示复杂Json序列化代码,例如:序列化此数据为对象===>{“id”:20,“name”:“zhangsan”,“son”:{“id”:50,“name”:“lisi”},“objectList”:[{“indexID”: “1”,“testData”: “95100000000000991”},{“indexID”: “2”,“testData”: “95100000000000992”}]}可以看到这个json中有普通成员,有对象成员,有对象集合成员,使用我写的序列化依然可以完成正反序列。
2024-05-14 14:35:51
804
原创 2024年最全【数据结构与算法】【24考研】,32岁的程序员被裁
代码分析:分了四种情况前奇数后偶数 交换前偶数后偶数 前继续寻找奇数前奇数后奇数 后继续寻找偶数前偶数后奇数 前后继续寻找标准答案代码分析:老师的代码在我看来思路和我的一直都是寻找奇偶进行交换,但是很明显比我的优化很多,首先在遍历中从千米按先找到一个奇数,然后从从后面找到一个偶数,是单独找,我的是同时找。B. 将一个字符串从中间一分为二,前半段和后半段按顺序交换、若有奇数个字符,中间字符不参与例如:H a p p I n e s s \0。
2024-05-14 05:59:00
897
原创 2024年最全【数据结构与算法】【24考研】(1),真香
分析:咱们是将偶数移动到奇数之前,也就是说,要把前面的奇数移动到后面,后面的偶数移动的前面,这个时候我就想到了快速排序,快速排序是大小,咱们这里改成奇偶,也就是说咱们要在前部分虚招一个奇数,后半部分找一个偶数,两者交换,当一次遍历完成所有偶数就到奇数前面了。分析:虽然说是前半段和后半段互换,其实是将前半段移动到了后面,可以采取一个一个移动的办法,也可以采取我下面这个,将整个数组逆置,此时咱们想要的前半段,已经到了后面,只不过顺序仍然是反的,再将前半段后后半段分别翻回来就可以了。代码分析:分了四种情况。
2024-05-14 05:58:24
624
原创 2024年最全【数据结构】栈和队列,2024新一波程序员跳槽季
exit(-1);assert(ps);assert(ps);//exit(-1);ps->top++;assert(!ps->top–;assert(ps);assert(!assert(ps);ST st;s ++;
2024-05-14 05:57:48
825
原创 2024年大数据最全用户积分和积分排行榜功能微服务实现_积分排行榜软件架构,2024年最新高级大数据开发都应该知道
server:port: 7006 # 端口spring:name: ms-points # 应用名。
2024-05-13 21:10:37
895
原创 2024年大数据最全玩转大数据:1-推荐算法_混合推荐算法,2024年最新2024大数据开发最新大厂面试真题总结
深度学习是人工智能领域的一个重要分支,它是一种机器学习的方法,通过模拟人脑神经网络的工作方式来进行学习和决策。深度学习模型可以对大量的数据进行学习和处理,从而发掘出数据中的潜在规律和模式。在推荐系统中,深度学习可以用来对用户的行为和偏好进行建模,从而为用户提供更加个性化的推荐服务。推荐系统是一种基于用户行为和偏好的信息过滤系统,它可以根据用户的历史行为和偏好,向用户推荐符合其兴趣和需求的信息。
2024-05-13 21:10:01
979
原创 2024年大数据最全玩转Leaflet-带你吃透Control知识_leaflet controlposition(1),2024年最新你有过迷茫吗
Leaflet-IconLayers是一个基于Leaflet的带图标的切换控制器,它需要在Leaflet0.7.3以上的版本上使用,浏览器需要在IE9+以上才可以正常访问。。
2024-05-13 21:09:25
404
原创 2024年大数据最全猿创征文|我的C C++技术成长之路_c++程序员成长之路,大数据开发开发大佬的百度美团快手等大厂Offer收割之旅
特别是这一段逻辑,思考了蛮久,具体代码就不展示了😄不仅是对于实验室中的题目有过痛哭的回忆,自己在其他刷题网站上也是坎坷重重。
2024-05-13 21:08:48
990
原创 最新电商项目前台搜索服务es实现(1),2024BAT大厂大数据开发社招面试题
*** description:商品客户端*//*** 商品全部数据调用* @return*/
2024-05-12 18:13:52
258
原创 最新玩转大数据:1-推荐算法_混合推荐算法(1),大数据开发培训那里好
深度学习是人工智能领域的一个重要分支,它是一种机器学习的方法,通过模拟人脑神经网络的工作方式来进行学习和决策。深度学习模型可以对大量的数据进行学习和处理,从而发掘出数据中的潜在规律和模式。在推荐系统中,深度学习可以用来对用户的行为和偏好进行建模,从而为用户提供更加个性化的推荐服务。推荐系统是一种基于用户行为和偏好的信息过滤系统,它可以根据用户的历史行为和偏好,向用户推荐符合其兴趣和需求的信息。
2024-05-12 18:13:16
416
原创 最新猿创征文|国产数据库,我看好分布式数据库 TiDB_tidb国产数据库,2024网易大数据开发高级面试题及答案
这个特性可以说是分布式数据库最基本的要求,TiDB 允许用户按需对计算、存储分别进行在线的扩容或缩容,避免资源不足和资源浪费的问题。:通常指通过设计减少系统不能提供服务的时间,也就是做到冗余以及自动故障转移。:混合事务分析处理,即联机事务处理(OLTP)、联机分析处理(OLAP)的混合版,可同时实现两种功能。:ACID 事务指数据库在写入资料的过程中,为保证事务正确可靠所必须具备的原子性一致性隔离性持久性。:兼容 Mysql 5.7 协议和 Mysql 生态。
2024-05-12 18:12:40
630
原创 最新猿创征文|【(2),2024年最新双非渣本大数据开发四年磨一剑
下面的示例演示如何异步写入文件。此代码在 WPF 应用中运行,该应用具有名为 UserInput 的 TextBlock 和已挂接到名为 Button_Click 的 Click 事件处理程序的按钮。文件路径需要更改为计算机上存在的文件。
2024-05-12 18:12:03
371
原创 最全大数据驱动的工业互联网平台在工厂生产中的应用与创新(1),程序员进阶
嘿,朋友们!这里是艾斯视觉,我们拥有超过10年的UI设计和前端开发经验。我们希望通过我们的分享,能给您带来一些帮助和启发。如果您有任何问题或建议,请随时留言、关注并私信我们,让我们一起交流学习!感激不尽!大数据驱动的工业互联网平台是一种基于云计算、物联网和大数据技术的综合性解决方案,它能够实现对工厂生产过程的全面监控、数据收集和分析,从而提高生产效率、降低生产成本、优化产品设计、提升产品质量和客户满意度。
2024-05-12 09:42:09
263
原创 最全大数据领域相关术语总结(2),阿里P8大佬亲自讲解
例如,Google的BERT模型、OpenAI的GPT模型、Facebook的RoBERTa模型等都是目前最为著名的LLM大模型之一,它们使用了大量的训练数据和强大的计算资源,取得了在自然语言处理领域的重大突破。CVR 指的是广告被点击后,用户进行了期望的行为(比如购买、注册、订阅等)的次数与广告被点击的次数之间的比例,通常以百分比的形式表示。例如,在计算机视觉、音频处理、医疗健康等领域,也可以使用类似的方法,使用大量数据和强大的计算资源来训练大型模型,从而实现更加准确和高效的预测和分析。
2024-05-12 09:41:33
396
原创 最全大数据面试题_kafka message header(2),7天拿到阿里大数据开发岗位offer
大家都知道namenode与secondary namenode 的关系,当他们要进行数据同步时叫做checkpoint时就用到了fsimage与edit,fsimage是保存最新的元数据的信息,当fsimage数据到一定的大小事会去生成一个新的文件来保存元数据的信息,这个新的文件就是edit,edit会回滚最新的数据。这样做的好处在于,在map端进行一次reduce之后,数据量会大幅度减小,从而减小传输,保证reduce端能够更快的进行结果计算。一般开启这个会比较好,以防错误删除重要文件。
2024-05-12 09:40:57
436
原创 最全大数据面试求职经验总结_大数据专家面试,2024年最新2024大数据开发面经
5)熟练掌握Sqoop(SQL-to-Hadoop)的工作的原理,运作流程,实现数据 在各组件之间的传输;6)熟练掌握Kafka分布式消息队列的架构。能够使用Kafka和Flume结合对 实时数据进行简单的处理;7)熟练掌握Zookeeper(分布式协作服务)的架构,工作原理;8)能够使用Oozie(工作流程调度器)进行程序流式运行;9)掌握Git管理工具。模板2■ 语言1.Java•熟悉JVM的垃圾清理机制和调优,理解Java多线程的技术;
2024-05-12 09:40:21
461
原创 大数据最新大数据SQL面试题 001,大数据开发开发基础教程视频
题目要求计算每个用户的连续登录天数。连续登录天数是指用户连续登录的天数,即从第一天登录开始,没有中断地登录的天数。这个问题涉及到对登录日志表的排序和条件判断,需要使用 Hive SQL 的窗口函数和条件表达式来解决。
2024-05-12 01:04:36
435
原创 大数据最新大数据Hadoop之——部署hadoop+hive+Mysql环境(window11(1),2024大数据开发最新大厂面试真题
10241```
2024-05-12 01:04:01
395
原创 大数据最新大数据-玩转数据-FLINK(Yarn模式)的安装与部署_flink安装,大数据开发面试题2024
将安装包上传到hadoop100 /home/hadoop/apps 目录下,没有则创建它。下载 jdk-8u371-linux-x64.tar.gz。规划安装目录:/home/hadoop/apps。规划数据目录:/home/hadoop/data。注:apps和data文件夹需要自己单独创建。配置JAVA_HOME。
2024-05-12 01:03:24
243
1
原创 大数据最新大学 数据分析 课程设计(1),2024年最新腾讯面试算法题
使用glimpse函数查看所有数据列:可以看到,12个变量,共有537577条数据。这12个变量分别为:User_ID:购物者的编码Product_ID:产品编码Gender:购物者的性别Age:购物者的年龄Occupation:职业City_Category:购物者的居住地点Stay_In_Current_City_Years:在当前城市停留的年数Marital_Status:购物者的婚姻状况Product_Category_1:购买的产品类别。
2024-05-12 01:02:48
341
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人