静听山水-优快云博客

原创阿里云的日志服务

SLS通常指的是“Serverless Logging Service” 或者是阿里云的日志服务（Log Service）。在云计算和大数据处理领域中，尤其是在提到阿里云时，SLS往往指的是阿里云的日志服务。总之，阿里云日志服务是一个强大的工具，适用于需要处理和分析大规模日志数据的企业和个人开发者。通过简化日志管理流程，它有助于提高运维效率、优化性能监控，并支持基于日志数据的商业智能决策。是一个完全托管的日志大数据平台，提供从日志采集、消费到查询分析、可视化、告警以及投递等一站式服务。

2025-01-04 08:35:29 553

原创 Hologres支持的数据类型

Hologres支持的数据类型及数组类型 - 实时数仓Hologres - 阿里云

2025-01-04 08:24:46 156

原创生成 requirements.txt

为了直接生成文件，可以使用pipreqs或者pip freeze。

2024-12-15 14:03:33 983

原创 Linux排查cpu运行负载过高

如果你知道某些特定的用户或命令可能有问题，可以过滤这些。这个命令将列出 CPU 使用率最高的前10个进程。列，找出占用 CPU 最多的进程。) 等不同类型的 CPU 使用率。操作系统内核使用的 CPU 时间。先输入top再输入1，查看。应用程序使用的 CPU 时间。每一行显示了用户空间 (

2024-12-15 13:16:33 782

原创 supervisor使用详解

Supervisor 是一个用 Python 编写的客户端/服务器系统，它允许用户在类 UNIX 操作系统（如 Linux）上监控和控制进程。Supervisor 并不是一个分布式调度框架，而是一个进程管理工具，它可以用来启动、停止和重启程序，并且可以自动重启崩溃的程序，确保它们保持运行状态。管理多个子进程按照配置文件简单的 Web 界面用于查看所有受管进程。

2024-12-14 22:14:23 555

原创 .idea

idea/文件夹下的文件和目录主要用于存储 JetBrains IDE（如 PyCharm、IntelliJ IDEA 等）的项目配置。

2024-12-12 10:31:04 645

原创 pycache

是 Python 解释器自动生成的一个目录，用于存储编译后的 Python字节码文件（.pyc 文件）。这些字节码文件是 Python 源代码（.py 文件）经过编译后生成的中间表示形式。使用.pyc文件的主要目的是为了提高程序的。

2024-12-12 09:17:41 353

原创 Flink CDC

Flink CDC（变更数据捕获）是一种技术，它允许实时地捕获和处理数据库中的变化。通过 Flink CDC，可以从支持的数据库中读取更改记录（如插入、更新、删除操作），并将这些更改流式传输到其他系统或进行实时分析。这项技术对于构建实时数据管道、实现数据同步以及维护多个数据源之间的一致性非常有用。

2024-12-10 10:15:01 703

原创 Flink Python作业快速入门

【代码】Flink Python作业快速入门。

2024-12-09 20:26:11 358

原创 Flink SQL作业快速入门

这段代码是使用Apache Flink SQL来处理来自阿里云日志服务（SLS）的GitHub事件数据。它创建了一个临时表gh_event，该表连接到SLS以读取GitHub事件流，并设置了一些Flink作业的配置参数。最后，它执行了一个查询，用于计算当天获得新星标（star）最多的前10个GitHub仓库。

2024-12-09 16:49:03 575

原创 mysql-增量更新

【代码】mysql-增量更新。

2024-12-06 00:03:42 225

原创 Flink版(Flink)-阿里云

快速入门_实时计算 Flink版(Flink)-阿里云帮助中心

2024-12-04 15:28:08 147

原创 Python中的继承（Inheritance）思想

一个子类只继承一个父类。

2024-12-04 14:31:35 791

原创 Python中的封装(Encapsulation)思想

封装的核心思想是将对象的数据（属性）和行为（方法）打包在一起，并限制外界对它们的直接访问。是 Python 中的一个内置装饰器，它允许将类的方法定义为属性，从而可以像访问类的属性一样访问这些方法，而不需要使用括号调用它们。：封装和多态相辅相成，封装允许将实现隐藏，而多态允许对象在运行时决定具体调用的实现，使得代码的扩展性更强。：虽然双下划线的属性和方法是“私有”的，但实际上 Python 只是对它们的名称进行了重整。：封装可以结合继承一起使用，通过子类继承父类的公有方法和受保护的属性，封装性依然得以保持。

2024-12-04 13:59:57 657

原创 ProcessPoolExecutor怎么使用?

虽然模块提供了更多灵活的进程控制功能，但简化了多进程并发的实现，特别适合处理大量 CPU 密集型任务。它的使用十分广泛，尤其在需要同时管理多个任务结果时，Future对象极大地降低了代码的复杂性。

2024-12-04 13:44:55 398

原创 multiprocessing模块怎么使用?

Python 的模块为我们提供了丰富的工具来处理多进程编程中的各种需求。从基础的Process类，到高级的进程间通信、同步机制，每种工具都有其适用的场景。Process：创建和管理独立进程。Pool：通过进程池并发执行多个任务。Queue和Pipe：实现进程间的安全通信。Lock和Semaphore：用于进程间的同步和共享资源控制。ValueArray和Manager：在进程间共享数据。

2024-12-04 11:36:38 675

原创线程池与进程池的区别是什么?

管理多个进程，适合CPU 密集型任务，不受 GIL 限制。：管理多个线程，适合I/O 密集型任务，受 GIL 限制。

2024-12-04 11:10:14 439

原创 python生成器函数

对于非常大的文件，可以采用分批处理的方法，即每次处理一部分数据，这样可以在保持较低内存占用的同时完成对整个文件的处理。如果操作可以直接在线性遍历中完成（例如过滤、映射转换），可以在遍历的同时直接应用这些操作，而不需要额外的数据结构。如果文件不是特别大，以至于整个内容可以安全地存储在内存中，可以将所有行收集到一个列表里，然后对这个列表进行操作。生成器可以作为数据管道的一部分，每个生成器负责处理数据的一个步骤，并将结果传递给下一个生成器。当需要处理非常大的数据集时，使用列表或其他容器可能会占用大量的内存。

2024-12-04 09:54:21 258

原创 get_db

在get_db函数中使用 yield关键字，而不是直接返回 (return数据库会话对象，是为了实现更复杂的行为，即延迟执行和资源管理。以下是为什么要使用yield。

2024-12-04 09:45:56 452

原创 @staticmethod、@classmethod

在使用falsk-restful这个框架进行模型部署调用时，发现模型推理时间很快，但是完整的一次请求过程非常耗时。在debug的过程中发现，每次请求调用api接口时，模型的推理类都会被实例化，推理类在构造的时候，会在初始化中加载模型，加载模型的过程是耗时较长的。通过@classmethod方法初始化模型的加载，相当于创建了一个全局变量，在后续的请求调用中，不会一直重复加载。当方法需要访问或修改类属性，或者需要通过类来创建实例时，适合使用类方法。当函数与类相关，但其操作不依赖于类状态时，适合使用静态方法。

2024-12-03 23:22:06 309

原创 Python中的实例方法、静态方法和类方法三者区别？

不用@classmethod和@staticmethod修饰的方法为实例方法。在类中定义的方法默认都是实例方法。实例方法最大的特点是它至少要包含一个self参数，用于绑定调用此方法的实例对象，实例方法通常可以用类对象直接调用。采用修饰的方法为类方法。类方法和实例方法相似，它至少也要包含一个参数，只不过类方法中通常将其命名为cls，Python会自动将类本身绑定给cls参数。我们在调用类方法时，无需显式为cls参数传参。

2024-12-03 22:57:51 303

原创 Python装饰器

装饰器是Python中非常有用的功能，它们允许我们以。，该装饰器将执行现有函数的功能和添加的额外功能。例1：装饰器用于计算并打印被装饰函数的执行时间。例2：用于在执行被装饰的函数前记录警告日志。，它可以让已有的函数不做任何改动的情况下。上，而无需修改其内部代码。装饰器本质上还是一个函数。将现有函数传递给装饰器。

2024-12-03 22:54:51 278

原创深拷贝与浅拷贝

注：浅拷贝和深拷贝的不同仅仅是对组合对象来说，所谓的组合对象就是包含了其他对象的对象，如列表，类实例等等。浅拷贝是指创建一个新的对象，其内容是原对象中元素的引用（新对象与原对象共享内存中的子对象）。常见的浅拷贝有：切片操作、工厂函数、对象的copy()方法，copy模块中的copy函数。从上面的例子中可以看出，a浅拷贝得到b，a和b指向内存中不同的list对象，但是他们的。深拷贝是指创建一个新的对象，然后递归的拷贝原对象所包含的子对象。深拷贝出来的对象与原对象没有任何关联。

2024-12-03 22:33:33 291

原创 Python中常用的标准库以及功能

Python 提供了丰富的标准库，这些库为我们提供了常用的工具和功能，涵盖了从操作系统交互、文件处理、数据序列化、网络通信到多线程编程等方方面面。这些标准库大大简化了我们的工作，使得开发高效、稳定、易于维护的应用程序变得更加容易。在实际项目中，熟练掌握和合理运用这些标准库，可以显著提高我们的开发效率和代码质量。

2024-12-03 18:34:18 787

原创 Python中的函数参数

在Python中，函数的参数有多种类型和一套设定的规则需要遵守，这使得函数定义和调用非常灵活。

2024-12-03 18:10:33 253

原创 python数据结构

Python提供了一系列内置的数据结构，这些数据结构非常强大和灵活，可以用来处理各种不同类型的数据。这些数据结构包括列表、元组、字典、集合，以及通过标准库可用的更多高级数据结构如队列和堆。

2024-12-03 17:28:32 251

原创 python的字符串格式化

在Python中，字符串格式化是一项重要的技能，能帮助高效地生成和处理字符串。Python提供了多种字符串格式化的方法，包括旧式的百分号（）格式化、新式的方法以及最新的f-string（格式化字符串字面量）。

2024-12-03 17:21:51 356

原创 python字典和json字符串如何相互转化？

Python 的字典（dict）和 JSON 字符串是非常常用的数据结构和格式。Python 提供了非常简便的方法来将字典与 JSON 字符串相互转化，主要使用json和。

2024-12-01 23:37:40 1361

原创进程间维护全局数据

为了更好地展示如何在多进程之间维护和共享全局数据，可以使用提供的对象（如、等），这些对象可以在多个进程中安全地共享和修改。下面将给出一个清晰的例子，不仅展示了如何使用来共享字典，还展示了如何通过锁来确保对共享资源的安全访问。创建一个实用的场景：每个子进程增加自己的计数到共享字典中，并且主进程最后会汇总所有子进程的结果。示例代码：使用 Manager 维护全局数据解释设置启动方法：定义工作者函数：主程序逻辑：锁机制：

2024-12-01 22:21:07 424

原创进程间通信

设置启动方法：定义工作者函数：主程序逻辑：这种结构使得代码更加模块化和易读，同时也明确了各个部分的功能。

2024-12-01 22:02:05 350

原创多进程multiprocessing基本使用

在打印消息后都会休眠两秒钟，模拟一个耗时的任务。这样做可以让主程序等待一段时间，直到所有子进程完成它们的工作。这有助于理解多进程如何同时处理多个任务，并且可以看到子进程是如何并发执行的。进程是python的最小资源分配单元，每个进程会独立进行内存分配和数据拷贝。

2024-12-01 21:34:44 102

原创 python多线程使用

【代码】python多线程使用。

2024-12-01 13:04:14 117

原创 Python线程使用

为了更清楚地体现出线程可以同步进行多个任务，将打印出每个任务的状态和时间戳。来模拟 I/O 密集型任务（如爬取数据），并展示如何通过。线程实现这些任务的并发执行。

2024-12-01 12:48:38 191

原创 FastAPI多线程

【代码】FastAPI多线程。

2024-12-01 12:07:55 305

原创 FastAPI多线程

【代码】FastAPI多线程。

2024-11-28 17:13:09 395

转载 mysql Date类型无法用date入参查询

mysql Date类型无法用date入参查询_mob649e815adb02的技术博客_51CTO博客

2024-11-21 20:25:53 57 1

原创 msyql的COLLATE

表示使用utf8mb4字符集，并且在比较和排序字符串时使用 Unicode 标准，不区分大小写。这种排序规则适合大多数多语言和国际化应用。

2024-11-21 15:11:09 572

转载离线同步工具DataX

DataX完成单个数据同步的作业，我们称之为Job，DataX接受到一个Job之后，将启动一个进程来完成整个作业同步过程。DataX Job模块是单个作业的中枢管理节点，承担了数据清理、子任务切分(将单一作业计算转化为多个子Task)、TaskGroup管理等功能。DataXJob启动后，会根据不同的源端切分策略，将Job切分成多个小的Task(子任务)，以便于并发执行。Task便是DataX作业的最小单元，每一个Task都会负责一部分数据的同步工作。

2024-11-19 09:07:39 63

原创链表实现反转

当你想要找到某个特定位置的珠子时，需要从第一颗珠子开始，沿着线依次查看每颗珠子上的标签，直到找到你要的那个。这种方式在某些情况下效率较低，因为可能需要检查很多个节点才能到达目标节点。但是，插入和删除操作相对简单快捷，因为只需要调整相邻节点之间的连接即可。链表是一种数据结构，可以用一个常见的比喻来理解。想象一下，你有一串珠子，每个珠子上都有一个小标签，上面写了一些信息（比如数字或字母）。这些珠子通过一根线串在一起，每颗珠子都。只知道自己后面紧挨着的那一颗珠子在哪里。，而不知道其他珠子的位置。

2024-11-17 09:54:25 197

转载 Nginx 学习网站全攻略

掌握Web服务器之王：Nginx 学习网站全攻略！_nginx 语法的网站-优快云博客

2024-11-11 15:00:43 54

空空如也

空空如也