
Linux
文章平均质量分 75
bodyHealthy
最怕一生碌碌无为,最后又说平凡可贵
展开
-
python爬虫实战——DouYin
以登录状态(或者有cookies本地存储等状态)访问目标博主页面,滚动到作品最底部,然后在控制台中执行JavaScript脚本,获取全部作品的信息(在这里是作品链接以及作品类型),然后写出到文本文件中。上述的操作是在无登录状态下进行的,即使在webdriver中操作让页面滚动,也只能获取到有限的作品,大约是 20 项左右。然后在python中读入该文件,使用json解析,转成字典列表的形式,遍历列表,对每一个字典(就是每一个作品)进行处理即可。进入作品页前 判断作品是视频作品还是图文作品。原创 2024-03-12 23:25:14 · 20683 阅读 · 10 评论 -
Linux —— 定时任务(sleep、crontab、at)
定时任务开启后,每隔一分钟,第一句的结果将通过邮件发送到 /var/spool/mail/root 中,第二句的结果将添加到指定的文件末尾(由于输出的文件是相对路径,当前的用户为 root,则crontab 执行后,会输出到 /root/outputTime.txt 中,即用户主目录下的 outputTime.txt 文件中 )。program 可以是一个命令,也可以是一个 Shell 程序,推荐将定时执行的程序放到一个 Shell 程序中,让定时任务去执行 Shell 程序。原创 2024-03-12 19:20:19 · 1854 阅读 · 0 评论 -
Linux 学习笔记(3) —— Shell 批处理脚本以及字符串的处理
注意,在给变量赋值的命令中,如果等号两侧有空格,则会处理失败。如下图,如果等号左右两边都有空格,则会把第一个 username 作为命令,= 作为命令的第一个参数,'abc' 作为第二个参数来进行处理。使用频率最高的环境变量是 PATH,PATH 中定义了一批文件夹(路径),表示只要是在这个目录下的命令,就可以在命令行中直接执行,而不需要输入完整的路径。如果:$10,本意想接收第十个参数,实际上输出的是第一个参数拼接上 0 的结果。计算匹配字符串的长度,可以看见是从头开始匹配的,返回的是匹配的字符个数。原创 2023-12-23 13:49:15 · 2880 阅读 · 0 评论 -
Linux 学习笔记(2)—— 关于文件和目录、用户权限
该文件每行代表一个用户账号,记录了账号的所有信息,包括用户名、密码、用户ID(UID)、组ID(GID)、连接、主目录和默认的shell等。在正式的生产和服务器环境中,尽量使用普通的账号+人工权限设定的方式,避免出现漏洞后被人以root权限利用系统。在 linux 中,root 拥有最高的权限,所有文件或文件夹的权限设定对 root 都是无效的。在Linux中,文件归档的作用是将多个文件组合成一个单一的文件,这个过程称为归档。查找当前目录下所有不以a、b、c、d、e、f、A、B、C、D、E、F开头的文件。原创 2023-09-04 22:49:44 · 1423 阅读 · 0 评论 -
Linux 学习笔记(1)——系统基本配置与开关机命令
:系统配置文件和目录,存放系统的一些配置文件和目录,如`/etc/passwd`、`/etc/hosts`、`/etc/profile`等。如果希望在局域网中使用固定的IP地址,可以通过在设备上手动配置静态IP地址来实现,这样可以确保设备始终使用相同的IP地址。`:系统库文件,存放系统的共享库文件,如常见的`libc.so`、`libpthread.so`等。`:设备文件系统,存放系统中的各种设备文件,如串口、光驱、USB设备等。`:包含最经常使用的命令,如`ls`、`cd`、`echo`等。原创 2023-09-02 23:56:56 · 915 阅读 · 0 评论