- 博客(251)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 python与爬虫-03初入网络爬虫
1.背景介绍网络爬虫:形象地说,可以在Web上爬行,本质上是一种递归方式;首先,获取一个URL对应的网页内容,检查此页面,寻找另一个URL,再获取该URL对应的网页内容,然后不断循环这一过程。注意:需要思考消耗的带宽,能不能不要占用过多的目标服务器,可能是害怕被发现,这样就算是一种攻击了吧!维基百科六度分隔理论:关于这个的相关内容,可以自行查询,也可以参考https://blog.youkuaiyun.com/crazy642535606/article/details/77924753补充:此理论认为世界上任
2022-04-11 13:27:34
983
1
原创 python与爬虫-02HTML相关内容
1.正则表达式1.regex案例:词组正则字符串规则:a至少出现一次;b重复5次;c重复偶数次;最后是d或e。表达:aa*bbbbb(cc)*(d|e)2.常用正则表达式及符号符号含义*匹配前面的内容,0或多个+匹配前面的内容,至少1个[]匹配任意字符()表达式编组{m,n}m到n次[^]匹配不在里面的字符|匹配任意一个由竖线分割的字符.匹配任意单个字符^指开始位置\转义字符$表达式末尾?
2022-04-08 18:03:09
654
原创 python与爬虫-02复杂的HTML解析
序:基于位置、上下文、属性、内容选择标签的标准方式和创新方式;1.进一步使用BeautifulSoup抓取网页(1)代码如下from urllib.request import urlopenfrom bs4 import BeautifulSouphtml = urlopen('https://www.pythonscraping.com/pages/warandpeace.html')bs = BeautifulSoup(html.read(),'html.parser')nameList
2022-04-07 18:39:48
1199
原创 PAROT: Translating natural language to SPARQL(PAROT:将自然语言翻译成SPARQL)--10
感觉又是装腔作势的一天!
2022-04-05 16:20:01
466
原创 01 rdfs文件-害怕弄丢了,所以备份一下
地址:https://www.w3.org/2000/01/rdf-schema#@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .@prefix owl: <http://www.w3.org/2002/07/owl#> .@prefix dc: <http://purl.o.
2022-03-16 11:36:39
267
原创 win8.1电脑显示器亮度按钮无法使用
今天遇到一个问题,我的笔记本电脑的F11和F12键是调节亮度的快捷按钮,但是,最近两天它俩都用不了了!卡住了,我以为我安装软件装多了呢!PS:我用了搜狗输入法,换成了手心输入法就快一倍了!因为搜狗的那个数据收集功能和一些联网功能占内存,手心完全就是洁净版,啥也没有!当然,也不会记录你的输入习惯什么的!NAVID控制面板也没有显示器这一项,因为WIN8.1近似于win7的结构,所以,我找到了一个教程!http://www.windows7en.com/jiaocheng/57124.htmlhttp
2022-03-13 11:14:56
1397
3
原创 我与论文之间的那些爱恨情仇01-公式如何能够变得正常起来
用office和wps写公式哪个更省时省力!PS:我打算爱国一把!因为这个office真的一点儿也不懂国人的心!就光顾着挣钱了!以后还是考虑用WPS写东西吧!那么今天就来看看如何使用OFFICE2010对公式进行操作!1.首先你已经有了一个office2010,然后,你可以安装一个mathtype!!https://www.mathtype.cn/jiqiao/anzhuang-mt7.html2.然后,你打算考虑是不是也搜索个教程——把office和mathtype之间建立联系!然并软~~~你
2022-02-07 17:52:53
200
1
原创 如何解决office-2010的“安装语言不支持”等问题
此处的: “安装语言不支持”等问题,指的是刚开始安装的时候,点击“setup.exe”的时候,弹出的一个提示框————“”(忘记具体是啥了,应该就是什么什么语言不支持之列的!)1.首先,你要有一个office2010的安装包!下面是软件的压缩文件,后缀名为.ZIP格式。2.然后,你需要对它进行解压缩处理!注意此处需要使用CMD的“/extract:”格式进行处理!1)按住shift键,右键单击压缩包,然后选择:“复制为路径(A )”。2)打开“命令提示符”CMD,粘贴刚才已经复制好的路径;.
2022-02-07 12:31:01
2009
1
原创 电脑清理技巧
需要定期清理的四大文件夹(PS:短视频收集来的)1.“temp”2.“prefetch”3.“download”4.“logfiles”PS:是C盘中的上诉几个文件夹!
2021-12-27 11:27:11
303
原创 手机内存清理技巧
我在一个视频上看到的技巧性内容!因为,与实际情况有出入就再整理一下了!–>文件管理-“cache”-这个搜索项目里面好像确实没什么值得注意的地方!PS:华为HONOR型号的手机!一共筛选出1447个项目文件!–>文件管理-“backup”-备份文件,全被我删除了!一共14个文件夹!–>文件管理-“download”-一般情况下,这个慎删!–>文件管理-“temp”-这个是临时文件!一般可以全部删除!–>文件管理-“date”-这个挨个文件夹检查一下再删除!...
2021-12-27 11:21:34
1033
原创 本体开发日记07-我与java分词组件的爱恨情仇-JiebaSegmenter类
看不下去了!干嘛这么累呢!凑合写吧!package com.huaban.analysis.jieba;import java.nio.file.Path;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import com.huaban.analysis.jieba.viterbi.FinalSeg;补充一个内容:com.huaban.anal
2021-12-01 16:20:38
586
原创 本体开发日记07-我与java分词组件的爱恨情仇-WordDictionary类
这个就是之前我总出错的那个类!package com.huaban.analysis.jieba;import java.io.BufferedReader;import java.nio.file.DirectoryStream;import java.nio.file.Files;import java.nio.file.Path;import java.io.IOException;import java.io.InputStream;import java.io.InputStre
2021-12-01 16:05:36
312
原创 本体开发日记07-我与java分词组件的爱恨情仇-Node+Pair+SegToken类
这三个类内容都比较少!眼干眼涩,想买眼药水了!WQNMD,居然某一天,我也需要使用眼药水了!!我的心脏都不跳了!!package com.huaban.analysis.jieba;public class Node { public Character value; public Node parent; public Node(Character value, Node parent) { this.value = value; this.
2021-12-01 15:47:28
399
原创 本体开发日记07-我与java分词组件的爱恨情仇-Hit类
先是几个参数:UNMATCH MATCH PREFIX hitState begin end matchedDictSegment//Hit不匹配private static final int UNMATCH = 0x00000000;//Hit完全匹配private static final int MATCH = 0x00000001;//Hit前缀匹配private static final int PREFIX = 0x00000010;//该HIT当前状态,默认未匹配privat
2021-12-01 15:39:29
117
原创 本体开发日记07-我与java分词组件的爱恨情仇-DictSegment类
1.词典树分段,表示词典树的一个分枝?啥是词典树?package com.huaban.analysis.jieba;import java.util.Arrays;import java.util.HashMap;import java.util.Map;上面是引用!class DictSegment implements Comparable<DictSegment>这个类实现了一个接口:Comparable讲解:https://www.cnblogs.com/walt
2021-12-01 14:51:35
451
原创 本体开发日记07-我与java分词组件的爱恨情仇-CharacterUtil类
现在,打算挨个理解一下这个java版本的jieba组件程序!package com.huaban.analysis.jieba;import java.util.regex.Pattern;这个是这个类的引用,正则表达式的一种已编译的实现。 public static Pattern reSkip = Pattern.compile("(\\d+\\.\\d+|[a-zA-Z0-9]+)"); private static final char[] connectors = new char[]
2021-12-01 14:36:02
135
原创 本体开发日记07-我与java分词组件的爱恨情仇
OS:吐槽一下,我的破电脑,昨天对于github上下载的那个jieba命名用不了,现在,一晚上,我今天能用了!!千年虫是不是依靠重启和等待就可以解决了!关键是,我的电脑他自己一晚上把这个程序自己解决了!真实我的贴心小电脑!喵喵喵~~~1.下载jieba-analysis这个是gitee码云上的资源:https://gitee.com/langhu/jieba-analysis-mend/博客园:https://www.cnblogs.com/yifeiyu/p/10991001.html这个是gi
2021-12-01 14:10:13
580
原创 本体开发日记01-环境变量配置(补充)
一直以为,之前总结的经验已经够用了!没想到!这个java和eclipse特定版本的java和eclipse对应了不同的配置方法!下面针对其他的做个补充!1.jena的安装1)下载jena,版本是:apache-jena-4.2.02)直接解压,然后,配置系统变量新建JENA_HOME,值为jena的安装目录!在CLASSPATH下,添加%JENA_HOME%\lib(思考:如果也添加了\lib-src,是不是eclipse里面就可以添加lib-src里面的jar包了!)在Path上,添
2021-11-30 15:26:30
323
原创 本体开发日记-java卸载
https://blog.youkuaiyun.com/wzgl__wh/article/details/62893793https://java.com/zh-CN/download/help/remove_olderversions.htmlhttps://support.microsoft.com/zh-cn/windows/%E4%BF%AE%E5%A4%8D%E9%98%BB%E6%AD%A2%E7%A8%8B%E5%BA%8F%E5%AE%89%E8%A3%85%E6%88%96%E5%88%A0%E.
2021-11-29 20:33:06
269
原创 本体开发日记06-给我的实验环境换个电脑(给我自己看的)
我自己写得文章https://blog.youkuaiyun.com/weixin_45799003/article/details/120588403我自己原来的环境配置参数防止以后使用java的时候,忘记这个东西!系统变量(S)JAVA_HOME:C:\Program Files\Java\jdk1.8.0_161JENA_HOME:F:\Jena\apache-jena-4.2.0CLASSPATH:.;%IAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar;%JAV.
2021-11-29 14:52:13
1274
原创 本体开发日记——ECLIPSE与jena——02-Fuseki
叹气!!!快要交稿了!我NM才开始实验!我也是个天才呀!!!!安装使用Apache Jena Fuseki https://blog.youkuaiyun.com/setella/article/details/103381537这篇文章写得很清楚了!说重点!这是作者的错误!这个绿色文件夹下面放ttl文件!注意:必须是使用protege转换而成的turtle格式的ttl文件,如果只改了文件后缀名,会报错:server:error!!!上传文件后记得点击一下后面的uploadfile按钮!就上传成功了
2021-11-14 20:33:45
1057
原创 本体开发日记——ECLIPSE与jena——01
1安装tomcat!参考视频教程:https://www.bilibili.com/video/BV1QJ411m7xD?from=search&seid=6345694930320030808&spm_id_from=333.337.0.0如果,你不仔细看会安装错误的eclipse软件,然后你会发现没有tomcat9.0.之后你会疯狂的找教程,你就会找到下面的内容!没有server的解决办法:https://www.cnblogs.com/xiaoxiaoweng/p/7298
2021-11-14 19:36:41
620
原创 “摄像头用不了”+win8.1+DELL+外置摄像头+USB免驱的解决办法
下面是两篇参考文档!文档1 Win7摄像头驱动错误怎么办https://blog.youkuaiyun.com/maoxiaojiemaoxiaojie/article/details/72790118文档2https://blog.youkuaiyun.com/weixin_45799003/article/details/116309389文档1是关于win7的,然后,之前买了个30多一点的免驱USB摄像头!我的台式机能用!我的笔记本不能用!鉴于我的笔记本连个打印机驱动都装不了,所以,我就找客服,客服给我介绍了,驱动.
2021-11-05 14:33:37
1450
原创 使用Protege4和CO-ODE工具构建OWL本体的实用指南-1.3版本(4.Building An OWL Ontology)
2021.10.29.周五,今天又做了一次核酸检测!我开始阅读我需要的内容!别人的话,即使激励也是焦虑的开始!有压力才有动力!没有动力,就没有办法拼搏!但是,方向要对啊!不能被误导了!学着分辨!(PS:觉得先打个稿子吧!等到10分钟的时候再走!21:10的时候!)Building An OWL Ontology4.1这个教程使用的protege好像不是一个版本的!...
2021-10-31 12:50:09
672
原创 本体开发日记05-努力理解SWRL(Built-Ins)
八、内置程序简介8.1 Built-Ins for Comparisons用于比较的内置函数8.2 Math Built-Ins8.3 Built-Ins for Boolean Values8.4 Built-Ins for Strings8.5 Built-Ins for Date, Time and Duration8.6 Built-Ins for URIs总结简介SWRL 的内置集是由模块化方法驱动的,该方法将允许在(分层)分类法中的未来版本中进一步扩展。同时,它将为各种实现提供灵活性,以
2021-10-28 16:23:05
1647
2
原创 本体开发日记05-努力理解SWRL(Usage Suggestions)
Usage Suggestions使用建议扩展 OWL DL,从而尽可能使用 OWL 结构。如果用户大量使用规则,他们可能希望限制他们使用的规则的形式或表达方式,以提高互操作性、可重用性、可扩展性、计算可扩展性或易于实现。规则形式的一个有用的限制是将先行类和后续类原子限制为命名类,其中类纯粹在 OWL 中定义(在同一文档中或在外部 OWL 文档中)。遵循这种格式可以更轻松地将规则转换为现有(或未来)规则系统,包括:序言 Prolog生产规则(从 OPS5 继承而来) production rul
2021-10-28 15:30:55
381
原创 本体开发日记05-努力理解SWRL(RDF Concrete Syntax)
RDF Concrete SyntaxRDF 具体语法SWRL 的 RDF 模式是 swrl.rdf。SWRL 的 OWL 本体是 swrl.owl。每一个都只提供了 SWRL 语法的部分描述;OWL 本体比 RDF Schema 更完整。通过扩展OWL XML 表示语法 [ OWL XML ]的XSLT 转换,可以轻松完成从 XML 具体语法到 RDF/XML 的 转换。swrl.rdf<?xml version='1.0' encoding='ISO-8859-1'?><!DO
2021-10-28 15:26:39
1101
原创 本体开发日记05-努力理解SWRL(下)
五、XML 具体语法XML Concrete SyntaxXML 具体语法是 OWL Web Ontology Language XML Presentation Syntax [ OWL XML ] 与 RuleML XML 语法 [ RuleML ] 的组合。任意 OWL 类(例如,描述)可以用作规则中的谓词规则和本体公理可以自由混合现有的 XSLT 样式表 ( owlxml2rdf.xsl ) 可以很容易地扩展以提供到 RDF 图的映射,从而扩展了 OWL RDF/XML 交换语法简化了
2021-10-28 15:17:16
1685
6
原创 本体开发日记05-努力理解SWRL(中)
提示:http://www.daml.org/rules/proposal/十分感谢360的网页翻译插件!目录Abstract一、简介二、Abstract Syntax抽象语法1.规则Rules2.人类可读的语法三、Direct Model-Theoretic Semantics直接模型理论语义1.解释规则Interpreting Rules四、示例规则4.1.14.1.24.1.34.1.4总结Abstract本文档包含基于 OWL Web 本体语言的 OWL DL 和 OWL Lite 子语
2021-10-28 14:38:48
2027
原创 本体开发日记05-努力理解SWRL(上)
http://www.daml.org/announcements.htmlhttp://www.daml.org/2004/04/swrl/眼睛有点儿疼!一会儿去睡一会儿吧!Q_Q1.这个是开头2.不知道看哪一个!看看最新版本吧!http://www.daml.org/rules/proposal/打算看哪个重要翻一下!...
2021-10-28 13:28:51
438
原创 使用Protege4和CO-ODE工具构建OWL本体的实用指南-1.3版本(7.4 Annotation Properties-注释属性)
OWL允许类、属性、个体和本体本身(从技术上来说-本体标题)用各种信息/元数据进行注释。这些信息可以采用审计(auditing)或编辑信息的形式。例如,评论、创建日期、作者,或对网页等资源的引用。OWL-Full不会对注释属性的使用设置任何约束(原句:the uasge of annotation properties)。然而,OWL-DL确实对注释属性的使用设置了一些约束。不知道是不是指上面的那个内容!两个最重要的限制是:1.注释属性的填充必须是data literal,URI referen.
2021-10-26 15:59:03
687
原创 本体开发日记04-努力理解protege的某个方面
先来理解下面的这个图!本来写着写着以为糊弄一下就过去了!结果发现语义网需要在关系上添加一个属性,我就很闹心了!尤其,需要理解下面这些东西都是干什么的!于是,打算把这个过程记下来!Q_q下面是源文件地址:http://www.w3.org/2002/07/owl/owl#backwardCompatibleWithhttp://www.w3.org/2000/01/rdf-schema#comment但是,两个地址都用不了!搞不明白的时候就先找一下资料!https://www.w3sc
2021-10-26 15:20:26
188
原创 本体开发日记03-理解代码
1.推荐一个宝藏博主https://blog.youkuaiyun.com/javafreely(地球原住民)。2.代码:https://blog.youkuaiyun.com/javafreely/article/details/84325223.博主的RDF专栏:https://blog.youkuaiyun.com/javafreely/category_1311840.html?spm=1001.2014.3001.5482要是能有个OWL的就好了!发现大家都是毕设写这个!我OWL完全没搞懂!!!!1.根据前面引用代码里面.
2021-10-03 16:39:53
302
原创 本体开发日记03-排错进行时
本人菜鸡!凑合弄吧!还能咋地!明天进行下一阶段!排错: https://blog.youkuaiyun.com/akihiiiii/article/details/108740154代码: https://blog.youkuaiyun.com/javafreely/article/details/8432522参考书:https://max.book118.com/html/2017/0717/122715588.shtm...
2021-10-03 11:49:11
115
原创 本体开发日记02-sparql简单查询
参考文档:1.https://blog.youkuaiyun.com/u013819513/article/details/79903106?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefaul.
2021-10-02 20:11:04
365
原创 本体开发日记01-Jena配置环境变量
https://blog.youkuaiyun.com/yisuoyanyulou1314/article/details/51690914上面的是一个可信任的贴!我是照着他的步骤写的!1.下载Jenahttp://jena.apache.org/download/index.cgi我下载的apache-jena-4.2.0.zip这个文件!2.根据个人需要解压到相应文件夹下面3.配置环境变量cmd命令:where java 可以查看java.exe可执行文件的目录有几个!确保只保留一个目录!.
2021-10-02 19:43:41
343
关于win10系统,登录选项里面,没有管理员账户的问题!
2021-03-29
TA创建的收藏夹 TA关注的收藏夹
TA关注的人