postgres8guard
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
27、基于图神经网络和文本行业数据的交易预测及近似贝叶斯计算方法的过拟合问题
本文探讨了基于图神经网络(GNN)和文本行业数据的交易预测方法,以及近似贝叶斯计算(ABC)在处理不均匀分布数据时的过拟合问题。在交易预测方面,结合Doc2Vec嵌入、边权重增强的注意力机制与GAT/GIN模型,显著提升了ROC-AUC得分至0.9505,并通过可视化增强了模型可解释性。针对ABC方法在稀疏数据中易过拟合的问题,提出基于隔离核和Voronoi单元的核均值嵌入方法,引入元采样优化参数选择。文章分析了过拟合的表现与成因,并给出交叉验证、正则化和特征降维等应对策略。最后通过银行交易预测和癌症细胞进原创 2025-10-06 06:38:28 · 24 阅读 · 0 评论 -
26、利用图神经网络和文本行业数据进行交易预测
本文提出了一种结合图神经网络与文本行业数据的交易预测方法,通过改进的边权重增强注意力机制和图同构网络(GIN)提升模型性能。利用Doc2Vec编码公司行业描述作为节点特征,并引入非概率图自编码器进行链接预测,以预测银行客户之间的交易发生。实验基于真实银行交易数据,评估了不同模型在ROC-AUC等指标上的表现,结果表明所提方法在多种设置下均优于node2vec、GCN、GAT和GIN等基线模型。进一步分析验证了训练数据比例、节点度、边增强机制及节点特征唯一性对预测性能的影响,证明了该方法在金融场景中的有效性与原创 2025-10-05 09:04:07 · 29 阅读 · 0 评论 -
25、租房预测与交易预测:利用平面图与图神经网络的创新方法
本文探讨了两种基于深度学习的创新预测方法:一是利用公寓平面图和神经网络提升租金预测准确性,二是结合图神经网络、注意力机制与文本行业信息进行金融交易发生预测。通过实验分析,展示了模型在实际应用中的有效性,并讨论了可解释性、特征设计及未来优化方向,为房地产与金融领域的智能决策提供了新思路。原创 2025-10-04 09:35:10 · 27 阅读 · 0 评论 -
24、平面图对租金预测的增量信息价值
本研究探讨了平面图图像在租金预测中的增量信息价值,结合ResNet神经网络与多元线性回归模型,利用fastai和PyTorch框架对东京单一市场的公寓数据进行建模。通过对平面图进行归一化、旋转和随机裁剪等预处理,提取视觉特征并融入传统结构化变量中。实验结果表明,加入神经网络提取的平面图特征后,模型R²从0.915提升至0.945,平均绝对误差降低26%,显著提高了预测精度。尽管模型在高租金和低租金样本上存在偏差,且难以区分共享居住空间,但整体验证了计算机视觉方法在房地产预测中的有效性。未来可通过多模态数据融原创 2025-10-03 16:48:39 · 130 阅读 · 0 评论 -
23、体育与房产领域的智能研究进展
本文探讨了智能技术在体育与房产两个领域的研究进展。在体育方面,通过结合深度学习与机器学习,实现了对橄榄球高风险擒抱事件的客观检测,识别出头部、髋部和肘部等关键身体部位的重要性,同时指出了数据选择偏差和拍摄方向变化带来的挑战,并提出了未来实现实时自动检测的发展路径。在房地产领域,研究证实了平面图在租金预测中的增量信息价值,通过改进的残差神经网络模型显著提升了预测准确性(R²从0.914提升至0.923),并展示了其与传统线性模型融合的有效性。研究成果不仅为医疗支持系统和次精英赛事安全提供解决方案,也为房地产评原创 2025-10-02 13:40:28 · 26 阅读 · 0 评论 -
22、结合姿态估计和机器学习实现橄榄球高风险擒抱的客观检测
本文提出了一种结合深度学习姿态估计与机器学习的方法,用于自动检测橄榄球比赛中的高风险擒抱事件。通过使用职业联赛视频构建数据集,并提取擒抱者与持球者的身体关键点坐标作为输入特征,采用多种机器学习模型进行分类。经过数据增强优化后,Naïve Bayes模型在测试集上达到0.85的AUC,优于人工标注的规则方法和医生主观评估。研究结果表明该方法能客观、准确地识别高风险动作,具备应用于实际比赛安全监控的潜力。原创 2025-10-01 10:12:31 · 25 阅读 · 0 评论 -
21、利用BERT分析饮食体验文本中的心理状态和特质
本研究利用日语预训练BERT模型分析饮食体验文本中的心理状态(积极、中性、消极)和饮食情境(独自用餐、共同用餐),并通过三项实验探讨其在预测心理状态、分类孤独感与抑郁特质以及与人类评估对比方面的能力。实验结果表明,BERT在六标签心理状态与饮食情境分类中准确率达72%,优于对孤独感和抑郁的二元分类(53%-60%)。同时,与人类评估相比,BERT更少受到文本表层情绪影响,能基于上下文词汇注意力机制提取持久心理特质信号,展现出从单一文本中推断心理健康风险的潜力。研究建议结合时间序列文本以提升心理特质识别准确性原创 2025-09-30 11:40:23 · 26 阅读 · 0 评论 -
20、产品组合优化与饮食体验心理分析
本文探讨了两个跨领域的研究:一是通过均值-方差模型与协方差分析进行产品组合优化,以提升客户终身价值(LTV)和销售绩效;二是运用BERT模型对饮食体验文本进行心理分析,探索其与孤独感、抑郁等心理特质的关系。研究展示了如何利用数据驱动方法优化商业策略,并结合自然语言处理技术构建心理健康监测系统,为个性化营销与心理干预提供支持。原创 2025-09-29 15:48:07 · 26 阅读 · 0 评论 -
19、市场分析与客户终身价值优化的创新方法
本文提出两种创新方法以提升企业在复杂市场环境中的竞争力:一是基于BERT与Transformer+Time2Vec的极性指数转折点检测方法,结合Hotelling’s T²理论有效识别市场趋势变化,AUC达0.82;二是运用Markowitz均值-方差模型优化客户终身价值(LTV),通过最大化夏普比率筛选目标客户群体并进行产品组合再平衡。研究使用真实电商数据验证了方法的有效性,结果表明该方法可显著提升客户价值与营销精准度。未来可扩展至多变量分析框架,应对数据质量与计算成本挑战,助力企业实现可持续发展。原创 2025-09-28 09:23:37 · 39 阅读 · 0 评论 -
18、金融与法律领域的智能分析方法探索
本文探讨了金融与法律领域的智能分析方法。在法律问答系统方面,对比了基于规则的轻量模型与BERT等复杂模型,发现前者在效率和可解释性上具有优势;在金融领域,提出了一种结合BERT、Time2Vec与Transformer的极性指数构建方法,并利用Hotelling’s T²进行异常检测以识别市场转折点。实验表明,Transformer + Time2Vec在多项指标上表现最优。研究还总结了当前方法的应用前景、局限性及改进方向,为智能金融与法律分析提供了实践参考。原创 2025-09-27 10:05:10 · 22 阅读 · 0 评论 -
17、以简驭繁:构建法律问答系统
本文介绍了一种基于对称差集文本和最长公共子序列(LCS)的法律问答系统,用于解决律师考试中的‘是/否’问题。系统通过构建查询与民法典条文间的对称差集文本,利用SMS相似度匹配最相近的训练样本,进而输出答案。该方法在任务3(信息检索)和任务4(蕴含关系识别)中表现出简单有效的特点,适用于短查询与长文本场景,并可拓展至法律研究与咨询服务。尽管存在语义分析局限性和计算成本问题,但通过增加训练数据、引入深度学习和优化特征提取,未来有望进一步提升性能。原创 2025-09-26 11:34:29 · 19 阅读 · 0 评论 -
16、法律问答系统构建方法:从多模型集成到最长公共子序列
本文介绍了两种构建法律问答系统的方法:基于BERT与规则集成的方法和基于最长公共子序列的方法。前者通过Sentence-BERT进行数据选择、引入人名推理机制,并结合规则系统与BERT模型的集成提升准确率;后者通过提取析取并集文本并计算最长公共子序列相似度实现简单高效的答案预测。文章对比了两种方法在数据处理、模型架构、资源消耗等方面的差异,分析了实验结果,并探讨了未来在多方法融合、人名推理改进、数据优化及跨领域应用等方面的发展方向。原创 2025-09-25 15:33:08 · 19 阅读 · 0 评论 -
15、法律文本蕴含分类与数据增强技术解析
本文探讨了法律文本蕴含分类任务中的实验设置、数据增强技术及模型集成方法。通过在GNN模型中引入教科书知识,并比较不同句子转换器的表现,发现GNN AVG设置下性能最佳。系统采用基于规则与BERT模型的集成架构,在COLIEE 2022任务中取得67.89%的准确率,位居榜首。文中详细介绍了分割条文、句子重构、引用替换、负形式数据生成和AB替换等多种数据增强方法,分析其对模型性能的提升效果。实验表明,合理的数据增强和模型集成能显著提高法律文本处理的准确性与覆盖度,为法律领域的自动化提供了有效解决方案,但也面临原创 2025-09-24 16:56:52 · 26 阅读 · 0 评论 -
14、利用教科书知识进行法规检索和蕴含分类
本文探讨了如何利用教科书中的领域知识来增强法律人工智能系统在法规检索和法规蕴含分类任务中的表现。研究团队提出了一种基于规则的方法,从英文教科书、期刊和网络资源中提取日本民法典条文的引用及其上下文信息,并将其融入两阶段TF-IDF与句子嵌入相结合的检索模型中。此外,还探索了三种将外部知识编码到图神经网络(GNN)中的方法,以提升蕴含分类性能。实验结果表明,引入教科书知识并通过加权机制融合能小幅提升检索效果,尤其是在条文上下文更贴近实际查询场景时。尽管当前增益有限,但该方法为未来法律AI系统结合权威知识源提供了原创 2025-09-23 15:28:13 · 29 阅读 · 0 评论 -
13、HUKB在COLIEE 2022法规任务中的系统应用与性能分析
本文介绍了HUKB团队在COLIEE 2022法规任务(任务3和任务4)中的系统设计、实现与性能分析。系统结合基于关键词的IR方法与BERT-based的检索及蕴含模型,通过数据预处理、模型微调、数据增强和集成学习等技术提升性能。在任务3中,融合重构与原始条文数据库的IR方法取得了最佳F2值;在任务4中,提出的新型数据增强与有用句子选择策略使系统表现接近最优团队。额外实验探讨了合并得分中参数α的影响,结果表明适度平衡文档与决策得分有助于性能提升。文章还分析了影响系统性能的关键因素,并提出了未来优化方向,包括原创 2025-09-22 15:20:05 · 25 阅读 · 0 评论 -
12、法律案例检索与法规检索系统的研究与实践
本文研究了法律案例检索与法规检索系统的技术与实践,重点探讨了基于BM25和Sentence-BERT等模型的案例检索方法,以及结合司法决策处理的关键字和BERT-based IR系统在法规检索中的应用。实验结果表明,传统BM25模型在精确匹配上表现优异,而语义模型在理解层面具有潜力。通过系统集成提升了召回率与整体性能。未来可进一步探索领域专用模型如LegalBERT及图神经网络的应用,以提升法律信息处理的准确性与效率。原创 2025-09-21 16:44:15 · 32 阅读 · 0 评论 -
11、法律案例检索与蕴含任务的多模型应用
本文介绍了在判例法制度背景下,利用多模型方法解决法律案例检索(任务1)和案例蕴含(任务2)的挑战。基于COLIEE竞赛提供的加拿大联邦法院数据,研究对比了BM25、Sent2Vec和Sentence-BERT模型在法律文本处理中的表现。实验表明,BM25在精确匹配上优于神经模型,而结合语义理解能力的Sent2Vec和Sentence-BERT可辅助提升效果。通过构建综合应用策略——先用BM25初步筛选,再用语义模型精细匹配,最终实现高效准确的法律案例识别。文章还提出了未来在模型融合、领域适配和多模态方向的发原创 2025-09-20 09:39:25 · 32 阅读 · 0 评论 -
10、基于语义的相关判例法分类
本文提出了一种基于语义的判例法分类方法,结合sentence-transformers模型与Gradient Boosting分类器,用于法律案例检索。通过数据集分析、特征表示、距离计算与直方图建模,配合预处理和后处理策略,在COLIEE 2022 Task 1中取得了具有竞争力的结果。实验表明该方法在精确率与召回率之间实现了良好权衡,但错误分析揭示其在处理长文件时存在局限。未来将探索Longformer、模型融合与硬件优化以提升性能。原创 2025-09-19 12:47:08 · 23 阅读 · 0 评论 -
9、法律案例语义分类与检索:多任务解决方案
本文提出了一种针对法律案例语义分类与检索的多任务解决方案,涵盖COLIEE竞赛中的四项任务:案例法检索、案例法蕴含、制定法检索和制定法蕴含。通过结合LEGAL-BERT、BM25、注意力机制、TF-IDF及模型集成等方法,有效应对法律文本的复杂性、冗长性和噪声问题。实验结果表明,所采用的方法在各项任务中均取得良好性能,尤其在引入日期过滤、AMR语义表示和用例模型后显著提升了检索与分类效果。文章还展示了系统流程图,并对未来优化方向如模型改进、数据增强和实时处理提出了展望。原创 2025-09-18 10:35:29 · 24 阅读 · 0 评论 -
8、COLIEE 2022:法律信息提取与蕴含竞赛深度剖析
COLIEE 2022 是一项专注于法律领域信息提取与文本蕴含的国际竞赛,涵盖判例法与成文法两大任务类型,包含四个子任务:法律判例检索、判例蕴含、成文法检索及法律文本蕴含。本文深入剖析了各参赛团队在任务4中的方法与表现,重点介绍了JNLP团队采用LEGAL-BERT、BM25、注意力机制和数据增强等技术在判例与成文法任务中的应用。结果显示,KIS团队在任务4中以67.89%准确率夺冠,展现了集成方法的优势。文章还总结了竞赛成果,并提出未来应通过提升数据多样性、优化标注质量、引入现实场景问题以及探索强化学习与原创 2025-09-17 14:48:32 · 30 阅读 · 0 评论 -
7、COLIEE 2022竞赛任务解析与成果总结
本文总结了COLIEE 2022竞赛中三个任务的研究成果:任务1案例检索、任务2案例法律蕴含和任务3成文法检索。分析了各参赛团队采用的技术方法,包括基于Transformer的模型、传统IR技术(如BM25、TF-IDF)以及多模型融合策略,并对各任务的性能表现进行了评估。结果显示,UA团队在任务1中表现最佳,NM团队在任务2中领先,HUKB团队在任务3中取得最高F2分数。文章还进行了错误分析,指出了当前方法在处理长序列、多相关条文及复杂查询时的局限性,并提出了未来研究方向,包括提升模型对复杂情况的处理能力原创 2025-09-16 16:19:20 · 20 阅读 · 0 评论 -
6、日本与外国法律相似条款映射及法律信息提取与蕴含竞赛研究
本文探讨了日本与外国法律相似条款的映射实验及COLIEE 2022法律信息提取与蕴含竞赛的研究成果。通过对比Jaccard、BM25和BERT等方法在不同语言版本法律文本中的表现,分析了各类模型在条款匹配、信息检索与语义蕴含任务中的优劣。研究显示,传统方法如BM25在表面特征匹配上表现稳定,而深度学习模型在语义理解方面更具潜力,但仍受限于输入长度与训练数据规模。未来方向包括采用DocBERT、SentenceBERT处理长文本,改进文档比较单位,并利用XLM-RoBERTa等多语言模型提升跨语言法律匹配效果原创 2025-09-15 16:50:39 · 19 阅读 · 0 评论 -
5、日本与外国法律相似条款映射研究
本文研究了日本与外国法律中相似条款的自动映射方法,提出基于BERT模型的文档向量化与余弦相似度计算框架。通过在日语和英语环境下对《电力事业法》《燃气事业法》及德国民法典等法律文本进行实验,验证了该方法在语义层面优于传统词袋模型(如Jaccard系数和BM25)。研究还探讨了翻译质量、领域适配性等问题,并展望了定制化法律语言模型、多语言融合模型等未来方向,旨在提升跨国法律比较研究的效率与准确性。原创 2025-09-14 10:40:02 · 17 阅读 · 0 评论 -
4、相反优先可废止理论的复杂性与通用性
本文探讨了可废止逻辑程序中的歧义问题及其处理策略,重点分析了歧义阻塞、歧义传播和相反优先级三种方法的原理、差异与适用场景。相反优先级策略通过为所有头部相反的规则对建立优先级来消除模糊性,确保法律推理的一致性与连贯性,但其求解过程归结为NP完全问题,具有较高复杂度。文章还证明了相反优先级理论与分层逻辑程序之间的相互转换性,并通过实际案例展示了不同策略对决策结果的影响,最后展望了算法优化、多策略融合及跨领域应用等未来研究方向。原创 2025-09-13 11:49:17 · 15 阅读 · 0 评论 -
3、机器翻译模型与可废止逻辑程序的研究进展
本文综述了机器翻译模型与可废止逻辑程序在自然语言处理和法律推理中的研究进展。通过评估不同Transformer模型在BLEU、RIBES等指标上的表现,分析了翻译输出的稳定性与候选句子差异;同时探讨了可废止逻辑程序在法律规则表示中的应用,特别是相反优先级策略对解决法律歧义的作用及其计算复杂性。文章进一步揭示了两类技术在处理歧义问题上的共通性,并展望了二者在智能法律助手等跨领域应用中的融合潜力。原创 2025-09-12 13:42:09 · 12 阅读 · 0 评论 -
2、部分修订句子翻译的差异感知Transformer研究
本文研究了部分修订句子的差异翻译任务,提出了一种可复制翻译Transformer架构,旨在解决法律条文等场景中句子局部修改后的精准翻译问题。文章分析了句子修订类型,明确了翻译任务的聚焦性、流畅性和充分性三大要求,回顾了相关翻译方法与评估标准,并构建了支持表达复用的新型Transformer模型。实验结果表明,该模型在多个指标上显著优于传统方法,尤其在数据有限时表现出更强的数据利用效率。此外,讨论了数据规模、训练迭代次数等因素对性能的影响,验证了模型的有效性与潜力。原创 2025-09-11 14:39:57 · 15 阅读 · 0 评论 -
1、JSAI 2022与JURISIN 2022:人工智能与法律信息学的盛会
本文介绍了2022年在日本京都举办的JSAI 2022与JURISIN 2022会议,重点探讨了人工智能与法律信息学领域的最新研究成果。其中,JURISIN 2022聚焦法律信息提取、法律推理与AI在法律中的应用,并介绍了针对部分修订法定句子翻译提出的‘可复制翻译Transformer’新架构。该方法通过结合注意力机制与复制机制,有效提升翻译焦点与准确性,相比传统SMT与NMT方法具有明显优势。文章还分析了其应用前景及未来研究方向,包括语言对扩展、模型优化与多技术融合,展现了AI在法律文本处理中的巨大潜力。原创 2025-09-10 09:32:42 · 36 阅读 · 0 评论
分享