
数据集
文章平均质量分 93
无脑敲代码,bug漫天飞
这个作者很懒,什么都没留下…
展开
-
爬虫 -- 使用selenium和scrapy爬取BBC、NYTimes、Snopes等网站的内容
通过数据管道,你可以对爬取到的数据进行一系列的处理,例如清洗数据、验证数据、将数据保存到数据库等。是 Scrapy 项目中的一个文件,用于定义数据结构,也称为 "item"。中间件是在 Scrapy 中处理请求和响应的钩子(hooks),它们可以用于修改或处理 Scrapy 发出的每一个请求和收到的每一个响应。是 Scrapy 项目中的一个配置文件,用于定义和配置项目的各种设置和参数。文件通常是一个 Scrapy 爬虫脚本,这里的示例用于定义从 New York Times 网站上爬取数据的爬虫。原创 2024-06-04 15:55:37 · 2862 阅读 · 3 评论 -
论文阅读- GPT-generated Text Detection: Benchmark Dataset and Tensor-based Detection Method
在本文中,作者介绍了 GPT Reddit 数据集(GRiD),这是一个由Generative Pretrained Transformer ((GPT)生成的新型文本检测数据集,旨在评估检测模型在识别ChatGPT 生成的回复方面的性能。该数据集由基于 Reddit 的各种上下文-提示对组成,其中既有人工生成的回复,也有ChatGPT 生成的回复。作者对数据集的特点进行了分析,包括语言多样性、上下文复杂性和回复质量。为了展示该数据集的实用性,在该数据集上对几种检测方法进行了基准测试,证明了。原创 2024-05-16 21:58:23 · 1211 阅读 · 3 评论 -
Twibot-22数据集介绍
Twibot-22数据集介绍原创 2022-10-28 19:55:56 · 6963 阅读 · 37 评论 -
论文阅读 - Hoaxes and Hidden agendas:A Twitter Conspiracy Theory Dataset - CCF A(WWW)
论文阅读 - Hoaxes and Hidden agendas:A Twitter Conspiracy Theory Dataset - CCF A(WWW)原创 2022-10-17 11:21:31 · 369 阅读 · 1 评论 -
论文阅读 - The paradigm-shift of social spambots - 数据集 cresci-2017
论文阅读 - The paradigm-shift of social spambots - 数据集 cresci-2017原创 2022-09-23 09:29:22 · 953 阅读 · 1 评论 -
论文阅读 - Fame for sale: efficient detection of fake Twitter followers - Cresci - 2015数据集介绍
论文阅读 - Fame for sale: efficient detection of fake Twitter followers - Cresci - 2015数据集介绍原创 2022-09-20 17:36:40 · 2694 阅读 · 0 评论 -
关于推特社交机器人数据集(来自上一篇论文)
关于推特社交机器人数据集(来自上一篇论文)原创 2022-08-03 09:53:04 · 1538 阅读 · 0 评论 -
社交机器人数据集TwiBot-20参数解释
社交机器人数据集TwiBot-20参数解释原创 2022-07-23 10:47:06 · 1833 阅读 · 3 评论 -
Social Bots数据集总结
Social Bots数据集总结原创 2022-07-07 10:29:33 · 2890 阅读 · 2 评论