- 博客(331)
- 收藏
- 关注

原创 开箱即用!合合信息的智能文档处理“百宝箱”
在长沙召开,来自合合信息的常扬老师在“模型与工具”论坛上分享了合合信息的智能文档处理“百宝箱”,系统介绍了TextIn ParseX、acge-embedding、markdown_tester三种工具。比如说我们要在解析文档进行结果审核校对、效果测评等场景,需要可视化展示文档解析后的结果的时候就可以进行结果的定制。不仅如此,下方还有难度更高的跨栏表格,可以看到也是很准确地识别到了,同时还还原成了表格的形制,我们可以直接复制到word等文本编辑器里,替换一下表格样式就可以直接用了,非常方便。
2024-10-30 10:11:08
14990
39

原创 【python实战】利用代理ip爬取Alibaba海外版数据
对于希望获取跨境市场信息的企业来说,这些限制带来了巨大的挑战,尤其是在需要获取实时且准确的数据时,传统的爬虫技术往往面临失效的风险。然后,进入一个循环,在每一页中构造相应的URL,调用get_ip()获取代理IP,使用get_page()获取该页的HTML,接着调用parse_page()提取供应商信息,最后将这些信息通过save()函数保存到文件中。爬取数据的过程分为三个部分:首先我们要访问上面的API获取代理IP,之后使用这个IP访问并获取商品页面,最后我们将页面中的信息提取出来保存在本地。
2024-10-18 11:47:45
16991
37

原创 Blackbox AI:你的智能编程伙伴
实际生产中,我们的代码都需要写标准而详细的注释,或是ReadMe文件,这往往意味着更大量的必要重复劳动。我们可以看到程序虽然不能直接识别出内存泄露问题,但从几个角度分析了这段代码的高风险位置,间接提示了代码中的bug。可以看到不仅生成了代码,同时附带了简单的代码解析。这里我们通过上传附件的方式,将文件中的Python代码转换为Java代码,可以看到程序自动识别了文件中代码的类型并完成了转换。接下来我们尝试寻找代码中的bug。这里我们通过图片的形式上传代码,可以看到程序准确识别到了代码部分,并尝试进行优化。
2024-07-18 20:31:47
34917
51

原创 【Python】利用代理IP爬取当当网数据做数据分析
从简单的在线交易到复杂的用户交互,电商平台积累了海量的用户数据。无论是技术实现的便捷性,还是成本控制的灵活性,或是数据质量的高效性,以及整体操作的安全性,亮数据代理都是企业和个人在数据采集领域的理想选择。亮数据的IP代理网络覆盖全球195个国家,拥有超过7200万个IP地址,确保用户可以进行任意城市定位,并且每日更新上百万IP,保证了数据采集的广泛性和实时性。对于企业老板,安全合规是他们最关心的问题之一, 亮数据代理严格遵守数据采集的法律法规,确保了企业在使用过程中的合规性,降低了潜在的法律风险。
2024-07-01 08:40:48
22374
56

原创 零代码创建属于自己的远程教育和协作助手
我们在学习过程中,遇到困难无法及时解决,对我们学习产生了种种影响,面对这样的问题,我发现了一款产品:百度智能体,结合百度智能体,我创作出来一款小助手:远程教育和协作助手,用于帮助和解决我们日常学习之中遇到的问题远程教育和协作小助手体验:远程教育和协作小助手远程教育和协作小助手,提供实时翻译、内容同步及互动讨论功能,旨在加强学生间的协作与交流。
2024-05-29 16:31:33
898
6

原创 外贸电商数据分析实战指南
它定义了一个名为 SBR_WS_CDP 的变量,用于存储浏览器的 WebSocket 连接地址,并定义了一个名为 run 的异步函数,该函数接受一个名为 pw 的参数,表示 Playwright 库的实例。接下来就可以进入集成示例页面,可以看到,亮数据浏览器为我们提供了Node.js、Python、C#语言,提供了Puppeter、Playwright、Selenium等多种库,这里选择使用Python + Playwright的方法。首先进入控制台页面,点击基础设施,然后点击添加,选择亮数据浏览器。
2024-05-27 09:23:22
8052
4

原创 ownips数据获取工具全面测评
一般静态IP代理常用作远程办公、监控、控制家庭设备及网络服务。例如允许员工通过远程桌面连接到公司内部网络、在家里监控宠物或婴儿、智能家居设备、文件存储访问控制,以及网络服务,如网络存储、媒体服务器等,静态住宅IP可以确保外部用户能够稳定地访问这些服务。总之,静态住宅IP提供了稳定、可靠的网络连接,适用于各类远程访问与操作场景。静态住宅IP是固定不变的IP地址,较动态IP更稳定,适用于需稳定连接的服务如远程桌面。对于远程访问家庭网络、设备,静态IP更便利,且易设置安全策略和防火墙规则,防御攻击。
2024-04-19 10:26:30
8901
23

原创 【python】python turtle绘制坤坤打球
通过 Python 的 Turtle 模块,我们可以轻松地在屏幕上绘制各种形状和动画效果。本次项目旨在利用 Turtle 模块创建一个坤坤打篮球的动画效果通过使用Python中的Turtle库,我们可以轻松绘制出精美的图案,无论是简单的几何图形还是复杂的卡通人物。Turtle库不仅适合初学者学习绘图,也可以用于创作出独特的艺术作品。希望本文对您了解如何使用Turtle库绘制卡通人物有所帮助!
2024-03-22 11:36:03
3505
26

原创 百度智能云千帆大模型平台发布会定档3月21日,新模型已悄然上线
据内部人士透露,ERNIE Speed是一款百度自研的轻量级大语言模型,能够更快速地响应用户需求,同时支持少量数据微调,大幅缩短训练时间,特定场景下的效果可媲美ERNIE Bot4.0模型。记者了解到,已有超过150家企业采用了ERNIE Speed模型,企业客户反馈积极。记者在百度智能云官网上发现,此前千帆大模型平台上已悄然上线了系列新模型,其中一款名为ERNIE Speed的通用大语言模型,因其在自然语言处理任务中表现出的高效性能和快速响应能力,已引发业界广泛关注。
2024-03-07 15:49:45
1772
19

原创 ONLYOFFICE开发者版:自主掌控文档处理的强大工具
而 ONLYOFFICE 以其开源、经济实惠、自主部署、可定制、易集成、跨平台和安全的特点,为开发者提供了一个理想的办公解决方案。通过简单的部署流程和灵活的集成方式,开发者可以快速实现自己的文档处理功能,满足各种应用场景的需求。ONLYOFFICE开发者版是一套强大的文档处理套件,提供了丰富的功能,满足用户在文本编辑、电子表格编辑、数字表单生成、演示文稿编辑、PDF编辑、电子书创建等多个领域的需求。ONLYOFFICE支持灵活的集成,开发者可以轻松将其融入各种平台,实现个性化的文档处理功能。
2024-01-18 14:35:20
10463
8

原创 800万纯AI战士年末大集结,硬核干货与音乐美食12月28日准时开炫
历经五载十届,WAVE SUMMIT见证了AI科技持续创新、不断突破、开源开放,与中国最大的AI开发者社区“星河社区”共同成长,为开发者展示最新的技术成果、提供全方位的能力支撑,助力中国AI创造无限可能。大会由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型联合承办,既有大模型前沿技术分享与产业落地的干货,也有丰富的AI应用及插件体验,还可以参加Workshop现场打造属于自己的AI应用。五年来,开发者数量持续攀升,从194万、265万、320万、447万,535万,到750万、800万……
2023-12-12 14:41:40
7403
6

原创 【python】爬取豆瓣电影排行榜TOP250存储到CSV文件中【附源码】
设置了请求头部信息,以模拟浏览器的请求,函数返回响应数据的JSON格式内容。# 反爬 填写headers请求头Win64;# 防止出现乱码使用csv库的DictWriter类,创建一个CSV写入对象,并指定列名为"title"、"star"、"quote"和"url"。然后,逐行写入电影信息到CSV文件中。# 定义一个空的列表# 创建一个字典 像列表中存储数据[{电影一},{电影二}......]
2023-11-01 22:40:55
19355
26

原创 百度Comate代码助手SaaS版本:智慧编程,引领新潮
这使得它成为了多样性的应用,同时支持主流IDE,如VS Code、IntelliJ IDEA、GoLand、PyCharm、WebStorm、CLion、PhpStorm、Android Studio、Xcode等,确保了无缝集成,无需额外的配置。百度Comate代码助手的SaaS版本是一项引人瞩目的创新,它以更低的成本、更高的效率和更丰富的功能,引领了智能编码的未来。它以更低的成本、更高的效率和更丰富的功能,成为了编码的得力助手,释放创造力,助力创新。根据函数、⽅法的内容,⽣成相关的单元测试代码。
2023-10-24 15:49:43
8443
18
C语言通讯录源码,免费自取
2023-01-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人