万字详解AI实践，零手写编码用AI完成开发 + 数据清洗 + 数据处理的每日新闻推荐，带你快速成为AI大神

原创

已于 2024-10-12 11:32:26 修改 · 2.7k 阅读

36 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #数据挖掘 #prompt #前端 #后端

于 2024-10-08 17:40:40 首次发布

用AI+dify完成前后端开发+数据处理和数据清洗。

引言
数据获取和数据处理
dify构建workflow进行数据清洗
前端页面构建和前后端交互
总结

引言

AI时代对开发人员的加强是非常明显的，一个开发人员可以依靠AI横跨数个自己不熟悉的领域包括前后端、算法等。让我们来做个实践，全程使用AI写代码+dify构建工作流快速完成一个获取每日热点新闻的前后端开发以及数据处理、数据清洗的任务，全程不需要我们自己动手写代码，仅跟AI聊天实现。

我们来理清一下步骤：
1、点击每日新闻按钮
2、自动获取每日新闻信息
3、用LLM获取到标题、概要、作者、新闻链接
4、用dify + LLM 清洗和处理数据，获取新闻概要内容和新闻标签
5、给前端返回作者、标题、新闻链接、新闻概要内容和新闻标签
6、展示在页面上，并且点击可以跳到对应新闻页面

最后效果：
在这里插入图片描述

数据获取和数据处理

从网上搜索一下头条的每日推荐新闻的接口，我们的每日新闻来源就从这里获取。实际处理可以换成自己需要的接口并进行处理，让模型编码。
在这里插入图片描述
其实就是很简单地发送一个请求，对应代码：

fetch('http://is.snssdk.com/api/news/feed/v51/')
  .then(response => {
    if (!response.ok) {
      throw new Error('Network response was not ok');
    }
    return response.json();
  })
  .then(data => {
    console.log('Success:', data);
  })
  .catch(error => {
    console.error('Error:', error);
  });

粘贴代码观察一下结果
在这里插入图片描述
观察获取到的数据很明显我们只需要url source title abstract这四个字段，分别是对应的链接地址，作者，标题，摘要，做一下数据处理，让模型编码。

模型帮助我们在前面代码的基础上仅提取了我们需要的部分字段，获取的代码：

fetch('http://is.snssdk.com/api/news/feed/v51/')
  .then(response => {
    if (!response.ok) {
      throw new Error('Network response was not ok');
    }
    return response.json();
  })
  .then(data => {
    // 处理数据
    const articles = data.data.map(item => {
      const content = JSON.parse(item.content);
      return {
        url: content.url,
        source: content.source,
        title: content.title,
        abstract: content.abstract
      };
    });

    // 输出提取的内容
    console.log('Extracted Data:', articles);
  })
  .catch(error => {
    console.error('Error:', error);
  });

处理完之后就是比较简单的我们想要的数据了。
在这里插入图片描述
现在的数据只有链接标题还有一些没意义的摘要（实际上只是截取的文章前面部分），我们需要阅读前，模型就已经帮我们大致总结了一下内容以及对新闻进行了对应的打标签，这个就需要我们通过模型去完成了，我们下面用dify的工作流去完成这件事。

dify构建workflow进行数据清洗

接下来我们来做数据清洗，我希望对标题进行对应的改写，且我需要模型帮我总结内容和对内容打标签。通过dify搭建工作流（注意这里可以使用别的工具，并不一定依赖dify）。
在这里插入图片描述
使用的Prompt如下，注意我们Prompt里面需要精确提到背景（激活参数）、任务（明确目标）、输出需求（明确要求）、例子（明确要求）：

你是一名专业的记者，我从新闻网站API请求到了数据，你需要帮我对这条数据进行内容的总结和标签分类。内容总结应该在200字以内输出到模版变量<S>中，标签分类给出三个，每个标签在五个字以内，标签之间用','隔开，输出到模版变量<T>中，你仅需要输出模版内容。

# 例子
输入：

  {
    source: '国际新说',
    title: '新能源未来在何处？',
    abstract: '最近几年新能源的发展非常迅速，那么未来新能源会往哪一方面发展呢？让我们一起来探讨一下'
  }

输出：

【国际新说】新能源未来在何处？(科技、新能源、发展)

近年来，新能源技术快速发展，引发了对未来发展方向的广泛讨论。文章探讨了新能源可能的发展趋势。


# 模版
【source】title (<T>)
<S>

看看结果。
在这里插入图片描述

可以看到，输入我们刚才整理好的数据已经可以完成标题改写 + 打标签 + 内容总结了

现在我们可以使用我们刚才提取的数据，结合dify的这个工作流去完成总结文章内容 + 给文章打标签的功能。接下来只需要直接调用dify生成对应的接口，让模型帮我们接口，注意跟模型描述详细的接口需求。

这个是DIFY的接口文档
在这里插入图片描述
让模型编码

后端代码，主要就是调用了dify生成的接口，然后处理了一下输出：

const apiKey = 'YOUR_KEY';
const apiUrl = 'https://api.dify.ai/v1/workflows/run';
const batchSize = 2;

fetch('http://is.snssdk.com/api/news/feed/v51/')
  .then(response => {
    if (!response.ok) {
      throw new Error('Network response was not ok');
    }
    return response.json();
  })
  .then(data => {
    // 处理数据
    const articles = data.data.map(item => {
      const content = JSON.parse(item.content);
      return {
        url: content.url,
        source: content.source,
        title: content.title,
        abstract: content.abstract
      };
    });

    // 发送请求并收集结果
    const results = [];
    const sendBatchRequests = (batch) => {
      const requests = batch.map(article => {
        const requestBody = {
          inputs: {
            message: JSON.stringify(article)
          },
          response_mode: 'blockin