Kafka简单案例

Kafka简单案例

0.8.2.2

生产者

package com.gklearlove.controller.Kafka;

import java.util.ArrayList;
import java.util.List;
import java.util.Properties;
import kafka.javaapi.producer.Producer;
import kafka.producer.KeyedMessage;
import kafka.producer.ProducerConfig;

public class MyProducer {
    private static final String TOPIC = "testspark"; //kafka创建的topic
    private static final String CONTENT = "This is a single message"; //要发送的内容
        private static final String BROKER_LIST = "ip地址:9092"; //broker的地址和端口
    private static final String SERIALIZER_CLASS = "kafka.serializer.StringEncoder"; // 序列化类

    public static void main(String[] args) {
        Properties props = new Properties();
        props.put("serializer.class", SERIALIZER_CLASS);
        props.put("metadata.broker.list", BROKER_LIST);


        ProducerConfig config = new ProducerConfig(props);
        Producer<String, String> producer = new Producer<String, String>(config);

        //发送单条
        KeyedMessage<String, String> message =
                new KeyedMessage<String, String>(TOPIC, CONTENT);
        producer.send(message);

        //批量发送
        List<KeyedMessage<String,String>> messages =
                new ArrayList<KeyedMessage<String, String>>();
        for (int i = 0; i < 5; i++) {
            messages.add(new KeyedMessage<String, String>
                    (TOPIC, "Multiple message at a time. " + i));
        }
        producer.send(messages);

    }
}

消费者

package com.gklearlove.controller.Kafka;

import kafka.consumer.ConsumerConfig;
import kafka.consumer.ConsumerIterator;
import kafka.consumer.KafkaStream;
import kafka.javaapi.consumer.ConsumerConnector;

import java.io.UnsupportedEncodingException;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Properties;

public class NativeConsumer {

    private static final String TOPIC = "testspark";


    public static void main(String[] args) throws UnsupportedEncodingException {
        //创建配置,获取消费者连接器
        Properties props = new Properties();
        props.put("zookeeper.connect", "localhost:2181");
        props.put("auto.offset.reset","smallest");
        props.put("group.id", "test-group");
        props.put("enable.auto.commit", "true"); //自动提交offset
        props.put("auto.commit.interval.ms", "1000"); //自动提交offset的时间间隔
        props.put("zookeeper.session.timeout.ms", "400");
        props.put("zookeeper.sync.time.ms", "200");

        ConsumerConfig consumerConfig =  new kafka.consumer.ConsumerConfig(props);
        ConsumerConnector consumerConnector = kafka.consumer.Consumer.createJavaConsumerConnector(consumerConfig);
        //配置要消费的主题
        Map<String, Integer> topicCountMap = new HashMap<String, Integer>();
        int localConsumerCount = 1;
        topicCountMap.put(TOPIC, localConsumerCount);
        Map<String, List<KafkaStream<byte[], byte[]>>> consumerMap = consumerConnector.createMessageStreams(topicCountMap);
        //循环消费主题
        List<KafkaStream<byte[], byte[]>> streams = consumerMap.get(TOPIC);
        streams.stream().forEach(stream -> {
            ConsumerIterator<byte[], byte[]> it = stream.iterator();
            while (it.hasNext()) {
                System.out.println(new String(it.next().message()));
            }
        });
    }
}

0.8的kafka,生产者使用的是broker.list端口9092,消费者使用的是zookeeper端口2181,auto.offset.reset可选的是smallest和largest

### RAG 实现概述 在 Python实现检索增强生成 (RAG, Retrieval-Augmented Generation) 需要几个关键模块:数据预处理、索引创建、检索器配置以及最终的生成模型集成。这些组件共同作用以提升自然语言理解和生成的效果[^1]。 具体来说,在构建 RAG 系统时,通常会先建立一个高效的向量数据库来存储文档片段及其对应的嵌入表示。这一步骤对于后续快速而精准地找到最相关的上下文至关重要。一旦完成此操作,则可以通过调用 `retriever = vectorstore.as_retriever()` 来初始化检索器实例[^3]。 接着便是将上述准备好的检索机制与选定的语言模型相结合。这里可以采用 Hugging Face 的 Transformers 库作为工具包来进行编码工作;它不仅提供了多种预训练模型供选择,而且还支持自定义微调流程以便更好地适应特定应用场景的需求[^2]。 下面给出一段简单的代码示例用于说明如何搭建这样一个基本框架: ```python from langchain.embeddings import SentenceTransformerEmbeddings from langchain.vectorstores import Chroma from transformers import pipeline # 加载句子转换器并设置参数 embedding_function = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2") # 创建Chroma矢量库并将文本转化为向量存入其中 vector_db = Chroma.from_texts(texts=documents, embedding=embedding_function) # 定义检索函数 def retrieve_context(query): retriever = vector_db.as_retriever() docs = retriever.get_relevant_documents(query) context = "\n".join([doc.page_content for doc in docs]) return context # 初始化问答管道 qa_pipeline = pipeline("question-answering", model="distilbert-base-cased-distilled-squad") # 使用检索到的信息辅助回答问题 context = retrieve_context(user_query) response = qa_pipeline(question=user_query, context=context)['answer'] print(response) ``` 通过这种方式,能够有效地利用外部知识源扩充传统序列到序列架构的能力边界,从而获得更高质量的回答输出。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值