前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >.NET SK 如何给AI大模型添加搜索引擎功能?

.NET SK 如何给AI大模型添加搜索引擎功能?

作者头像
用户10786849
发布2024-06-07 16:53:54
800
发布2024-06-07 16:53:54
举报
文章被收录于专栏:token的技术分享token的技术分享

普通的AI大模型的数据都是在一开始训练的时候决定的,所以大模型的数据来源都可能存在时效性。

下面我们会利用SK插件来给AI大模型添加联网功能。

准备工作

创建一个名称为5_SK_Plugin_Web的控制台项目 复制以下代码到5_SK_Plugin_Web项目文件中

代码语言:javascript
复制
<Project Sdk="Microsoft.NET.Sdk">

    <PropertyGroup>
        <OutputType>Exe</OutputType>
        <TargetFramework>net8.0</TargetFramework>
        <ImplicitUsings>enable</ImplicitUsings>
        <Nullable>enable</Nullable>
    </PropertyGroup>

    <ItemGroup>
        <PackageReference Include="Microsoft.Extensions.Http" Version="8.0.0" />
        <PackageReference Include="Microsoft.SemanticKernel" Version="1.13.0" />
    </ItemGroup>

</Project>

创建OpenAIHttpClientHandler.cs

代码语言:javascript
复制

namespace ConsoleApp1;


public class OpenAIHttpClientHandler : HttpClientHandler
{
    private readonly string _uri;

    public OpenAIHttpClientHandler(string uri) => _uri = uri.TrimEnd('/');

    protected override async Task<HttpResponseMessage> SendAsync(HttpRequestMessage request,
        CancellationToken cancellationToken)
    {
        UriBuilder uriBuilder;
        if (request.RequestUri?.LocalPath == "/v1/chat/completions")
        {
            uriBuilder = new UriBuilder(_uri + "/v1/chat/completions");
            request.RequestUri = uriBuilder.Uri;
        }
        else if (request.RequestUri?.LocalPath == "/v1/embeddings")
        {
            uriBuilder = new UriBuilder(_uri + "/v1/embeddings");
            request.RequestUri = uriBuilder.Uri;
        }

        return await base.SendAsync(request, cancellationToken);
    }
}

创建联网插件

HttpClientFunction.cs

代码语言:javascript
复制

public class HttpClientFunction(IHttpClientFactory httpClientFactory, IChatCompletionService completionService)
{
    private const string BingTemplate = "https://cn.bing.com/search?q={0}";

    private const string SystemTemplate =
        @"
## 角色:

你是一款专业的搜索引擎助手。你的主要任务是从Html根据标签生成md的内容,并专注于准确地总结段落的大意,而不包含任何其他多余的信息或解释。

## 能力:

- 解析html中标签生成对应的md。
- 将提取的信息准确地总结为一段简洁的文本。
- 不属于用户提问的数据则不用整理。

## 指南:

- 这是一个完整的html标签,您需要根据标签生成对应的md格式。
- 只包含关键信息,尽量减少非主要信息的出现。
- 完成总结后,立即向用户提供,不需要询问用户是否满意或是否需要进一步的修改和优化。
";

    /// <summary>
    /// 搜索用户提出的问题
    /// </summary>
    [KernelFunction, Description("搜索用户提出的问题")]
    public async Task<string> GetAsync(string value)
    {
        var http = httpClientFactory.CreateClient(nameof(HttpClientFunction));

        var html = await http.GetStringAsync(string.Format(BingTemplate, value)).ConfigureAwait(false);

        var scriptRegex = new Regex(@"<script[^>]*>[\s\S]*?</script>");
        var styleRegex = new Regex(@"<style[^>]*>[\s\S]*?</style>");
        var commentRegex = new Regex(@"<!--[\s\S]*?-->");
        var headRegex = new Regex(@"<head[^>]*>[\s\S]*?</head>");
        var tagAttributesRegex = new Regex(@"<(\w+)(?:\s+[^>]*)?>");
        var emptyTagsRegex = new Regex(@"<(\w+)(?:\s+[^>]*)?>\s*</\1>");

        html = scriptRegex.Replace(html, "");
        html = styleRegex.Replace(html, "");
        html = commentRegex.Replace(html, "");
        html = headRegex.Replace(html, "");
        html = tagAttributesRegex.Replace(html, "<$1>");
        html = emptyTagsRegex.Replace(html, "");

        var result = await completionService.GetChatMessageContentsAsync(new ChatHistory(SystemTemplate)
        {
            new(AuthorRole.User, html),
            new(AuthorRole.User, value)
        }, new OpenAIPromptExecutionSettings()
        {
            ModelId = "gpt-3.5-turbo-0125"
        });

        Console.WriteLine("搜索结果:" + result.FirstOrDefault()?.Content);

        return result.FirstOrDefault()?.Content ?? "抱歉,未找到相关信息。";
    }
}

我们使用HttpClientFunction类来实现一个搜索引擎插件,该插件可以根据用户提出的问题搜索相关信息。 利用了https://cn.bing.com/search?q={0}接口去获取我们需要的信息,然后返回Html,使用正则表达式将html中大部分不需要的内容去掉。

然后我们在将获取的Html使用以下提示词进行内容精简。

代码语言:javascript
复制
## 角色:

你是一款专业的搜索引擎助手。你的主要任务是从Html根据标签生成md的内容,并专注于准确地总结段落的大意,而不包含任何其他多余的信息或解释。

## 能力:

- 解析html中标签生成对应的md。
- 将提取的信息准确地总结为一段简洁的文本。
- 不属于用户提问的数据则不用整理。

## 指南:

- 这是一个完整的html标签,您需要根据标签生成对应的md格式。
- 只包含关键信息,尽量减少非主要信息的出现。
- 完成总结后,立即向用户提供,不需要询问用户是否满意或是否需要进一步的修改和优化。

然后我们实现我们的核心逻辑。

打开Program.cs文件

代码语言:javascript
复制

var kernelBuilder = Kernel.CreateBuilder()
    .AddOpenAIChatCompletion(
        modelId: "gpt-3.5-turbo-0125",
        apiKey: "这里填写在https://api.token-ai.cn/创建的令牌",
        httpClient: new HttpClient(new OpenAIHttpClientHandler("https://api.token-ai.cn/")));

kernelBuilder.Services.AddHttpClient();

var kernel = kernelBuilder.Build();

kernel.Plugins.AddFromType<HttpClientFunction>(serviceProvider: kernel.Services);

var chat = kernel.GetRequiredService<IChatCompletionService>();

var openAIPromptExecutionSettings = new OpenAIPromptExecutionSettings()
{
    ToolCallBehavior = ToolCallBehavior.AutoInvokeKernelFunctions
};


while (true)
{
    Console.WriteLine("请输入您的问题:");
    var str = Console.ReadLine();

    if (str == "exit")
    {
        break;
    }

    var chatHistory = new ChatHistory();
    chatHistory.AddUserMessage(str);
    await foreach (var item in
                   chat.GetStreamingChatMessageContentsAsync(chatHistory, openAIPromptExecutionSettings, kernel))
    {
        Console.Write(item?.Content);
    }

    Console.WriteLine();
}

解析上面的代码,

代码语言:javascript
复制

var kernelBuilder = Kernel.CreateBuilder()
    .AddOpenAIChatCompletion(
        modelId: "gpt-3.5-turbo-0125",
        apiKey: "这里填写在https://api.token-ai.cn/创建的令牌",
        httpClient: new HttpClient(new OpenAIHttpClientHandler("https://api.token-ai.cn/")));

kernelBuilder.Services.AddHttpClient();

var kernel = kernelBuilder.Build();

在这里我们创建了一个kernelBuilder,然后我们添加了一个OpenAIChatCompletion插件,这个插件是用来调用OpenAI的API的,我们需要填写我们在https://api.token-ai.cn/创建的令牌, 然后我们在kernelBuilder中的Services注册了我们的HttpClient服务,以便插件的依赖注入的IHttpClientFactory能够正常工作。

代码语言:javascript
复制

kernel.Plugins.AddFromType<HttpClientFunction>(serviceProvider: kernel.Services);

这一行代码是将我们的HttpClientFunction插件添加到kernel中,这样我们就可以在kernel中使用我们的插件了。

代码语言:javascript
复制

var chat = kernel.GetRequiredService<IChatCompletionService>();

var openAIPromptExecutionSettings = new OpenAIPromptExecutionSettings()
{
    ToolCallBehavior = ToolCallBehavior.AutoInvokeKernelFunctions
};

在这里我们通过kernel中的GetRequiredService方法获取了IChatCompletionService服务,这个服务是用来调用OpenAI的API的。 然后我们创建了一个OpenAIPromptExecutionSettings对象,这个对象是用来设置我们的插件的行为的,这里我们设置了ToolCallBehaviorAutoInvokeKernelFunctions,这样我们的插件就会自动调用kernel中的函数了。

代码语言:javascript
复制


while (true)
{
    Console.WriteLine("请输入您的问题:");
    var str = Console.ReadLine();

    if (str == "exit")
    {
        break;
    }

    var chatHistory = new ChatHistory();
    chatHistory.AddUserMessage(str);
    await foreach (var item in
                   chat.GetStreamingChatMessageContentsAsync(chatHistory, openAIPromptExecutionSettings, kernel))
    {
        Console.Write(item?.Content);
    }

    Console.WriteLine();
}

我们在这里创建了一个循环,然后我们在循环中获取用户输入的问题,然后我们创建了一个ChatHistory对象,这个对象是用来存储我们的对话历史的,然后我们调用chat.GetStreamingChatMessageContentsAsync方法。 对话的执行流程是:

  1. 用户输入问题
  2. 调用chat.GetStreamingChatMessageContentsAsync方法,然后传递kernel,让它自动调用插件,然后根据用户提问去判断调用哪个插件。
  3. 返回需要调用的插件。
  4. 调用插件HttpClientFunction.GetAsync方法,然后得到有用的信息。
  5. 整理信息,返回给用户。

运行

代码语言:javascript
复制
请输入您的问题:
庆余年最新一集?
搜索结果:**庆余年最新一集**是庆余年第二季的剧情:在悬空寺上,庆帝遭遇三连刺杀,范闲出手相救却导致武功全废。危机四伏,压力陡增,范闲别无选择,他必须以这样的身体下江南,挑战庞大的势力与既定的游戏规则,以求彻底夺回内库。
庆余年第二季的最新一集剧情是:在悬空寺上,庆帝遭遇三连刺杀,范闲出手相救却导致武功全废。危机四伏,压力陡增,范闲别无选择,他必须以这样的身体下江南,挑战庞大的势力与既定的游戏规则,以求彻底夺回内库。
请输入您的问题

总结

我们通过上面的代码实现了一个搜索引擎插件,这个插件可以根据用户提出的问题搜索相关信息,然后返回给用户。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 token的技术分享 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 准备工作
  • 创建联网插件
  • 运行
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档