ai-cache-ospp's Introduction

AI-Cache-OSPP

Code for AI Cache Plugin

0716 思路：利用Redis作为缓存，把textEmbeddingProvider和vectorStoreProvider做为可替换部分

在main函数中实现OnHttpRequestHeaders、OnHttpRequestBody、OnHttpResponseHeaders、OnHttpResponseBody这四个函数，其中只有OnHttpRequestBody需要根据不同的配置进行不同的处理
具体来说，在OnHttpRequestBody函数里拿到请求的body（query的字符串）后，执行cache.go中的缓存逻辑，首先逐字匹配query和缓存中的key，如果匹配成功则直接返回缓存中的value，否则首先调用textEmbeddingProvider的GetEmbedding方法得到query的embedding，然后调用vectorStoreProvider的QueryEmbedding方法得到query的vector和对应的score
判断分数后，如果相似度分数小于阈值，则直接返回缓存中的value，否则将query的embedding和vector存入缓存中并resume请求。
最后在OnHttpResponseBody函数中，将大模型返回的结果存入redis缓存中。

代码框架：

├── cache.go //缓存逻辑，在这里调用textEmbeddingProvider和vectorStoreProvider
├── config
│   └── config.go
├── go.mod
├── go.sum
├── main.go // 主要四个函数的逻辑，缓存部分主要实现还在cache.go中
├── option.yaml
├── README.md
├── textEmbeddingProvider // 类似AI-proxy中的相应配置，主要在provider.go中暴露接口，其他具体实现可以单独写一个go文件
│   ├── dashscope.go
│   └── provider.go
└── vectorStoreProvider // 类似AI-proxy中的相应配置，主要在provider.go中暴露接口，其他具体实现可以单独写一个go文件
    ├── dashvector.go
    └── provider.go

ai-cache-ospp's People

Contributors

Watchers

ai-cache-ospp's Issues

20240718 Review Notes

接受后端响应和主动返回响应时要考虑流式请求的场景
根据 Golang 官方的 Package names 规范：Good package names are short and clear. They are lower case, with no under_scores or mixedCaps. They are often simple nouns.
QueryEmbedding 与 Provider 是两个独立的接口。那么 CreateProvider(ProviderConfig) (Provider, error) 返回的 Provider 实例理论上是不一定实现了 QueryEmbedding 接口的。这会不会有问题？

TBC

Recommend Projects