热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Avi Chawla
关于 DS、ML、LLM 和 RAG 的每日教程和见解 • 联合创始人 @dailydoseofds_ • IIT Varanasi • 前 AI 工程师 @ MastercardAI
为您的代理构建类人记忆(开源)!
每个代理和RAG系统在实时知识更新和快速数据检索方面都面临挑战。
Zep通过其不断发展的、具有时间感知的知识图谱解决了这些问题。
像人类一样,Zep将代理的记忆组织成情节,从这些情节中提取实体及其关系,并将其存储在知识图谱中:
(在阅读时请参考下面的图像)
1) 情节子图:捕获带有时间戳的原始数据,保留每个细节以便于历史查找。
2) 语义实体子图:提取实体(例如,“Alice”,“Google”)和事实(“Alice在Google工作”)。所有信息都有版本控制,因此过时的信息会被替换。
3) 社区子图:将相关实体分组为集群,并提供摘要以加快检索速度。
与MemGPT等工具相比,Zep的准确性提高了高达18.5%,延迟降低了90%。
它是完全开源的!
244.99K
以3个步骤评估像ChatGPT这样的对话LLM应用(开源)。
与单轮任务不同,对话是在多条消息中展开的。
这意味着LLM的行为必须在多个回合中保持一致、合规,并且具有上下文意识,而不仅仅是在一次输出中准确。
在DeepEval中,您可以通过以下3个步骤做到这一点:
1)将您的多轮测试用例定义为ConversationalTestCase。
2)用简单英语定义一个度量标准,使用ConversationalGEval。
3)运行评估。
完成!
这将提供详细的分析,显示哪些对话通过,哪些失败,以及得分分布。
此外,您还可以获得一个完整的用户界面来检查单独的回合。
这有两个好处:
- 整个流程非常简单,只需几行代码即可设置。
- DeepEval是100%开源的,拥有约1万颗星,您可以轻松自托管,以便您的数据保持在您希望的位置。
在评论中找到仓库!
23.5K
我构建了一个 RAG 系统,可以在 <0.03 秒内查询 3600 万个以上的向量。
所使用的技术使 RAG 的内存效率提高了 32 倍!
请查看下面的详细代码分解:

Avi Chawla8月4日 14:33
一种简单的技术使 RAG 的内存效率提高了 ~32 倍!
- Perplexity 在其搜索索引中使用它
- Azure 在其搜索管道中使用它
- HubSpot 在其 AI 助手中使用它
让我们了解如何在 RAG 系统中使用它(附代码):
45K
一个让任何人成为数据库工程师的MCP服务器(开源)!
@MongoDB刚刚发布了一个MCP服务器,让像Claude、Cursor和GitHub Copilot这样的AI工具可以直接与MongoDB部署进行对话。
这意味着任何人(无论是技术人员还是非技术人员)现在都可以说:
- “给我显示最活跃的用户”
- “创建一个只读访问的新数据库用户”
- “我的订单集合的模式是什么?”
...然后让代理处理其余的。
无需手动输入查询或记忆语法。
这个MCP服务器适用于:
- Atlas
- 社区版
- 企业高级版
现在只需英语就能编写生产级查询。
100%开源!链接在下一条推文中。
感谢#MongoDB团队今天的合作!

208
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可