Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 13|回復: 0
打印 上一主題 下一主題

的扩召回倍数以提高召回率

[複製鏈接]

1

主題

1

帖子

2

積分

新手上路

Rank: 1

積分
2
跳轉到指定樓層
樓主
發表於 2024-5-14 16:27:14 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
解决方案探索实现向量+标量混合检索,一般有两种方式:前置过滤(-f)和后置过滤(-f)前置过滤指先对全体数据进行标量过滤,得到候选结果集,然后在候选结果集中进行向量检索,得到结果后置过滤指先进行向量检索,得到*个检索结果,再对这些结果进行标量过滤,得到最终的结果其中为扩召回倍数,主要是为了缓解向量检索结果被标量检索条件过滤,导致最终结果数不足个的问题


业界已有较多的成 牙买加 WhatsApp 号码列表 熟的全库检索的方案,后置过滤方案可以尽量复用现有框架,开发量小、风险低,因此我们优先考虑后置过滤方案我们基于的后置过滤方案快速实现了一版向量检索引擎,并验证其召回率与检索性能中成熟的检索算法有F、FF和FQ等,在不做扩召回的情况下,召回率偏低,因此我们在上选择了较大




测试数据集选取了线上真实的商品数据,据统计,符合标量过滤条件的候选向量数量平均为5万,在单上验证后置过滤检索性能与召回率如下:测试结果表面,以上三种算法均无法同时满足我们对检索性能和召回率的需求其中F与FQ召回率较低,F算法虽然召回率较高,但是与全体候选集计算向量相似度导致其性能较差举个例子,候选向量数据规模为万,向量维度为



回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|GameHost抗攻擊論壇  

GMT+8, 2025-4-5 16:23 , Processed in 0.221356 second(s), 6 queries , File On.

抗攻擊 by GameHost X3.3

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |