首页>软件资讯>常见问题

常见问题

为 AI 重新定义数据库:MongoDB 为何收购 Voyage AI

发布时间:2025-03-05 22:24:41人气:131

  AI正在重塑各行各业,重新定义客户体验,并改变企业创新、运营和竞争的方式。尽管大部分关注点在前沿模型上,但一项根本的挑战在于数据—如何存储和检索数据并让数据为AI应用所用。AI驱动软件的民主化依赖于在正确的抽象层上进行开发,但目前,对于大多数组织来说,大规模创建有用的实时AI应用仍然不可行。


  挑战不仅在于复杂性,还在于信任。AI模型是概率性的,这意味着其输出不具有确定性和可预测性。这在当今聊天机器人的幻觉问题中显而易见,并且随着AI智能载体的兴起,AI系统可以自主做出决策,这一点变得更加重要。开发团队需要能够控制、塑造和调整生成的输出,以符合其目标并确保准确性。


  AI驱动的搜索和检索是一项强大的工具,可以从特定来源提取相关的上下文数据,增强AI模型,以生成可靠和准确的响应或采取负责任和安全的行动,这在著名的检索增强生成(RAG)方法中得到了体现。在AI驱动的检索中,核心是嵌入生成和重新排序—这两个关键的AI组件能够捕捉数据的语义含义,并评估问询和结果的相关性。我们认为将生成、重新排序以及AI驱动的搜索嵌入数据库层可简化堆栈,从而为AI应用奠定更可靠的基础。通过将更多智能引入数据库,我们帮助企业减少幻觉,提高可信度,并在AI扩展上释放AI的全部潜力。


  最具影响力的应用需要一个灵活、智能且可扩展的数据基础。因此,我们很高兴地宣布收购了VoyageAI,这是一家在嵌入和重新排序模型领域的领导者,通过AI驱动的搜索和检索显著提高了准确性。此举不仅旨在增加AI功能,更是关乎为AI时代重新定义数据库。


  为什么这很重要:AI的未来构建在数据更高的相关性和准确性之上


  AI是概率性的—这不像传统软件那样具有预定义的规则和逻辑。相反,它会根据AI模型的训练方式和检索到的数据生成响应或采取行动。然而,由于该技术的概率性,AI可能会出现幻觉。幻觉是检索不佳或不精确的直接后果—当AI无法访问正确的数据时,它会生成看似合理但不正确的信息。这是AI采用的一项关键障碍,尤其是在企业中以及在准确性不可妥协的关键任务用例中。


  这使得检索最相关的数据对于AI应用程序提供高质量、上下文准确的结果至关重要。如今,开发者依赖于拼凑而成的独立组件来构建AI驱动的应用程序。这些组件的次优选择,例如嵌入模型,可能会导致低相关性的数据检索和低质量的生成输出。这种分散的方法对开发者来说既复杂、昂贵、效率低下,又繁琐。


  借助VoyageAI,MongoDB通过使AI驱动的搜索和检索成为数据库的原生功能,解决了这一挑战。开发者无需实施变通方法或管理单独的系统,而是可以从实时操作数据中生成高质量的嵌入,存储向量,执行语义搜索,并优化结果——所有这些都在MongoDB中完成。这消除了复杂性,并提供了更高的准确性、更低的延迟和简化的开发者体验。


  MongoDB.png


  VoyageAI为MongoDB带来的优势


  VoyageAI已组建了一支以斯坦福大学、麻省理工学院、加州大学伯克利分校和普林斯顿大学为基础的世界级AI研究团队,并迅速成为高精度AI检索领域的领导者。他们的技术已经被一些最先进的AI初创企业所信任,包括Anthropic、LangChain、Harvey和Replit。


  值得注意的是,VoyageAI的嵌入模型是HuggingFace社区中评分最高的零样本模型。VoyageAI的模型旨在通过以下方式提高生成输出的质量:


  通过创建更好地捕捉文本、图像、PDF和结构化数据含义的嵌入来增强向量搜索。


  通过先进的重新排序模型提高检索准确性,以优化AI驱动式应用的搜索结果。


  通过使用针对金融服务、医疗保健、法律等不同行业以及代码生成等使用案例进行优化的微调模型,启用特定领域的AI。


  通过将VoyageAI的检索功能集成到MongoDB中,我们正在帮助组织更轻松地构建更准确、更可靠的AI应用,而不会增加不必要的复杂性。


  如何将VoyageAI集成到MongoDB中


  我们将VoyageAI与MongoDB的集成分为三个阶段。在第一阶段,VoyageAI的文本嵌入、多模态嵌入和重排序模型将继续通过VoyageAI的现有API以及AWS和Azure云市场广泛提供,确保开发者可以继续使用其先进的嵌入和重新排序功能。我们还将投资于平台的可扩展性和企业级就绪能力,以支持VoyageAI模型的更广泛采用。


  接下来,我们会将VoyageAI的功能无缝嵌入到MongoDBAtlas中,首先推出用于VectorSearch的自动嵌入服务,该服务将自动处理嵌入生成。然后将进行原生重新排序,使开发人员能够立即提高检索准确性。我们还计划扩展特定领域的AI功能,以更好地支持不同行业(例如,金融服务、法律等)或用例(例如,代码生成)。


  最后,我们将通过增强的多模态功能推进AI驱动的检索,实现文本、图像和视频的无缝检索和排序。我们还计划引入指令调整模型,允许开发者使用简单的提示而不是复杂的微调来优化搜索行为。这将通过在MongoDBAtlas中嵌入生命周期管理来实现补充,确保AI应用的持续更新和实时优化。


  这对开发者和企业意味着什么?


  AI驱动的应用需要的不仅仅是一个存储、处理和持久化数据的数据库,而是还需要一个能够主动提高检索准确性、无缝扩展并消除操作摩擦的数据库。借助VoyageAI,MongoDB重新定义了支撑任务关键型AI驱动的应用的数据库要求。


  开发者将不再需要管理外部嵌入API、独立运行的实例向量存储或复杂的搜索管道。AI检索将内建到数据库中,实现与传统查询一样的无缝语义搜索、向量检索和排序。


  对于企业来说,这意味着能够更加信心十足地扩展AI应用,并加快价值实现速度。通过在大规模扩展交付高质量的结果,企业可以将AI无缝集成到其最关键的用例中,确保可靠性、性能和实际影响。


  展望未来:接下来会发生什么


  这仅仅是个开始。我们的愿景是将MongoDB打造成最强大且直观的数据库,适用于现代AI驱动的应用程序。


  VoyageAI的模型将很快在MongoDBAtlas中原生可用。


  我们将继续提升MongoDB的AI检索能力,使其更智能、更具适应性,并能够处理更广泛的数据类型和应用场景。


  请继续关注最新动态,详细了解如何在MongoDB中开始使用VoyageAI功能。


  关于MongoDB


  MongoDB是全球领先的开发者数据平台,全球范围内数百万开发者以及包括70%的财富百强企业和领先的跨国企业在内的50,000多家客户,将MongoDB作为可信赖的操作型数据库(OperationalDatabase),覆盖广泛的使用场景。


  



上一条:Docker的安装和使用

下一条:Anaconda3 环境迁移详细过程