详细介绍
工具简介
博查万象是博查科技(Bocha AI)推出的一款面向AI应用的新一代搜索引擎与知识检索API工具。它并非传统的网页搜索产品,而是专门为AI应用、大语言模型(LLM)和智能体(Agent)提供高质量、结构化世界知识的基础设施。其核心理念是“给AI用的世界知识搜索引擎”,旨在解决AI模型在实时信息、专业知识与长尾查询上的短板,帮助AI应用连接动态更新的世界知识,获得干净、准确、高质量的搜索结果。
博查万象基于多模态混合搜索和语义排序技术构建,能够从近百亿网页和生态内容源中搜索高质量的世界知识,涵盖新闻、图片、视频、百科、机票酒店、学术文献等多种类型。与普通搜索引擎不同,博查万象特别优化了机器可读的结构化输出格式(如JSON),让AI应用可以无缝解析和利用搜索结果,从而增强问答、内容生成、决策支持等场景下的表现。
官网开放平台(open.bochaai.com)提供搜索API和排序API两种核心服务。其中搜索API支持自然语言查询,用户或开发者可以直接用口语化的问题(如“告诉我阿里巴巴2024年ESG报告的重点”)获得精准的网页摘要、关键细节和结构化数据。排序API则用于对已有结果进行语义重排,提升相关性。此外,博查万象近期还发布了博查Model API,支持DeepSeek V4系列模型,并提供了高达1M token的长上下文能力,进一步扩展了AI应用的知识处理边界。
主要功能
1. 自然语言搜索API
博查万象的核心功能之一是其强大的自然语言搜索API。传统搜索引擎依赖关键词匹配,而博查万象允许用户以完整的自然语言句子进行提问。系统会自动理解查询意图,从近百亿网页索引中召回最相关的信息,并以结构化JSON格式返回结果。返回内容不仅包括网页标题、URL、摘要,还包含关键细节、来源网站图标、发布日期等丰富元数据,便于AI应用直接提取和利用。
2. 多模态混合搜索
博查万象支持多模态内容的混合搜索,即一次查询可以同时返回文本、图片、视频、百科条目、学术论文等多种类型的结果。这使得AI应用在回答复杂问题时能够综合不同模态的信息源,提供更全面的答案。例如,搜索“2024年诺贝尔奖得主”可以同时获得文字新闻、获奖者照片、相关视频报道等。
3. 语义排序API
除了搜索,博查万象还提供独立的排序API。该API基于先进的语义排序模型,能够对给定的候选结果列表进行相关性重排,将最符合用户意图的结果排在前面。这对于需要二次精排的RAG(检索增强生成)应用、内容聚合平台或知识图谱构建场景特别有用,能显著提升最终输出的质量。
4. 生态内容源覆盖
博查万象的搜索范围不仅限于通用网页,还深度覆盖了多个垂直生态内容源,包括新闻门户(如新华网、澎湃新闻)、百科知识、学术文献、机票酒店预订信息等。这种广泛的覆盖确保了AI应用在涉及专业领域或实时动态话题时,依然能获取到权威、新鲜的信息。官网展示的示例中,针对“阿里巴巴2024年ESG报告”的搜索,结果聚合了阿里巴巴集团官网、新华网、澎湃新闻等多家权威来源。
5. 结构化API响应
博查万象的API响应采用标准的JSON格式,字段设计清晰,包含查询上下文(queryContext)、网页结果(webPages)、图片(images)、视频(videos)等分类。每个结果条目都带有唯一ID、名称、URL、摘要、来源图标等,方便AI应用进行解析、渲染或进一步处理。这种机器优先的设计极大地降低了开发者的集成成本。
6. 博查Model API与长上下文支持
博查万象近期推出了博查Model API,首批支持DeepSeek V4系列模型,并提供了1M token的超长上下文能力。这意味着AI应用可以一次性处理大量搜索结果或文档内容,进行深度分析与生成。长上下文功能特别适合需要综合多篇文档、长篇报告或复杂逻辑推理的场景,如法律文书审查、学术文献综述、企业战略分析等。
产品优势
博查万象相比通用搜索引擎和同类AI搜索工具,具有以下显著优势:
- 专为AI优化:从底层数据结构到API响应格式,全部围绕AI应用的需求设计,提供干净、结构化、机器可读的输出,减少解析噪音。
- 多模态混合搜索:一次查询覆盖文本、图片、视频、百科、学术等多种类型,信息全面性远超纯文本搜索。
- 自然语言理解:支持口语化、复杂的长句查询,无需关键词拼凑,降低使用门槛,提升召回精准度。
- 语义排序能力:独立的排序API可以对结果进行二次精排,确保最相关的内容优先呈现,提升RAG等应用的效果。
- 海量生态数据:索引规模达到近百亿网页,并深度整合了新闻、百科、学术、票务等垂直领域数据,覆盖广泛且权威。
- 长上下文支持:结合博查Model API的1M token上下文,可一次性处理大量搜索结果,适合复杂分析任务。
应用场景
博查万象适用于多种需要实时、准确、结构化知识的AI应用场景:
- 智能问答系统:为客服机器人、智能助手等提供实时、权威的知识支撑,回答事实性、动态性问题。
- 检索增强生成(RAG):作为RAG架构中的检索组件,为LLM提供高质量的外部知识,减少幻觉,提升回答的准确性和时效性。
- 内容聚合与摘要:自动从多个来源搜索并聚合信息,生成新闻摘要、行业报告、竞品分析等内容。
- 知识图谱构建:利用结构化搜索结果提取实体、关系和属性,辅助构建和更新知识图谱。
- 学术研究与文献综述:搜索学术论文、百科、权威新闻,辅助研究人员快速获取领域动态和背景知识。
- 商业决策支持:搜索行业报告、企业新闻、市场数据,为商业分析、投资决策提供信息支撑。
使用方法
使用博查万象非常简单,主要分为以下步骤:
- 注册账号:访问博查万象开放平台(open.bochaai.com),点击“控制台”注册账号并登录。
- 获取API密钥:在控制台中创建应用,获取专属的API密钥(API Key),用于身份认证。
- 调用搜索API:根据官方文档,使用HTTP请求调用搜索API,传入查询参数(如q=阿里巴巴2024年ESG报告),即可获得JSON格式的搜索结果。
- 调用排序API:如果需要对已有结果进行重排,可以调用排序API,传入候选结果列表,获得排序后的输出。
- 集成到AI应用:将API返回的结构化数据直接集成到你的AI应用、聊天机器人、RAG流程或数据分析管道中。
- 使用博查Model API:如需长上下文能力,可进一步使用博查Model API,支持DeepSeek V4等模型,处理1M token的上下文。
博查万象的文档(飞书文档)详细介绍了每个API的请求格式、参数说明、响应示例和错误码,开发者可以快速上手。目前价格模式尚未明确公开,但官网提供了价格页面链接,用户可联系或查阅具体定价方案。
总结
博查万象作为一款专为AI应用设计的搜索引擎与知识检索API,在技术架构、数据覆盖、输出格式和场景适配性上都表现出色。它填补了传统搜索引擎与AI应用之间“理解与结构”的鸿沟,让AI能够更高效、更准确地利用世界知识。无论是开发智能问答系统、构建RAG应用,还是进行学术研究或商业分析,博查万象都是一个值得关注和尝试的工具。



