详情介绍
Perplexica是一个致力于改变传统搜索体验的开源项目。它由开发者“ItzCrazyKns”创建并维护,提供一个透明、可定制且保护隐私的AI搜索解决方案。与依赖中心化服务器的商业AI搜索不同,Perplexica允许用户将部署在自己的设备上。它的核心工作流程是:接收到用户的问题后,利用类似SearxNG这样的元搜索引擎从多个信息源获取数据,然后运用嵌入模型和相似性搜索技术,从抓取的网页中找出最相关的内容片段,将这些片段交给一个大语言模型进行理解、归纳和总结,生成一个条理清晰、信息丰富的答案,并在答案后附上原始信息源的链接,方便用户溯源和验证。
官网入口地址
Perplexica是一个开源项目,所有代码、文档和更新都托管在GitHub上。
-
官网入口网址(项目地址):https://github.com/ItzCrazyKns/Perplexica
下载地址
Perplexica本身没有传统的“下载”安装包。你需要通过Git克隆代码仓库,或者直接从GitHub页面下载源代码的压缩包。
-
代码仓库地址:https://github.com/ItzCrazyKns/Perplexica
官方强烈推荐使用Docker进行安装,以简化环境配置和依赖管理。具体安装步骤在GitHub仓库的README文档中有详细说明。
功能介绍
Perplexica的功能围绕“理解式搜索”和“可定制性”展开,具体包括:
-
AI驱动的答案生成:核心功能是使用大语言模型将搜索结果整合成自然、连贯的答案,而不是简单的链接列表。它会对多个来源的信息进行综合和提炼。
-
信息来源与引用:每个生成的答案末尾都会附带清晰的来源链接,你可以直接点击查看原始网页,确保信息的可追溯性和可靠性,有效减少AI“幻觉”。
-
多种专注模式:为了在不同类型的搜索中获得效果,Perplexica设计了多种专注模式,让AI能更有针对性地处理问题:
-
所有模式:综合搜索整个网络。
-
写作助手模式:专注于查找语法、风格、词汇相关的资料,辅助内容创作。
-
学术搜索模式:优先搜索学术论文、预印本、学术数据库等资源。
-
YouTube搜索模式:聚焦于在YouTube平台内搜索视频内容。
-
Wolfram Alpha搜索模式:针对需要计算、数据查询和专业知识的搜索,调用Wolfram Alpha引擎。
-
Reddit搜索模式:将搜索范围限定在Reddit社区,寻找真实用户的讨论和推荐。
-
-
本地大语言模型支持:这是作为开源工具的一大亮点。Perplexica允许你连接本地运行的大语言模型,如通过Ollama、LM Studio等工具部署的Qwen、DeepSeek、Llama、Mistral等模型。这能确保所有数据处理都在本地完成,程度保护隐私。
-
实时信息检索:通过集成SearxNG这样的元搜索引擎,Perplexica能够实时抓取的网络信息,无需维护一个庞大的本地索引库,保证了答案的时效性。
-
API接口:项目提供了API接口,开发者可以将Perplexica的搜索能力集成到自己开发的应用程序、工作流或自动化脚本中。
-
Copilot模式:根据项目介绍,一个更具交互性和引导性的Copilot模式正在开发中,进一步深化与用户的互动,帮助澄清和细化搜索需求。
应用场景
Perplexica的灵活性和开源特性使适用于多种场景:
-
深度研究与学习:学生或研究人员可以使用学术搜索模式,快速获取特定课题的论文资料和背景信息,并通过来源引用进行深入阅读。
-
内容创作辅助:写作者可以利用写作助手模式,查找更地道的表达方式、获取灵感或核实事实,提升内容质量。
-
日常精准搜索:当你需要比传统搜索引擎更直接的答案,比如“最近发布的采用3nm工艺的消费级CPU有哪些”,Perplexica能直接生成总结列表并附上新闻来源。
-
开发者工具集成:开发者可以通过API将Perplexica集成到自己的智能应用、数据分析平台或个人知识管理系统中,为添加联网搜索和智能总结的能力。
-
隐私敏感用户的默认搜索引擎:对于不希望个人搜索记录被商业公司收集的用户,自托管的Perplexica提供了一个的选择,所有搜索行为都在自己的掌控之下。
补充必要信息
-
定价:Perplexica是一个免费且开源的项目。它不收取任何软件使用费。你的使用成本取决于你将部署在何处(自己的电脑或云服务器)以及你是否使用付费的第三方API(如选择使用OpenAI的API而非本地模型)。
-
开发与社区:该项目由一个充满热情的开发者个人发起,并在GitHub上接受社区的贡献。这意味着它的发展路线图深受社区影响,用户可以在GitHub上提交Bug报告、新功能建议,甚至参与代码开发。
-
主要限制:由于需要自行部署,使用上对普通用户有一定门槛。搜索速度和答案质量很大程度上依赖于你所配置的硬件资源(尤是运行本地LLM时)和网络状况。
Perplexica常见问题
Perplexica不是一个公司产品,而是一个由个人开发者发起的开源项目。它的主要创建和维护者是GitHub上的用户“ItzCrazyKns”,同时也有很多社区贡献者参与中。
官方没有提供公共的在线网页版。因为它是开源的,需要你自己动手部署。你可以把它安装在自己的电脑、NAS或者云服务器上,部署完成后就可以通过浏览器访问你自己的私有Perplexica实例了。
它不直接给你一堆链接,而是会先去读那些网页,然后把找到的信息总结成一段话直接回答你,并且告诉你答案是从哪个网站来的。这就像你雇了一个研究助理,帮你查资料、写报告,还附上参考文献。
稍微有点挑战。目前官方推荐的安装方式是使用Docker,这需要你懂一些基本的命令行操作。不过,GitHub上有很多热心网友写的保姆级教程,你可以搜一下跟着做。如果你会使用Portainer之类的Docker管理工具,过程会更简单一些。一旦装好,用起来就很直观了。
是免费的开源软件,没有任何隐藏费用。你可以随便下载、安装、使用,甚至修改它的代码。唯一产生费用的情况是,如果你在配置里选择使用OpenAI或它付费提供商的API来生成答案,那么你需要自己向它们支付API调用费。如果你选择连接本地免费模型,那就一分钱都不用花。
非常安全。因为你把整个服务都运行在自己的电脑上了,你的搜索请求、对话历史和获取的网页内容,所有数据处理都发生在本地,不会上传到任何人的服务器。从这个角度说,它是安全的搜索引擎之一了。
很简单,在搜索框旁边,你会看到有个“专注模式”的选项,点开它,选择“学术搜索模式”。然后输入你的关键词,比如“大语言模型推理优化”,它就会优先去抓取Google Scholar、arXiv这些学术网站的内容,然后给你生成一个带有论文标题、作者和摘要的总结,非常方便。
它不能直接生成PPT文件,但可以用“写作助手模式”帮你完成核心的思考和文本工作。比如你告诉它“帮我构思一个关于碳中和的PPT大纲”,它会搜索相关资料,然后帮你规划出封面、目录、各个章节的要点和核心论据,你拿着这个大纲,再去PPT软件里填内容和排版就行了。
目前它内置的专注模式支持YouTube搜索。如果你想搜索B站或抖音,可以先在“所有模式”下试试,它会搜到这些平台的网页链接。但由于国内平台的搜索接口和数据格式有差异,原生支持的难度较大,这是未来社区扩展的一个方向。
这个模式很实用,特别是当你需要查数据、做计算的时候。比如你想知道“2023年北京市的人口密度”,或者“sin(30度)的平方等于多少”,普通搜索给你一堆计算器链接。而Wolfram Alpha是一个知识计算引擎,这个模式会让Perplexica把问题发给它,直接帮你算好并返回精确的数值和图表,像是一个超级科学计算器。
会有一些限制,但这个限制主要来自你配置的那个大语言模型。每个模型都有自己一次能处理的文本长度上限。如果你的搜索问题和之前的对话历史加起来太长了,超过了模型的长度,会出错或者模型会忘记最早聊过什么。Perplexica本身会用一些方法管理对话历史,但根本的限制还是取决于模型。
可以的。Perplexica提供了API接口,这是一个给开发者用的功能。你可以通过编写代码调用这些API,让你的网站或应用程序能够发送搜索请求到你的Perplexica服务端,并接收它返回的搜索结果和AI总结,这样就可以在你的产品里实现AI搜索功能了。
| 分享笔记 (共有 篇笔记) |