InfiniteTalk是一款的开源数字人框架,通过创新的稀疏帧视频配音技术,能将一张静态照片和一段音频转化为口型精准、表情丰富、动作自然的无限时长说话视频。它打破了传统数字人只能短时间“对口型”的限制,真正实现了从“面部动起来”到“全身演起来”的质变。
SQLBot是一款基于大语言模型和RAG技术的开源智能问数系统,它能让你用日常说话的方式向数据库提问,并直接得到答案和可视化图表。无需写复杂SQL,业务人员也能轻松完成数据查询、分析和报表生成,真正实现“人人可用”的数据洞察。
Awesome CursorRules 是一个为 Cursor AI 编辑器收集了海量 .cursorrules 规则文件的开源宝库。它就像 AI 编码助手的“说明书”,通过预设的项目规范,让 AI 生成的代码自动符合团队风格、框架实践,告别手动修改,让开发效率和代码一致性翻倍。
Windows-Use是一款能让大语言模型直接操控你Windows电脑的开源工具。它像一个虚拟的“系统管理员”,可以听懂你的自然语言指令,然后自动帮你打开软件、点击按钮、输入文字、运行命令,甚至完成批量文件处理等复杂任务,让你彻底从繁琐的重复性操作中解放出来。
Video-Analyzer是一款能自动分析视频内容的开源工具。它不需要上传文件到云端,在你自己电脑上就能完成视频关键帧提取、语音转文字、内容描述生成等一系列操作。无论是想快速了解一个长视频在讲什么,还是需要批量处理监控录像、课程录像,它都能帮上大忙。
Awesome LLM Apps 是一个在GitHub上拥有超高热度的开源项目,由谷歌云AI产品经理创建。它像一个“AI应用百科全书”,收录了100多个基于大型语言模型(LLM)的真实应用案例。无论你想开发一个能分析PDF的智能助手、一个自动规划行程的旅行代理,还是一个多智能体协作的金融分析团队,都能在这里找到可以直接运行和学习的代码。项目核心聚焦于RAG(检索增强生成) 和AI Agent(人工智能代理) 技术,支持OpenAI、Gemini以及Llama、DeepSeek等开源模型的灵活切换,目标是帮
Vercel AI SDK 是一个开源的 TypeScript 工具包,简化和加速 AI 驱动的 Web 应用开发。它通过统一的 API 接口,让开发者可以轻松切换不同的 AI 模型提供商(如 OpenAI、Google、Anthropic),并提供了处理流式响应、管理前端状态的内置钩子和组件。无论你是要构建聊天机器人、生成式 UI 还是复杂的 AI 智能体,这个 SDK 都能提供从后端到前端的全面支持,让你用更少的代码做更多的事。
AniPortrait 是由腾讯游戏智迹团队开源的一款 AI 工具,它能通过一张静态人像照片和一段音频,生成口型精准、表情自然的动态视频。这项技术让老照片“开口说话”,让虚拟偶像“开口唱歌”,为内容创作者提供了零门槛的数字人生成方案。项目采用两阶段生成架构,先分析音频转化为面部关键点,再利用扩散模型生成高质量视频,目前已在 GitHub 收获超高热度。
MindSearch 是由上海人工智能实验室(上海AI实验室)研发的开源AI搜索引擎框架,它通过模拟人类思维方式,能在短短3分钟内从300多个网页中搜集整理有效信息,完成人类需要3小时的工作量。这款工具采用独特的“规划员+搜索员”多智能体架构,将复杂问题自动拆解、并行搜索、整合答案,并提供完整的思考路径供用户追溯。无论是做市场调研、写学术综述还是查法律条文,MindSearch都能成为你得力的研究助手。
蛐蛐(QuQu)是一款免费且开源的桌面端语音输入工具,为中文用户设计,是付费软件 Wispr Flow 的强大替代品。它通过本地处理保护你的隐私,结合顶尖的中文语音识别和可配置的大语言模型,帮你把口述内容自动转写、润色并粘贴到任何地方,让写作、 coding 和记录效率倍增。
AI开源框架
Parlant 是一个的开源框架,它彻底改变了传统 AI 代理依赖复杂提示词的开发方式。通过引入“确保合规性”的核心机制,Parlant 允许开发者用自然语言定义清晰的规则和行为指南,让 AI 代理在复杂、真实的业务场景中,始终保持可预测、一致且值得信赖的表现,是构建面向客户的生产级 AI 应用的理想选择。
蛐蛐(QuQu)是一款免费且开源的桌面端语音输入工具,为中文用户设计,是付费软件 Wispr Flow 的强大替代品。它通过本地处理保护你的隐私,结合顶尖的中文语音识别和可配置的大语言模型,帮你把口述内容自动转写、润色并粘贴到任何地方,让写作、 coding 和记录效率倍增。
MindSearch 是由上海人工智能实验室(上海AI实验室)研发的开源AI搜索引擎框架,它通过模拟人类思维方式,能在短短3分钟内从300多个网页中搜集整理有效信息,完成人类需要3小时的工作量。这款工具采用独特的“规划员+搜索员”多智能体架构,将复杂问题自动拆解、并行搜索、整合答案,并提供完整的思考路径供用户追溯。无论是做市场调研、写学术综述还是查法律条文,MindSearch都能成为你得力的研究助手。
AniPortrait 是由腾讯游戏智迹团队开源的一款 AI 工具,它能通过一张静态人像照片和一段音频,生成口型精准、表情自然的动态视频。这项技术让老照片“开口说话”,让虚拟偶像“开口唱歌”,为内容创作者提供了零门槛的数字人生成方案。项目采用两阶段生成架构,先分析音频转化为面部关键点,再利用扩散模型生成高质量视频,目前已在 GitHub 收获超高热度。
Vercel AI SDK 是一个开源的 TypeScript 工具包,简化和加速 AI 驱动的 Web 应用开发。它通过统一的 API 接口,让开发者可以轻松切换不同的 AI 模型提供商(如 OpenAI、Google、Anthropic),并提供了处理流式响应、管理前端状态的内置钩子和组件。无论你是要构建聊天机器人、生成式 UI 还是复杂的 AI 智能体,这个 SDK 都能提供从后端到前端的全面支持,让你用更少的代码做更多的事。
Video-Analyzer是一款能自动分析视频内容的开源工具。它不需要上传文件到云端,在你自己电脑上就能完成视频关键帧提取、语音转文字、内容描述生成等一系列操作。无论是想快速了解一个长视频在讲什么,还是需要批量处理监控录像、课程录像,它都能帮上大忙。
Awesome LLM Apps 是一个在GitHub上拥有超高热度的开源项目,由谷歌云AI产品经理创建。它像一个“AI应用百科全书”,收录了100多个基于大型语言模型(LLM)的真实应用案例。无论你想开发一个能分析PDF的智能助手、一个自动规划行程的旅行代理,还是一个多智能体协作的金融分析团队,都能在这里找到可以直接运行和学习的代码。项目核心聚焦于RAG(检索增强生成) 和AI Agent(人工智能代理) 技术,支持OpenAI、Gemini以及Llama、DeepSeek等开源模型的灵活切换,目标是帮
Windows-Use是一款能让大语言模型直接操控你Windows电脑的开源工具。它像一个虚拟的“系统管理员”,可以听懂你的自然语言指令,然后自动帮你打开软件、点击按钮、输入文字、运行命令,甚至完成批量文件处理等复杂任务,让你彻底从繁琐的重复性操作中解放出来。
Awesome CursorRules 是一个为 Cursor AI 编辑器收集了海量 .cursorrules 规则文件的开源宝库。它就像 AI 编码助手的“说明书”,通过预设的项目规范,让 AI 生成的代码自动符合团队风格、框架实践,告别手动修改,让开发效率和代码一致性翻倍。
SQLBot是一款基于大语言模型和RAG技术的开源智能问数系统,它能让你用日常说话的方式向数据库提问,并直接得到答案和可视化图表。无需写复杂SQL,业务人员也能轻松完成数据查询、分析和报表生成,真正实现“人人可用”的数据洞察。
InfiniteTalk是一款的开源数字人框架,通过创新的稀疏帧视频配音技术,能将一张静态照片和一段音频转化为口型精准、表情丰富、动作自然的无限时长说话视频。它打破了传统数字人只能短时间“对口型”的限制,真正实现了从“面部动起来”到“全身演起来”的质变。