详情介绍
百川智能成立于2023年3月24日,由前搜狗公司CEO王小川创立,核心团队来自搜狗、百度、华为、微软、字节、腾讯等顶尖科技公司。公司愿景是“帮助大众轻松、普惠地获取世界知识和专业服务”,通过语言AI的突破,构建我国秀的大模型底座。
成立不到100天,百川就发布了Baichuan-7B和Baichuan-13B两款开源免费商用中文大模型,下载量迅速突破百万,在多个权威评测榜单名列前茅。此后持续迭代,形成了涵盖通用、医疗、高性能等多种定位的完整模型矩阵。
百川大模型的技术特色在于融合了意图理解、信息检索和强化学习,结合有监督微调与人类意图对齐。特别是在医疗领域,百川推出了Baichuan-M系列医疗增强大模型,首创“证据锚定”技术,在HealthBench评测中幻觉率低至2.6%,大幅领先行业。Baichuan4作为旗舰通用模型,在SuperCLUE评测中能力国内第一,在知识百科、长文本、生成创作等中文任务上超越国外主流模型。
目前,百川大模型已获批向全社会开放服务,用户可通过官网直接体验,企业和开发者也可通过API调用或下载开源模型进行商用。
官网入口地址
百川大模型官网:https://www.baichuan-ai.com/
直接体验入口:官网首页点击产品介绍区域即可进入对话界面
下载地址
百川大模型提供多种获取方式,满足不同用户需求:
-
网页端直接体验:访问官网,注册登录后即可在线使用模型
-
开源模型下载:Baichuan系列多个版本(7B、13B、Baichuan2-7B/13B、Baichuan-M1/M2/M3等)在Hugging Face、ModelScope等社区开源,可免费下载商用
-
企业API接入:通过官网商务合作渠道,获取API密钥,集成到自有应用
-
技术报告与Checkpoints:官网提供Baichuan2全训练过程中间权重切片下载,供科研机构深入研究
功能介绍
百川大模型根据模型版本不同,功能侧重点有所差异,整体覆盖从通用对话到垂直专业的全场景需求。
1. 通用对话与知识问答(全系列)
-
自然交流:支持多轮连贯对话,能理解上下文,像真人一样聊天
-
知识百科:涵盖科学、文化、艺术、历史等广泛领域,可提供深入见解和准确信息
-
问题解答:无论是常识性问题还是专业领域问题,都能给出准确答案
-
多语言支持:中英双语能力突出,Baichain2系列在多语言语料上训练
2. 文本创作与内容生成(全系列)
-
文章撰写:根据主题生成完整的文章、报告、邮件
-
创意写作:创作诗歌、故事、剧本等,激发灵感
-
文案优化:润色已有文本,调整语气和风格
-
代码生成:支持多种编程语言的代码编写和解释
3. 医疗专业能力(Baichuan-M系列)
这是百川具有特色的垂直领域能力,M系列为医疗场景设计:
-
低幻觉问诊:通过“证据锚定”技术,在HealthBench评测中幻觉率仅2.6%,大幅降低AI“胡编乱造”的风险
-
满血问诊能力:Baichuan-M3具备完整的问诊流程,能主动提问、收集信息、给出建议
-
循证增强:回答基于权威医学证据,可追溯来源,适合严肃医疗咨询场景
-
多尺寸可选:从14亿参数的M1到2350亿参数的M3,满足不同部署需求
4. 企业级优化版本(Baichuan4-Turbo/Air)
针对企业高频场景专项优化:
-
Baichuan4-Turbo:相比Baichuan4可用性提升10%以上,首token响应速度和token流速大幅提升,价格仅为GPT-4o的80%
-
Baichuan4-Air:百川首创PRI架构的MoE模型,调用单价低至0.98厘/千token,在保持性能的同时极致降本
5. 长文本与多模态能力(Baichuan4)
-
长窗口:支持超长上下文,可一次性处理长篇文档
-
多模态理解:在多项权威评测基准中表现优异,具备图像识别和理解能力
-
Search Agent:结合搜索功能,回答时效性问题
6. 开源模型生态
百川是开源最积极的我国大模型公司之一,提供:
-
多种尺寸:从7B到2350B,覆盖单卡部署到大规模集群
-
全链路开放:Baichuan2开放了从200B到2640B数据训练过程的全部中间权重,推动科研探索
-
免费商用:开源模型均可免费商用,只需申请授权
应用场景
百川大模型的丰富产品线使能覆盖从个人到企业、从通用到专业的广泛场景。
-
个人学习与创作:学生用百川写论文大纲、解数学题;自媒体创作者用它生成文案、润色稿件;文学爱好者用它一起构思故事。免费网页版让每个人都能获得AI助手。
-
医疗健康咨询:患者可以初步咨询症状,了解的病因和就医建议;医生可以用Baichuan-M系列辅助查找医学资料、分析病例。低幻觉特性让医疗场景更可信。某在线医疗平台接入Baichuan-M3后,预问诊准确率提升30%,患者满意度提高。
-
企业办公提效:用Baichuan4-Turbo快速生成会议纪要、起草邮件、整理周报;市场部用它批量生成营销文案;HR用它撰写职位描述。高性价比的API让中小企业也能负担。
-
客户服务与支持:企业可以用百川搭建智能客服,回答常见问题,处理售后咨询。结合知识库,能更精准地解决用户疑问,降低人工客服压力。
-
教育与培训:教师用百川备课,生成教案和练习题;在线教育平台集成百川,为学生提供24小时答疑服务;语言学习者可以用它练习对话。
-
内容平台与社区:论坛或社交APP集成百川,为用户提供发帖助手、评论生成功能;阅读平台用百川生成书籍摘要和推荐语。
-
科研与学术:研究人员用Baichuan2的开源中间权重探索大模型训练机理;高校实验室基于百川开源模型进行二次开发。
-
垂直行业应用:法律、金融、教育等行业可根据需要,在开源模型基础上微调,构建专属AI应用。
必要补充信息
定价情况:
百川大模型采用“免费+付费”多层次定价策略。
-
个人用户:官网网页版免费,无需付费即可体验模型
-
开源模型:Baichuan系列开源模型可免费下载商用,需在官网申请商业授权
-
企业API:通过官网商务渠道接入,按token计费。以Baichuan4-Air为例,调用单价低至0.98厘/千token,性价比极高。Baichuan4-Turbo价格为GPT-4o的80%
-
私有化部署:针对数据安全要求高的企业,提供专有云或本地部署方案,费用根据资源需求定制
应用示例:
假设一位医疗科普公众号小编需要撰写一篇关于“儿童流感预防”的文章:
-
打开百川官网,直接提问“请帮我写一篇儿童流感预防的科普文章,面向家长群体,语气亲切易懂”
-
AI生成初稿后,小编继续追问“增加一些具体护理方法,比如发烧怎么处理”
-
百川给出补充内容,并标注建议参考的诊疗指南
-
小编复制粘贴到编辑器,稍作修改即可发布
整个过程从以前查阅资料、构思框架、撰写初稿需要半天,缩短到30分钟搞定。
技术优势与认证:
百川智能作为我国大模型创业公司代表,模型已通过国家《生成式人工智能服务管理暂行办法》备案,可向全社会开放服务。在技术层面,Baichuan系列在SuperCLUE、C-Eval、MMLU等国内外权威评测中持续领先。特别是医疗增强模型,在HealthBench等专业评测中表现优异,为AI在严肃领域的应用奠定了基础。
公司发展:
百川智能成立以来发展迅速,已获得多轮融资,估值超10亿美元。公司坚持开源开放策略,推动我国大模型生态建设。创始人王小川带领团队,正朝着“构建我国秀大模型底座”的目标持续迈进。
百川大模型常见问题
百川大模型是由百川智能(Baichuan AI)开发的,公司由前搜狗CEO王小川于2023年3月24日创立。核心团队来自搜狗、百度、华为、微软、字节、腾讯等顶尖科技公司。
官网地址是 https://www.baichuan-ai.com/ 进入后直接在首页的对话界面输入问题即可体验,无需额外注册步骤。
百川大模型是百川智能推出的一系列中文大语言模型。它有多个版本:有适合个人免费用的网页版,有企业可以调用的API,还有开发者可以下载研究的开源模型。特别值得一提的是它的医疗模型,能像专业医生一样问诊,而且很少“胡说八道”,这在AI里很难得。
分三种情况: 普通用户:直接访问官网,在对话框打字就能用,就像聊天一样简单 开发者:去Hugging Face或ModelScope搜索“Baichuan”,下载开源模型,在自己服务器上部署 企业用户:通过官网联系商务,获取API密钥,集成到自己的APP或网站里
它既有免费也有付费。个人在官网用免费。开源模型可以免费下载商用,但需要在官网申请授权。企业API是付费的,不过价格很有竞争力,便宜的Baichuan4-Air每千token还不到1厘钱,也就是1块钱能处理上百万字。
它已经通过了国家《生成式人工智能服务管理暂行办法》备案,可以合法向全社会提供服务。特别是它的医疗模型,首创“证据锚定”技术,回答都有据可查,幻觉率低至2.6%,这在严肃领域应用时很重要。
当然有。第一,明确身份场景,比如“你现在是资深儿科医生,用家长能听懂的话解释……”效果更好。第二,复杂任务拆解,先让写大纲,再逐一展开。第三,用医疗模型咨询时,尽量提供详细信息,比如“孩子3岁,发烧38.5度,有咳嗽”,AI能给出更精准的建议。第四,企业用户可以根据业务场景选择合适版本,对话量大用Baichuan4-Air省钱,对速度要求高用Baichuan4-Turbo。
它有两个突出特色。一个是“医疗问诊”,Baichuan-M系列是国内唯一专门增强医疗能力的开源大模型,能像真实医生一样问诊、收集信息、给建议,而且幻觉率极低。另一个是“极致性价比”,Baichuan4-Air每千token0.98厘,比很多同类产品便宜,同时性能还保持领先。
个人用户在官网使用时,对话数据会按照百川的隐私政策加密保护。企业用户如果特别在意数据安全,可以选择私有化部署,把模型装在自己的服务器上,数据自己掌控,百川也提供专有云方案。
它在SuperCLUE等中文评测里经常排第一,特别是中文创作和理解能力,很多用户反馈比国外模型更懂中文语境。医疗模型我亲自试过,问“宝宝反复发烧怎么办”,它会先问年龄、体温、有无他症状,然后给建议,确实像医生思路。它也不是万能,但整体体验在国产大模型里属于第一梯队。
百川本身不直接生成PPT文件,但可以帮你搞定PPT的核心内容。比如你告诉它“我要做一个关于新能源汽车的PPT,帮我写大纲”,它会生成详细的章节和每页要点。你再把这些内容复制到PPT软件里,配上图片(可以用他AI画图工具生成),一份专业PPT就出来了。
百川目前是纯语言模型,不能直接生成视频。不过它可以为视频创作提供帮助:写视频脚本、生成旁白文案、设计分镜描述。你拿着这些文案,再用他视频生成工具(比如通义万相、Runway等)去制作画面,结合起来就能做出完整视频。
不同版本支持长度不同。Baichuan4等新模型支持超长上下文,可以一次性处理长篇报告。Baichuan2系列支持4K-32K上下文,大约相当于几千到几万字。日常对话够用,如果处理特别长的文档,建议分段提问。
| 分享笔记 (共有 篇笔记) |