详情介绍
林哥的大模型野榜(LYi)是一个专注于大模型产品评估与推荐的综合性平台,由有亦科技运营,为我国用户提供更符合本土需求的AI产品选择服务。该平台的灵感来源于国际知名的LMSYS Chatbot Arena,通过引入ELO对抗排名机制,让不同的AI模型进行“盲测”对决,用户则作为评委,通过选择自己更满意的回答来为模型打分,从而形成一个基于真实用户反馈的、动态更新的公正榜单。
林哥的大模型野榜不仅仅是一个简单的排行榜,它构建了一个集评测、推荐、社区互动于一体的生态系统。平台将大模型的能力细分为思维启发、文本生成、角色扮演、知识推理、联网搜索、文档检索等多个核心维度,用户可以根据自己的具体需求,查看不同维度下的模型排名,快速定位到最适合自己任务的AI工具。平台还支持用户亲自出题,让多个AI模型同时回答,并进行对比评分,这种深度互动使得评测结果更加透明和可信。该平全免费向公众开放,用户可以随时访问网站,获取的产品排名信息。
官网入口地址
-
林哥的大模型野榜官网:
https://lyihub.com/
下载地址
-
林哥的大模型野榜是一个纯粹的网页平台,无需下载任何客户端或应用程序。用户只需通过浏览器访问上述官网地址,即可使用所有功能。
功能介绍
林哥的大模型野榜提供了一套围绕模型评测与选择的功能矩阵:
-
多维度模型排行榜:这是平台的核心功能。它不只提供一个综合排名,而是将模型能力细分为思维启发、文本生成、角色扮演、知识推理、联网搜索、文档检索等维度,分别生成排行榜。这让你能根据具体任务需求(比如想要一个擅长写故事的模型)来寻找最合适的选择。
-
ELO对抗排名机制:平台借鉴了国际象棋的ELO评分系统。模型之间会进行“盲测”对决,用户不知道哪个模型生成了哪个回答,只根据自己的感受选择更好的一个。模型赢得比赛就会从输家身上获得ELO积分,从而形成动态的、基于用户实时反馈的权威排名。
-
用户出题与评测:你可以作为“主考官”,亲自向平台上的多个模型提出同一个问题。所有模型的回答会并排展示,由你或他用户进行对比、评分和排名。这个过程让你直接参与到榜单的构建中,也使评测结果更贴近真实使用场景。
-
模型对比分析:平台支持快速对比多个模型在各项维度上的得分和表现。你可以直观地看到不同模型的长处和短板,为你的选择决策提供数据支持。
-
数据集与文档社区:平台汇集了丰富的评测数据集和相关文档资源,方便研究人员、开发者或深度用户深入了解模型性能、进行学术研究或二次开发。
-
实时信息与搜索:部分参与评测的模型支持联网搜索功能,排行榜也专门设有“联网搜索”维度,评估模型获取和处理实时信息的能力。
应用场景
林哥的大模型野榜的应用场景非常广泛,涵盖了从普通用户到专业人士的多种需求:
-
个人用户选型:当你面对琳琅满目的AI助手(如文心一言、智谱清言、Kimi等)不知如何选择时,可以通过排行榜快速了解哪个模型更擅长你需要的功能,比如辅助学习、润色文案或是日常闲聊。
-
企业采购决策:企业在引入AI客服、内部知识库或内容生成工具时,可以利用该平台的评测数据,对比不同大模型在特定任务上的表现,为技术选型和商务采购提供客观参考。
-
开发者与研究者:AI开发者和学术研究者可以通过平台提供的众测数据和用户反馈,洞察当前主流模型的优缺点,了解行业前沿水平,为自己的模型改进或研究方向提供灵感。
-
模型能力追踪:AI领域日新月异,新模型和旧模型的更新版本层出不穷。通过这个平台,你可以像查看体育联赛积分榜一样,持续追踪各个模型的动态排名变化,掌握行业动态。
补充信息
-
定价:林哥的大模型野榜平台本身免费向所有用户开放。用户无需支付任何费用即可查看排行榜、参与评测和对比模型。
-
运营主体:平台由有亦科技运营,创始人林亦(LYi)在AI领域拥有广泛影响力,这为平台的权威性和专业性提供了一定背书。
-
应用示例:一位短视频创作者想找一个能快速生成创意脚本的AI助手。他可以在平台的“思维启发”或“文本生成”维度排行榜中,查看排名靠前的模型,然后进入“用户出题”板块,向几个候选模型提出同样的脚本需求,通过直观对比它们生成的回答质量,最终选定最适合自己的工具。
-
备案信息:网站已在工信部进行ICP备案,备案号为“粤ICP备2024250280号”,表明这是一个在我国境内合法运营的正规网站。
林哥的大模型野榜常见问题
这个平台是由有亦科技公司开发和运营的,创始人是AI领域知名的博主林亦,所以大家也亲切地称它为林哥的大模型野榜。
它的官网地址非常好记,就是 lyihub.com 你直接在浏览器里输入这个网址就能访问,不需要下载任何软件。
你可以把它理解成一个专门针对中文大模型的“大众点评”或者“游戏天梯榜”。它不生产模型,而是通过收集成千上万用户的真实打分和反馈,用一套科学的评分系统给各种AI模型排名,帮你看清哪个模型在写文章、哪个在聊天、哪个在解题上更厉害。
打开官网,你会看到不同能力维度下的模型排行榜。如果你想深入了解某个模型,可以点进去看详细评分。最有趣的是,你还可以亲自下场当裁判,在“众测”或者类似的功能区自己出题,让几个模型同时回答,然后你来给它们的表现投票打分。
是的,这个平台目前对所有用户免费。你可以免费查看所有排行榜,免费参与模型评测和投票,不需要花一分钱。
它的排名机制参考了国际通用的ELO算法,并且是基于大量用户的盲测投票,结果是比较客观公正的。网站本身是一个信息展示和互动平台,不涉及处理你的隐私对话数据,而且有正规的ICP备案,所以从信息参考和网站正规性的角度来说,是安全可靠的。
当然有。别只看总榜,要学会用“维度排名”。比如你想找个模型帮你润色年终总结,那就直接点开“文本生成”这个维度的排行榜,这里的结果比总榜更精准。多用“出题”功能,把你实际工作中遇到的问题丢给模型们对比,答案好坏,一眼便知。
特色就是多维度的ELO排名和用户深度参与。它不仅仅是给你看一个简单的分数,而是把模型能力拆得很细,让你能按需查找。它的主要用途就是帮你做决策,无论是个人选AI工具,还是公司做技术选型,都能在这里找到靠谱的参考。
这个你可以放心。作为一个公开的评测平台,它主要收集的是你对AI模型回答的评分和偏好,不会涉及你的个人隐私信息。作为正规网站,它的运营也会遵守相关的数据安全法规,保障用户的基本信息安全。
很方便。它的界面设计得很简洁,没有什么复杂的操作。一进去就是直观的排行榜,想对比、想评测,点几下鼠标就能完成,对普通用户非常友好。
不能,林哥的大模型野榜本身不生成PPT。它的作用是帮你从一大堆AI工具里,找出那个最擅长生成PPT大纲和内容的模型。比如你看到“秘塔写作猫”在文本生成榜上排名靠前,就可以去它的官网,让它帮你写PPT的内容。
同样,这个平台本身不生成视频。它是一个“导航仪”和“裁判员”,帮你筛选出哪些大模型在生成视频脚本、分镜头描述等方面表现更好。找到合适的模型后,你需要去那个模型的网站完成视频生成的工作。
没有限制。你可以随时随地访问网站,想看多久看多久,想对比多少个模型就对比多少个,平台不会对你的浏览、查询和投票次数进行任何限制。
| 分享笔记 (共有 篇笔记) |