首页
抖音
B站
老司机
热门
网络
投稿
首页
抖音
B站
老司机
热门
网络
互联网梗百科
MMBench
MMBench是多模态基准测试,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学和浙江大学的研究人员联合推出。MMBench推出一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20...
查看更多
快手灵儿
08-19
H2O EvalGPT
H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台来了解模型在大量任务和基准测试中的性能。无论你是想使用大模型自动化工作流程或任务,H2O EvalG...
查看更多
nikibaby
08-19
PubMedQA
PubMedQA是专门用在生物医学研究问题回答的数据集。PubMedQA通过文献摘要回答“是/否/可能”形式的研究问题,例如“某种药物是否有效”。数据集包含1000个专家标注的问答实例、61200个未...
查看更多
啵啵梨
08-19
MMLU
MMLU 全称 Massive Multitask Language Understanding,是一种针对大模型的语言理解能力的测评,是目前最著名的大模型语义理解测评之一,由UC Berkeley大...
查看更多
sweetybebe
08-19
SuperCLUE
SuperCLUE是中文通用大模型综合性评测基准,前身为中文语言理解测评基准(CLUE),旨在评估中文通用大模型的综合效果、与国际模型的对比及人类基准差距。其评测体系涵盖基础能力、专业能力、中文特性能...
查看更多
harisex
08-19
SCALE
大模型SQL能力排行榜揭示大模型在SQL领域的真实水平! SCALE致力于通过科学、严谨的测评,全面评估大语言模型(LLM)处理SQL的核心能力。我们聚焦三大关键维度:SQL优化能力(提升查询效率与性...
查看更多
honeysuger
08-19
奥维云网
北京奥维云网大数据科技股份有限公司是一家专注于智慧家庭领域的大数据综合解决方案服务商,为行业内企业提供数据研究和大数据服务。2014年8月,奥维云网(NEEQ:831101)在新三板挂牌上市,经历十多...
查看更多
yidhra
08-18
宏天软件
宏天软件2008年7月成立于广州,专注于业务流程管理套件BPM(Business Process Management)、低代码快速开发平台、集成管理平台、用户中心、统一门户、数据中台等中间件平台研...
查看更多
lingxi
08-18
飞书项目
飞书项目为复杂场景打造的专业项目管理平台,通过标准化工作流,大幅提升协作效率,驱动项目成功...
查看更多
Sybil
08-18
UStat
UStat,一个免费、易用且专业的网站数据统计分析与统计平台。平台提供精准全面的来路统计分析,让您的数据有形状,让决策有方向。通过实时监测、精准洞察、用户行为分析,帮助您全方面了解您的网站,实现业务增...
查看更多
粉红兔
08-18
NarratoAI
NarratoAI 被设计为一个综合性的AI工具,旨在简化视频内容(特别是短剧解说)的制作流程。它整合了内容创作、视频解说生成和自动化编辑等多个环节,并运用最新的人工智能大模型技术。该平台的核心目标是...
查看更多
Hansel & Grettel
08-17
CheckCle
checkcle是一款开源的实时监控平台,主要用于监控服务器、应用程序和基础设施的健康状态。它支持多种监控协议,包括 HTTP、DNS、TCP 等,并能跟踪响应时间、SSL 证书状态等关键指标。Che...
查看更多
jennagirl
08-17
下一页