Google DeepMind 是一家致力于构建安全和高效的人工智能系统的公司,其先进的 AI 模型如 Gemini、Imagen 和 Veo,正在推动科学和创意产业的变革。
认知仿真是一种创新的AI架构,旨在通过模拟人类专家的思维过程,确保AI技术的可控性和安全性,广泛应用于医疗、金融、客户服务等多个领域。
EleutherAI是一个开源人工智能研究团队,致力于推动开源人工智能研究,提供强大的语言模型和研究成果。
Iris.ai RSpace™ 是一款领先的人工智能研究工作空间,提供智能搜索、自动摘要和数据提取等功能,帮助研究人员高效处理科学文本。
LLM-EVAL是一款高效的语言模型评估工具,帮助用户全面了解和优化模型性能,适用于研究、企业和教育等多种场景。
MMBench是一个专为大型模型评估而设计的平台,提供透明、公正的评估环境,汇集最新模型的性能数据,助力AI技术发展。
MMLU Benchmark是一个多任务语言理解基准测试,旨在评估和比较不同模型在多任务语言理解方面的性能。Gemini Ultra是目前的领先模型,为用户提供了参考标准和指导。
OpenCompass司南是一款全面、客观的评测工具,专为大语言模型和多模态模型提供得分与排名,助力用户深入了解模型能力。