马蜂科技 发表于 2025-2-21 11:06:53

开源的大模型有哪些?

以下是一些常见的开源大模型,按语言模型和视觉模型分类介绍:
开源语言模型
Meta Llama 3
由Meta开发的语言模型家族,提供多种大小版本,适合从轻量级移动客户端到大规模云部署的多种应用场景。
优点是可以在相对低功耗的硬件上运行,但其训练数据并未完全公开,因此是否完全符合开源定义存在争议。
BLOOM
由Hugging Face主导开发的多语言语言模型,参数规模达1760亿。
采用“负责任AI许可”,虽然不是完全开源,但可以免费使用和分发,只要不用于许可条款中定义的有害用途。
GPT-2
OpenAI开源的第二代语言模型,基于12亿参数。
适用于多种语言任务,如文本生成和**机器人,采用MIT许可协议,符合开源原则。
Falcon
由阿布扎比技术创新研究所开发,提供40B和180B两种版本。
40B版本采用Apache 2.0许可,符合开源定义,而180B版本使用和分发有一定限制。
Grok.AI
由X.ai开发的“专家混合”模型,基础模型更通用。
尽管公开了模型权重和架构,但未公开所有代码和训练数据,因此其开源性存在争议。
DeepSeek-R1
由DeepSeek AI开发的开源权重模型,以较低成本提供强大的推理能力。
可通过Hugging Face获取模型权重,并支持多种部署方式。
开源视觉模型
Stable Diffusion
最流行的开源图像生成模型之一,支持文本到图像和图像到图像的生成。
能够生成高度逼真和详细的图像,但使用需要一定的技术知识。
YOLO(You Only Look Once)
用于实时目标检测的快速模型,最新版本为YOLOv11。
适用于视频监控、自动驾驶和增强现实等领域。
DETR(Detection Transformer)
基于Transformer的目标检测模型,适合需要高精度的场景。
这些开源模型为开发者提供了广泛的选择,可以根据具体需求选择合适的模型进行研究和应用开发。

夜星晨 发表于 2025-3-27 21:27:07

完全同意,你的分析让人信服。

花花世界 发表于 7 天前

期待更多精彩观点碰撞!
页: [1]
查看完整版本: 开源的大模型有哪些?