StableLM

1年前发布 138 0 0

StableLM是由Stable Diffusion背后的团队Stability AI最新推出的开源的类ChatGPT大语言模型,该模型目前处于Alpha版本,拥有的参数量分别为30亿和70亿,后续还将推出150亿到650亿参数模型。

收录时间:
2024-01-21
StableLMStableLM
StableLM

StableLM是由Stable Diffusion背后的团队Stability AI最新推出的开源的类ChatGPT大语言模型,该模型目前处于Alpha版本,拥有的参数量分别为30亿和70亿,后续还将推出150亿到650亿参数模型。

数据统计

相关导航

PaLM 2

PaLM 2

PaLM(Pathways Language Model) 是一种大型语言模型,即 LLM,类似于OpenAI 创建的 GPT 系列或Meta 的 LLaMA 系列模型。谷歌于 2022 年 4 月首次宣布推出 PaLM,超过了5400亿个训练参数。与其他 LLM 一样,PaLM 是一个灵活的系统,可以执行各种文本生成和编辑任务。例如,你可以将 PaLM 训练成像 ChatGPT 这样的对话式聊天机器人,或者你可以将它用于诸如总结文本甚至编写代码等任务。(这类似于谷歌今天也为其 Workspace 应用程序(如 Google Docs 和 Gmail)宣布的功能。) 在 2023 谷歌 I/O 大会上,谷歌 CEO 皮查伊宣布推出对标 GPT-4 的大模型 PaLM 2,并正式发布预览版本,改进了数学、代码、推理、多语言翻译和自然语言生成能力。 谷歌将为 PaLM 2 提供四种不同大小的版本,从最小到最大:Gecko、Otter、Bison 和 Unicorn。Gecko 非常轻巧,可以在移动设备上工作,并且速度足够快,即使在离线时也能在设备上运行出色的交互式应用程序。这种多功能性意味着可以对 PaLM 2 进行微调,以更多方式支持整个类别的产品,从而帮助更多人。 PaLM 2的特性 PaLM 2 是谷歌的下一代大语言模型,具有改进的多语言、推理和编码能力。 多语言性: PaLM 2 在多语言文本方面接受了更多的训练,涵盖 100 多种语言。这显著提高了它在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力,这是一个很难解决的问题。PaLM 2 还通过了“精通”级别的高级语言能力考试。 推理: PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页。因此,它展示了逻辑、常识推理和数学方面的改进能力。 编程: PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长 Python 和 JavaScript 等流行的编程语言,但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。
悟道

悟道

2021年6月,北京智源研究院(BAAI)推出了悟道1.0的后续版本悟道2.0,作为中国第一个超大规模智能模型系统。悟道是一个语言模型,旨在在人类层面的思维上超越 OpenAI 的 GPT-3 和谷歌的 LaMDA。经过4.9TB的图像和文本训练,并在9个基准上超过了最先进(SOTA)水平,悟道比任何同行都更接近于实现通用人工智能(AGI)和人类水平的思维。 悟道接受了4.9 TB高质量英文和中文图像和文本的训练: 1.2TB中文文本数据 2.5TB中文图形数据 1.2TB英文文本数据 悟道是基于开源的 MoE 系统 FastMoE 进行训练的。MoE是一种机器学习技术,其工作原理如下: 将预测建模任务划分为子任务,针对每个子任务训练专家(学习者)模型,开发门控模型,该门控模型基于要预测的输入来学习咨询哪个专家,并组合预测。FastMoE使悟道能够并行咨询不同的专家模型,并切换到预测结果最好的模型。例如,如果输入是英文文本,悟道将使用预测模型,该模型可以在英文文本中生成回应。
Stable Diffusion

Stable Diffusion

Stable Diffusion 是于2022年发布的一个基于深度学习的AI文本到图像生成模型,该模型主要用于生成以文本描述为条件的详细图像和插画,由初创公司 StabilityAI 与一些学术研究人员和非营利组织合作开发的。 如何运行Stable Diffusion?在线和本地运行的5种方法 Stable Diffusion是由初创公司Stability AI和来自慕尼黑大学以及Runway的研究人员在2022年发布的文本到图像的生成模型,本篇文章将讲解如何在线和本地运行Sta... AI教程 7个月前 Stable Diffusion是一个潜在扩散模型( Latent Diffusion Model)——深度生成性神经网络的一种。Stable Diffusion的代码和模型权重已公开发布,可以在大多数配备有适度GPU的电脑硬件上运行,而在此之前的专有文生图模型(如DALL-E和Midjourney)只能通过云计算服务访问。 Stable Diffusion在线版本主要可通过以下官方网站访问: DreamStudio版(StabilityAI官方推出) Stable Diffusion XL (StabilityAI旗下的ClipDrop推出)

暂无评论

none
暂无评论...