热门

StableLM

1年前发布 138 0 0

StableLM是由Stable Diffusion背后的团队Stability AI最新推出的开源的类ChatGPT大语言模型，该模型目前处于Alpha版本，拥有的参数量分别为30亿和70亿，后续还将推出150亿到650亿参数模型。

收录时间：

2024-01-21

StableLM

StableLM

StableLM是由Stable Diffusion背后的团队Stability AI最新推出的开源的类ChatGPT大语言模型，该模型目前处于Alpha版本，拥有的参数量分别为30亿和70亿，后续还将推出150亿到650亿参数模型。

数据统计

相关导航

PaLM 2

PaLM（Pathways Language Model）是一种大型语言模型，即 LLM，类似于OpenAI 创建的 GPT 系列或Meta 的 LLaMA 系列模型。谷歌于 2022 年 4 月首次宣布推出 PaLM，超过了5400亿个训练参数。与其他 LLM 一样，PaLM 是一个灵活的系统，可以执行各种文本生成和编辑任务。例如，你可以将 PaLM 训练成像 ChatGPT 这样的对话式聊天机器人，或者你可以将它用于诸如总结文本甚至编写代码等任务。（这类似于谷歌今天也为其 Workspace 应用程序（如 Google Docs 和 Gmail）宣布的功能。）在 2023 谷歌 I/O 大会上，谷歌 CEO 皮查伊宣布推出对标 GPT-4 的大模型 PaLM 2，并正式发布预览版本，改进了数学、代码、推理、多语言翻译和自然语言生成能力。谷歌将为 PaLM 2 提供四种不同大小的版本，从最小到最大：Gecko、Otter、Bison 和 Unicorn。Gecko 非常轻巧，可以在移动设备上工作，并且速度足够快，即使在离线时也能在设备上运行出色的交互式应用程序。这种多功能性意味着可以对 PaLM 2 进行微调，以更多方式支持整个类别的产品，从而帮助更多人。 PaLM 2的特性 PaLM 2 是谷歌的下一代大语言模型，具有改进的多语言、推理和编码能力。多语言性： PaLM 2 在多语言文本方面接受了更多的训练，涵盖 100 多种语言。这显著提高了它在多种语言中理解、生成和翻译细微差别文本（包括成语、诗歌和谜语）的能力，这是一个很难解决的问题。PaLM 2 还通过了“精通”级别的高级语言能力考试。推理： PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页。因此，它展示了逻辑、常识推理和数学方面的改进能力。编程： PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长 Python 和 JavaScript 等流行的编程语言，但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。

DeepSpeed

微软开源的低成本实现类似ChatGPT的模型训练

悟道

2021年6月，北京智源研究院（BAAI）推出了悟道1.0的后续版本悟道2.0，作为中国第一个超大规模智能模型系统。悟道是一个语言模型，旨在在人类层面的思维上超越 OpenAI 的 GPT-3 和谷歌的 LaMDA。经过4.9TB的图像和文本训练，并在9个基准上超过了最先进（SOTA）水平，悟道比任何同行都更接近于实现通用人工智能（AGI）和人类水平的思维。悟道接受了4.9 TB高质量英文和中文图像和文本的训练： 1.2TB中文文本数据 2.5TB中文图形数据 1.2TB英文文本数据悟道是基于开源的 MoE 系统 FastMoE 进行训练的。MoE是一种机器学习技术，其工作原理如下：将预测建模任务划分为子任务，针对每个子任务训练专家（学习者）模型，开发门控模型，该门控模型基于要预测的输入来学习咨询哪个专家，并组合预测。FastMoE使悟道能够并行咨询不同的专家模型，并切换到预测结果最好的模型。例如，如果输入是英文文本，悟道将使用预测模型，该模型可以在英文文本中生成回应。

新Llama 3

Meta最新开源推出的新一代大模型

DALL·E 3

DALL·E 3是OpenAI的文本到图像合成模型的最新版本，旨在使用文本描述生成图像，相比此前的版本，DALL·E 3进一步降低了提示词门槛，提高语义理解和细节优化。原生构建在ChatGPT上，可供所有ChatGPT Plus和企业用户使用，并在2023年秋季通过API和Labs提供。

Gen-2

Runway最新推出的AI视频生成模型

AI提示语

无需代码，连接模型快速构建AI应用。让每个人都能轻松使用 AI，提高 10 倍生产力。

Stable Diffusion

Stable Diffusion 是于2022年发布的一个基于深度学习的AI文本到图像生成模型，该模型主要用于生成以文本描述为条件的详细图像和插画，由初创公司 StabilityAI 与一些学术研究人员和非营利组织合作开发的。如何运行Stable Diffusion？在线和本地运行的5种方法 Stable Diffusion是由初创公司Stability AI和来自慕尼黑大学以及Runway的研究人员在2022年发布的文本到图像的生成模型，本篇文章将讲解如何在线和本地运行Sta... AI教程 7个月前 Stable Diffusion是一个潜在扩散模型（ Latent Diffusion Model）——深度生成性神经网络的一种。Stable Diffusion的代码和模型权重已公开发布，可以在大多数配备有适度GPU的电脑硬件上运行，而在此之前的专有文生图模型（如DALL-E和Midjourney）只能通过云计算服务访问。 Stable Diffusion在线版本主要可通过以下官方网站访问： DreamStudio版（StabilityAI官方推出） Stable Diffusion XL （StabilityAI旗下的ClipDrop推出）

暂无评论

none

暂无评论...