热门

Codex

1年前发布 1,260 0 0

OpenAI旗下AI代码生成训练模型

收录时间：

2024-01-21

打开网站手机查看

Codex

Codex

OpenAI旗下AI代码生成训练模型

数据统计

相关导航

StableLM

StableLM是由Stable Diffusion背后的团队Stability AI最新推出的开源的类ChatGPT大语言模型，该模型目前处于Alpha版本，拥有的参数量分别为30亿和70亿，后续还将推出150亿到650亿参数模型。

Coze

Coze是由字节跳动在海外推出的一个AI聊天机器人和应用程序编辑开发平台，可以理解为字节跳动版的GPTs。无论用户是否有编程经验，都可以通过该平台快速创建各种类型的聊天机器人、智能体、AI应用和插件，并将其部署在社交平台和即时聊天应用程序中，如Discord、WhatsApp、Twitter。有意思的地方在于，目前Coze提供的是基于OpenAI GPT-4和GPT-3.5的API来创建和使用AI聊天机器人，并未使用自研的云雀大模型。而此前媒体报道字节将于12月底推出一个开放平台并开启公测，允许用户自主创建自定义聊天机器人。如同此前推出的聊天机器人豆包国际版为Cici，后续字节可能推出一个国内版本的Coze，或许会采用云雀大模型的能力。 Coze的主要功能丰富的插件工具：该平台目前包含 60 多个不同的插件，包括新闻阅读、旅行计划、生产力工具、图像理解 API 和多模态模型知识库调取和管理：Coze提供易于使用的知识库功能，使 AI 能够与用户自己的数据（如PDF、网页文本）进行交互。可以存储和管理知识中的数据长期记忆能力：提供便捷的数据库存储能力，可以让 AI 机器人持久记住对话中的关键参数或内容定时计划任务：通过计划任务功能，用户可以使用自然语言轻松创建复杂的任务，创建好的机器人会准时发送相应的消息内容。工作流程自动化：轻松创建一个工作流程将创意想法转换为机器人技能，如收集电影评论、起草行业研究报告等预览和调试：机器人开发完成后，可以发送消息来查看机器人的响应，并根据知识搜索结果和工具响应来排查问题如何使用Coze创建机器人访问Coze的官网（coze.com），点击Get started登录/注册账号选择侧边栏的Bots菜单，点击Create bot，然后添加机器人Logo、名称、描述信息然后在Persona & Prompt输入框中输入机器人角色和提示词，右侧可预览和调试输出信息测试无误后可点击右上角的Publish发布创建好的机器人 Coze的适用人群开发人员：专注于为特定任务调整AI模型和提示词，而不是花费大量时间进行初始开发企业公司：通过将AI机器人集成到内部程序如客户支持系统、内容创作工具和推荐引擎中，开发创新的应用和服务研究人员：利用该平台作为实验工具进行各种研究任务，探索自然语言生成和理解 AI爱好者：免费的GPT API，创建自定义机器人用于日常生活、学习和工作中常见问题 Coze支持哪些大模型？ Coze目前支持通过GPT-3.5和GPT-4模型来构建AI机器人。 Coze是免费的吗？ Coze目前是免费向用户开放的，暂未推出付费版本。 Coze创建的机器人可以发布到哪些平台？ Coze目前支持将创建好的机器人发布到Discord和Cici，后续将支持WhatsApp和Twitter。

HuggingFace

AI模型开发社区

Auto-GPT

Auto-GPT是一个实验性开源应用程序，展示了GPT-4语言模型的真正潜力，GitHub上超10万人星标。该程序由 GPT-4 驱动，将LLM大语言模型思维链接在一起，以自主实现你设定的任何目标。作为GPT-4完全自主运行的首批例子之一，Auto-GPT突破了人工智能的极限，距离AGI通用人工智能又近了一步。大家注意甄别autogpt.net不是其官方网站，agpt.co才是。

天工AI助手

天工作为一款大型语言模型，拥有强大的自然语言处理和智能交互能力，能够实现智能问答、聊天互动、文本生成等多种应用场景，并且具有丰富的知识储备，涵盖科学、技术、文化、艺术、历史等领域。该模型由昆仑万维与奇点智源联合研发，是国内首个对标 ChatGPT 的双千亿大语言模型。

新Gemma

Gemma是什么 Gemma是由谷歌DeepMind和谷歌的其他团队开发的一系列轻量级、先进的开放AI模型，基于与Gemini模型相同的技术，旨在帮助开发者和研究人员构建负责任的AI应用。Gemma模型系列包括两种权重规模的模型：Gemma 2B 和 Gemma 7B，提供预训练和指令微调版本，支持多种框架，如JAX、PyTorch和TensorFlow，以在不同设备上高效运行。 Gemma的官方入口 Gemma的官网主页：https://ai.google.dev/gemma?hl=zh-cn Gemma的Hugging Face模型：https://huggingface.co/models?search=google/gemma Gemma的Kaggle模型地址：https://www.kaggle.com/models/google/gemma/code/ Gemma的技术报告：https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf 官方PyTorch实现GitHub代码库：https://github.com/google/gemma_pytorch Gemma的Google Colab运行地址：https://colab.research.google.com/github/google/generative-ai-docs/blob/main/site/en/gemma/docs/lora_tuning.ipynb Gemma的主要特性轻量级架构：Gemma模型设计为轻量级，便于在多种计算环境中运行，包括个人电脑和工作站。开放模型：Gemma模型的权重是开放的，允许用户在遵守许可协议的情况下进行商业使用和分发。预训练与指令微调：提供预训练模型和经过指令微调的版本，后者通过人类反馈强化学习（RLHF）来确保模型行为的负责任性。多框架支持：Gemma支持JAX、PyTorch和TensorFlow等主要AI框架，通过Keras 3.0提供工具链，简化了推理和监督微调（SFT）过程。安全性与可靠性：在设计时，Gemma遵循Google的AI原则，使用自动化技术过滤训练数据中的敏感信息，并进行了一系列安全评估，包括红队测试和对抗性测试。性能优化：Gemma模型针对NVIDIA GPU和Google Cloud TPUs等硬件平台进行了优化，确保在不同设备上都能实现高性能。社区支持：Google提供了Kaggle、Colab等平台的免费资源，以及Google Cloud的积分，鼓励开发者和研究人员利用Gemma进行创新和研究。跨平台兼容性：Gemma模型可以在多种设备上运行，包括笔记本电脑、台式机、物联网设备和云端，支持广泛的AI功能。负责任的AI工具包：Google还发布了Responsible Generative AI Toolkit，帮助开发者构建安全和负责任的AI应用，包括安全分类器、调试工具和应用指南。 Gemma的技术要点模型架构：Gemma基于Transformer解码器构建，这是当前自然语言处理（NLP）领域最先进的模型架构之一。采用了多头注意力机制，允许模型在处理文本时同时关注多个部分。此外，Gemma还使用了旋转位置嵌入（RoPE）来代替绝对位置嵌入，以减少模型大小并提高效率。GeGLU激活函数取代了标准的ReLU非线性激活，以及在每个Transformer子层的输入和输出都进行了归一化处理。训练基础设施：Gemma模型在Google的TPUv5e上进行训练，这是一种专为机器学习设计的高性能计算平台。通过在多个Pod（芯片集群）上进行模型分片和数据复制，Gemma能够高效地利用分布式计算资源。预训练数据：Gemma模型在大量英语数据上进行预训练（2B模型大约2万亿个token的数据上预训练，而7B模型则基于6万亿个token），这些数据主要来自网络文档、数学和代码。预训练数据经过过滤，以减少不想要或不安全的内容，同时确保数据的多样性和质量。微调策略：Gemma模型通过监督式微调（SFT）和基于人类反馈的强化学习（RLHF）进行微调。这包括使用合成的文本对和人类生成的提示响应对，以及基于人类偏好数据训练的奖励模型。安全性和责任：Gemma在设计时考虑了模型的安全性和责任，包括在预训练阶段对数据进行过滤，以减少敏感信息和有害内容的风险。此外，Gemma还通过了一系列的安全性评估，包括自动化基准测试和人类评估，以确保模型在实际应用中的安全性。性能评估：Gemma在多个领域进行了广泛的性能评估，包括问答、常识推理、数学和科学问题解答以及编码任务。Gemma模型与同样规模或更大规模的开放模型进行了性能对比，在MMLU、MBPP等18个基准测试中，有11个测试结果超越了Llama-13B或Mistral-7B等模型。开放性和可访问性：Gemma模型以开源的形式发布，提供了预训练和微调后的检查点，以及推理和部署的开源代码库。这使得研究人员和开发者能够访问和利用这些先进的语言模型，推动AI领域的创新。常见问题 Gemma一词的含义是什么？ Gemma在拉丁语中的意思是“宝石”。 Gemma是开源的吗？ Gemma是开源开放的大模型，用户可在Hugging Face查看和下载其模型。 Gemma模型的参数量是多少？ Gemma目前提供20亿和70亿参数量的模型，后续还会推出新的变体。

AI提示语

无需代码，连接模型快速构建AI应用。让每个人都能轻松使用 AI，提高 10 倍生产力。

Scale AI

AI机器学习标注训练平台

暂无评论

none

暂无评论...