热门

HuggingFace

1年前更新 102 0 0

AI模型开发社区

收录时间：

2024-01-17

打开网站手机查看

HuggingFace

HuggingFace

AI模型开发社区

数据统计

相关导航

Stable Diffusion

Stable Diffusion 是于2022年发布的一个基于深度学习的AI文本到图像生成模型，该模型主要用于生成以文本描述为条件的详细图像和插画，由初创公司 StabilityAI 与一些学术研究人员和非营利组织合作开发的。如何运行Stable Diffusion？在线和本地运行的5种方法 Stable Diffusion是由初创公司Stability AI和来自慕尼黑大学以及Runway的研究人员在2022年发布的文本到图像的生成模型，本篇文章将讲解如何在线和本地运行Sta... AI教程 7个月前 Stable Diffusion是一个潜在扩散模型（ Latent Diffusion Model）——深度生成性神经网络的一种。Stable Diffusion的代码和模型权重已公开发布，可以在大多数配备有适度GPU的电脑硬件上运行，而在此之前的专有文生图模型（如DALL-E和Midjourney）只能通过云计算服务访问。 Stable Diffusion在线版本主要可通过以下官方网站访问： DreamStudio版（StabilityAI官方推出） Stable Diffusion XL （StabilityAI旗下的ClipDrop推出）

文心大模型

百度推出的产业级知识增强大模型

Scale AI

AI机器学习标注训练平台

OpenBMB

OpenBMB全称为Open Lab for Big Model Base，旨在打造大规模预训练语言模型库与相关工具，加速百亿级以上大模型的训练、微调与推理，降低大模型使用门槛，与国内外开发者共同努力形成大模型开源社区，推动大模型生态发展，实现大模型的标准化、普及化和实用化，让大模型飞入千家万户。 OpenBMB开源社区由清华大学自然语言处理实验室和智源研究院语言大模型加速技术创新中心共同支持发起。发起团队拥有深厚的自然语言处理和预训练模型研究基础，近年来围绕模型预训练、提示微调、模型压缩技术等方面在顶级国际会议上发表了数十篇高水平论文。

新豆包大模型

豆包大模型是什么豆包大模型是字节跳动推出的AI大模型家族，包括豆包PixelDance、豆包Seaweed 视频生成、文生图、图生图、同声传译、角色扮演、语音合成、声音复刻、语音识别、Function Call和向量化等多个模型。豆包大模型具备强大的语言理解、生成和逻辑能力，能进行个性化创作、情绪丰富的语音合成、高精度语音识别、多风格图像生成和顶级的视频生成。豆包大模型通过火山引擎提供服务，支持企业和开发者构建智能化应用，推动AI技术在多种业务场景中的落地。豆包大模型的性能在多个评测中表现优异，例如在包括MMLU、BBH、GSM8K和HumanEval在内的11个业界公认的基准测试集中，Doubao-pro-4k模型的总体得分达到了76.8分，在代码能力、专业知识和指令遵循等方面的显著进步。豆包大模型的主要功能通用模型：字节跳动自研LLM模型，支持128K长文本，全系列可精调，具备更强的理解、生成、逻辑等综合能力，适配问答、总结、创作、分类等丰富场景。视频生成：通过精准语义理解、强大动态及运镜能力创作高质量视频，支持文本和图片生成两种模式。角色扮演：创作个性化角色，具备上下文感知和剧情推动能力，适合虚拟互动和故事创作。语音合成：生成自然生动的语音，能表达多种情绪，适用于文本到语音转换。声音复刻：快速克隆声音，高度还原音色和自然度，支持跨语种迁移，用于个性化语音合成。语音识别：准确识别和转录语音，支持多语种，适用于语音命令和转录服务。文生图：将文本转换为图像，擅长图文匹配和中国文化元素创作，用于图像生成和视觉内容创作。图生图：基于现有图像生成新图像，支持风格变换、扩图、重绘和涂抹等创意操作。同声传译：提供超低延时且自然高质量的实时翻译，支持跨语言同音色翻译，打破沟通中的语言壁垒。 Function Call：准确识别和抽取功能参数，适合复杂工具调用和智能交互。向量化：提供向量检索能力，支持LLM知识库的核心理解，适用于多语言处理。豆包大模型的功能特点豆包通用模型Pro：字节跳动自研的高级语言模型，支持128K长文本处理，适用于问答、总结、创作等多种场景。豆包通用模型Lite：轻量级语言模型，提供更低的成本和延迟，适合预算有限的企业使用。豆包·视频生成模型：利用先进的语义理解技术，将文本和图片转化为引人入胜的高质量视频内容。豆包·语言识别模型：具备高准确率和灵敏度，能够快速准确地识别和转写多种语言的语音。豆包·Function Call模型：专为复杂工具调用设计，提供精确的功能识别和参数抽取能力。豆包·文生图模型：将文字描述转化为精美图像，尤其擅长捕捉和表现中国文化元素。豆包·语音合成模型：能够合成自然、生动的语音，表达丰富的情感和场景。豆包·向量化模型：专注于向量检索，为知识库提供核心理解能力，支持多种语言。豆包·声音复刻模型：仅需5秒即可实现声音的1:1克隆，提供高度相似的音色和自然度。豆包·同声传译模型：实现超低延迟的实时翻译，支持跨语言同音色翻译，消除语言障碍。豆包·角色扮演模型：具备个性化角色创作能力，能够根据上下文感知和剧情推动进行灵活的角色扮演。豆包大模型的产品官网产品官网：volcengine.com/product/doubao 如何使用豆包大模型确定需求：明确项目或业务需求，比如是否需要文本生成、语音识别、图像创作、视频生成等。选择合适的模型：根据需求选择合适的豆包大模型，例如文生图模型、语音合成、视频生成模型等。注册和访问火山引擎：访问火山引擎官网注册账户，是字节跳动的云服务平台，提供豆包大模型的服务。申请访问权限：在火山引擎平台上申请使用豆包大模型的权限，填写相关信息和使用场景。 API接入：获取相应的API接口信息，包括API的端点、请求方法和必要的认证信息。开发和测试：根据API文档开发应用程序，将豆包大模型集成到你的业务流程中。进行充分测试，确保模型的输出符合预期。部署应用：在测试无误后，将集成了豆包大模型的应用部署到生产环境。监控和优化：监控应用的性能和模型的效果，根据反馈进行优化。豆包大模型的产品定价大语言模型按tokens使用量付费： Doubao-lite-4k（包括分支版本lite-character）：上下文长度4K、输入0.0003元/千tokens、输出0.0003元/千tokens、后付费、免费额度50万tokens。 Doubao-lite-32k：上下文长度32K、输入0.0003元/千tokens、输出0.0006元/千tokens后付费、免费额度50万tokens。 Doubao-lite-128k：上下文长度128K、输入0.0008元/千tokens、输出0.0010元/千tokens后付费、免费额度50万tokens。 Doubao-pro-4k（包括分支版本pro-character、pro-functioncall）：上下文长度4K、输入0.0008元/千tokens、输出0.0020元/千tokens后付费、免费额度50万tokens。 Doubao-pro-32k：上下文长度32K、输入0.0008元/千tokens、输出0.0020元/千tokens后付费、免费额度50万tokens。 Doubao-pro-128k：上下文长度128K、输入0.0050元/千tokens、输出0.0090元/千tokens后付费、免费额度50万tokens。按模型单元付费：独占的算力资源，更加独立可控 Doubao-lite-4k、Doubao-lite-32k：可承载性能（TPS）3000、按小时60元/个、包月28000元/个。 Doubao-lite-128k：可承载性能（TPS）4500、按小时240元/个、包月112000元/个。 Doubao-pro-4k、Doubao-pro-32k：可承载性能（TPS）3200、按小时160元/个、包月80000元/个。 Doubao-pro-128k：可承载性能（TPS）3500、按小时1200元/个、包月550000元/个。视觉模型豆包-文生图模型-智能绘图：推理服务、0.2元/次、后付费、免费额度200次。语音大模型 Doubao-语音合成：推理服务、5元/万字符、后付费、免费额度5000字符。 Doubao-声音复刻：推理服务、8元/万字符、后付费、免费额度5000字符。向量模型 Doubao-embedding：最长输入长度4K、输入0.0005元/千tokens、后付费、免费50万tokens。模型精调按tokens使用量（训练文本*训练迭代次数）计费，训练完成后出账。 Doubao-lite-4k、Doubao-lite-32k、Doubao-lite-128k：LoRA定价0.03元/千tokens、后付费。 Doubao-pro-4k、Doubao-pro-32k、Doubao-pro-128k：LoRA定价0.05元/千tokens、后付费。更多模型及定价信息，可访问豆包大模型官网获取最新信息。豆包大模型的应用场景内容创作与媒体：使用文生图、图生图、视频生成模型生成文章配图、漫画、海报、短视频等视觉内容。语音合成模型为视频、动画制作配音。客户服务：通过角色扮演模型提供虚拟客服和聊天机器人服务。使用语音识别和语音合成模型改善语音客服系统。教育与培训：文生图模型辅助教学材料的制作，如生成教学插图。角色扮演模型创建个性化学习体验和虚拟教师。娱乐与游戏：在游戏中使用角色扮演模型创建非玩家角色（NPC）的对话和行为。用语音合成模型为游戏角色提供自然的语言交流。智能助手：结合语音识别和语音合成模型，开发智能个人助理。用文生图模型生成个性化的推荐内容。市场与广告：用文生图模型自动生成广告创意和营销素材。用通用模型分析消费者反馈，优化广告文案。企业自动化：通过Function Call模型自动化复杂的工作流程和工具调用。用向量化模型进行高效的信息检索和知识管理。搜索与推荐：用向量化模型改善搜索引擎的准确性和响应速度。结合通用模型为用户推荐相关内容或产品。法律与金融：用通用模型进行合同分析、案件研究和合规检查。用语音识别模型转录会议记录和访谈内容。

DeepSpeed

微软开源的低成本实现类似ChatGPT的模型训练

Coze

Coze是由字节跳动在海外推出的一个AI聊天机器人和应用程序编辑开发平台，可以理解为字节跳动版的GPTs。无论用户是否有编程经验，都可以通过该平台快速创建各种类型的聊天机器人、智能体、AI应用和插件，并将其部署在社交平台和即时聊天应用程序中，如Discord、WhatsApp、Twitter。有意思的地方在于，目前Coze提供的是基于OpenAI GPT-4和GPT-3.5的API来创建和使用AI聊天机器人，并未使用自研的云雀大模型。而此前媒体报道字节将于12月底推出一个开放平台并开启公测，允许用户自主创建自定义聊天机器人。如同此前推出的聊天机器人豆包国际版为Cici，后续字节可能推出一个国内版本的Coze，或许会采用云雀大模型的能力。 Coze的主要功能丰富的插件工具：该平台目前包含 60 多个不同的插件，包括新闻阅读、旅行计划、生产力工具、图像理解 API 和多模态模型知识库调取和管理：Coze提供易于使用的知识库功能，使 AI 能够与用户自己的数据（如PDF、网页文本）进行交互。可以存储和管理知识中的数据长期记忆能力：提供便捷的数据库存储能力，可以让 AI 机器人持久记住对话中的关键参数或内容定时计划任务：通过计划任务功能，用户可以使用自然语言轻松创建复杂的任务，创建好的机器人会准时发送相应的消息内容。工作流程自动化：轻松创建一个工作流程将创意想法转换为机器人技能，如收集电影评论、起草行业研究报告等预览和调试：机器人开发完成后，可以发送消息来查看机器人的响应，并根据知识搜索结果和工具响应来排查问题如何使用Coze创建机器人访问Coze的官网（coze.com），点击Get started登录/注册账号选择侧边栏的Bots菜单，点击Create bot，然后添加机器人Logo、名称、描述信息然后在Persona & Prompt输入框中输入机器人角色和提示词，右侧可预览和调试输出信息测试无误后可点击右上角的Publish发布创建好的机器人 Coze的适用人群开发人员：专注于为特定任务调整AI模型和提示词，而不是花费大量时间进行初始开发企业公司：通过将AI机器人集成到内部程序如客户支持系统、内容创作工具和推荐引擎中，开发创新的应用和服务研究人员：利用该平台作为实验工具进行各种研究任务，探索自然语言生成和理解 AI爱好者：免费的GPT API，创建自定义机器人用于日常生活、学习和工作中常见问题 Coze支持哪些大模型？ Coze目前支持通过GPT-3.5和GPT-4模型来构建AI机器人。 Coze是免费的吗？ Coze目前是免费向用户开放的，暂未推出付费版本。 Coze创建的机器人可以发布到哪些平台？ Coze目前支持将创建好的机器人发布到Discord和Cici，后续将支持WhatsApp和Twitter。

Watsonx.ai

Watsonx.ai是IBM于5月9日发布的新一代企业级生成式人工智能和机器学习平台，Watsonx.ai将由基础模型驱动的新的生成性人工智能和传统的机器学习结合起来，成为一个跨越人工智能生命周期的强大平台。使用Watsonx.ai，开发人员可以轻松地训练、验证、调整和部署模型，只需用一小部分数据在短期时间内快速建立人工智能应用。预计Watsonx.ai将在7月全面上市。

暂无评论

none

暂无评论...