开发框架

新豆包大模型
新豆包大模型

豆包大模型是什么 豆包大模型是字节跳动推出的AI大模型家族,包括 豆包PixelDance、豆包Seaweed 视频生成、文生图、图生图、同声传译、角色扮演、语音合成、声音复刻、语音识别、Function Call和向量化等多个模型。豆包大模型具备强大的语言理解、生成和逻辑能力,能进行个性化创作、情绪丰富的语音合成、高精度语音识别、多风格图像生成和顶级的视频生成。豆包大模型通过火山引擎提供服务,支持企业和开发者构建智能化应用,推动AI技术在多种业务场景中的落地。 豆包大模型的性能在多个评测中表现优异,例如在包括MMLU、BBH、GSM8K和HumanEval在内的11个业界公认的基准测试集中,Doubao-pro-4k模型的总体得分达到了76.8分,在代码能力、专业知识和指令遵循等方面的显著进步。 豆包大模型的主要功能 通用模型:字节跳动自研LLM模型,支持128K长文本,全系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景。 视频生成:通过精准语义理解、强大动态及运镜能力创作高质量视频,支持文本和图片生成两种模式。 角色扮演:创作个性化角色,具备上下文感知和剧情推动能力,适合虚拟互动和故事创作。 语音合成:生成自然生动的语音,能表达多种情绪,适用于文本到语音转换。 声音复刻:快速克隆声音,高度还原音色和自然度,支持跨语种迁移,用于个性化语音合成。 语音识别:准确识别和转录语音,支持多语种,适用于语音命令和转录服务。 文生图:将文本转换为图像,擅长图文匹配和中国文化元素创作,用于图像生成和视觉内容创作。 图生图:基于现有图像生成新图像,支持风格变换、扩图、重绘和涂抹等创意操作。 同声传译:提供超低延时且自然高质量的实时翻译,支持跨语言同音色翻译,打破沟通中的语言壁垒。 Function Call:准确识别和抽取功能参数,适合复杂工具调用和智能交互。 向量化:提供向量检索能力,支持LLM知识库的核心理解,适用于多语言处理。 豆包大模型的功能特点 豆包通用模型Pro:字节跳动自研的高级语言模型,支持128K长文本处理,适用于问答、总结、创作等多种场景。 豆包通用模型Lite:轻量级语言模型,提供更低的成本和延迟,适合预算有限的企业使用。 豆包·视频生成模型:利用先进的语义理解技术,将文本和图片转化为引人入胜的高质量视频内容。 豆包·语言识别模型:具备高准确率和灵敏度,能够快速准确地识别和转写多种语言的语音。 豆包·Function Call模型:专为复杂工具调用设计,提供精确的功能识别和参数抽取能力。 豆包·文生图模型:将文字描述转化为精美图像,尤其擅长捕捉和表现中国文化元素。 豆包·语音合成模型:能够合成自然、生动的语音,表达丰富的情感和场景。 豆包·向量化模型:专注于向量检索,为知识库提供核心理解能力,支持多种语言。 豆包·声音复刻模型:仅需5秒即可实现声音的1:1克隆,提供高度相似的音色和自然度。 豆包·同声传译模型:实现超低延迟的实时翻译,支持跨语言同音色翻译,消除语言障碍。 豆包·角色扮演模型:具备个性化角色创作能力,能够根据上下文感知和剧情推动进行灵活的角色扮演。 豆包大模型的产品官网 产品官网:volcengine.com/product/doubao 如何使用豆包大模型 确定需求:明确项目或业务需求,比如是否需要文本生成、语音识别、图像创作、视频生成等。 选择合适的模型:根据需求选择合适的豆包大模型,例如文生图模型、语音合成、视频生成模型等。 注册和访问火山引擎:访问火山引擎官网注册账户,是字节跳动的云服务平台,提供豆包大模型的服务。 申请访问权限:在火山引擎平台上申请使用豆包大模型的权限,填写相关信息和使用场景。 API接入:获取相应的API接口信息,包括API的端点、请求方法和必要的认证信息。 开发和测试:根据API文档开发应用程序,将豆包大模型集成到你的业务流程中。进行充分测试,确保模型的输出符合预期。 部署应用:在测试无误后,将集成了豆包大模型的应用部署到生产环境。 监控和优化:监控应用的性能和模型的效果,根据反馈进行优化。 豆包大模型的产品定价 大语言模型 按tokens使用量付费: Doubao-lite-4k(包括分支版本lite-character):上下文长度4K、输入0.0003元/千tokens、输出0.0003元/千tokens、后付费、免费额度50万tokens。 Doubao-lite-32k:上下文长度32K、输入0.0003元/千tokens、输出0.0006元/千tokens后付费、免费额度50万tokens。 Doubao-lite-128k:上下文长度128K、输入0.0008元/千tokens、输出0.0010元/千tokens后付费、免费额度50万tokens。 Doubao-pro-4k(包括分支版本pro-character、pro-functioncall):上下文长度4K、输入0.0008元/千tokens、输出0.0020元/千tokens后付费、免费额度50万tokens。 Doubao-pro-32k:上下文长度32K、输入0.0008元/千tokens、输出0.0020元/千tokens后付费、免费额度50万tokens。 Doubao-pro-128k:上下文长度128K、输入0.0050元/千tokens、输出0.0090元/千tokens后付费、免费额度50万tokens。 按模型单元付费:独占的算力资源,更加独立可控 Doubao-lite-4k、Doubao-lite-32k:可承载性能(TPS)3000、按小时60元/个、包月28000元/个。 Doubao-lite-128k:可承载性能(TPS)4500、按小时240元/个、包月112000元/个。 Doubao-pro-4k、Doubao-pro-32k:可承载性能(TPS)3200、按小时160元/个、包月80000元/个。 Doubao-pro-128k:可承载性能(TPS)3500、按小时1200元/个、包月550000元/个。 视觉模型 豆包-文生图模型-智能绘图:推理服务、0.2元/次、后付费、免费额度200次。 语音大模型 Doubao-语音合成:推理服务、5元/万字符、后付费、免费额度5000字符。 Doubao-声音复刻:推理服务、8元/万字符、后付费、免费额度5000字符。 向量模型 Doubao-embedding:最长输入长度4K、输入0.0005元/千tokens、后付费、免费50万tokens。 模型精调 按tokens使用量(训练文本*训练迭代次数)计费,训练完成后出账。 Doubao-lite-4k、Doubao-lite-32k、Doubao-lite-128k:LoRA定价0.03元/千tokens、后付费。 Doubao-pro-4k、Doubao-pro-32k、Doubao-pro-128k:LoRA定价0.05元/千tokens、后付费。 更多模型及定价信息,可访问豆包大模型官网获取最新信息。 豆包大模型的应用场景 内容创作与媒体:使用文生图、图生图、视频生成模型生成文章配图、漫画、海报、短视频等视觉内容。语音合成模型为视频、动画制作配音。 客户服务:通过角色扮演模型提供虚拟客服和聊天机器人服务。使用语音识别和语音合成模型改善语音客服系统。 教育与培训:文生图模型辅助教学材料的制作,如生成教学插图。角色扮演模型创建个性化学习体验和虚拟教师。 娱乐与游戏:在游戏中使用角色扮演模型创建非玩家角色(NPC)的对话和行为。用语音合成模型为游戏角色提供自然的语言交流。 智能助手:结合语音识别和语音合成模型,开发智能个人助理。用文生图模型生成个性化的推荐内容。 市场与广告:用文生图模型自动生成广告创意和营销素材。用通用模型分析消费者反馈,优化广告文案。 企业自动化:通过Function Call模型自动化复杂的工作流程和工具调用。用向量化模型进行高效的信息检索和知识管理。 搜索与推荐:用向量化模型改善搜索引擎的准确性和响应速度。结合通用模型为用户推荐相关内容或产品。 法律与金融:用通用模型进行合同分析、案件研究和合规检查。用语音识别模型转录会议记录和访谈内容。

新Gumloop
新Gumloop

Gumloop是什么 Gumloop 是一个 AI 自动化框架,通过简单的拖放界面使用户能够创建和部署 AI 驱动的工作流自动化,无需编写代码。核心优势在于易用性和强大的 AI 功能,适合非技术用户快速上手,设计和实施复杂的自动化流程。Gumloop 提供了预定义的自动化模板,支持与多个流行服务的连接,如 Twitter、AWS、GitHub、Outlook、Google 等,支持用户自定义工作流程。Gumloop 提供了 Chrome 扩展程序,用于构建 AI 浏览器自动化。 Gumloop的主要功能 自动化构建:用户可以通过拖放和链接节点来创建强大的自动化流程,模块化组件被称为“flows”,使任何人能轻松构建和定制工作流。 平台整合:Gumloop 提供与 Twitter、AWS、GitHub、Outlook、Google 等流行服务的广泛整合,实现跨平台的全面自动化。 可扩展的基础设施:用户缺乏技术背景,也能大规模运行工作流。Gumloop 设计了高效的处理能力,能处理大量工作负载。 团队协作:用户可以在统一的工作空间内与团队成员共享和共同建立工作流,增强生产力和合作能力。 安全性和可扩展性:Gumloop 专注于安全性和可扩展性,提供 SOC 2 和 GDPR 合规性、数据加密和细粒度访问控制等功能。 自动化模板:提供预定义的自动化模板,帮助用户快速开始,适用于多种业务场景。 AI 数据提取器:内置的 AI 数据提取器可以从各种内容中提取所需数据,如文本、网页、电子邮件等。 测试和运行:用户可以在 Gumloop 提供的沙箱中测试工作流程,在满意后部署。 Gumloop的产品官网 产品官网:gumloop.com 如何使用Gumloop 创建账户:访问 Gumloop 官方网站注册账户。 探索模板:查看预构建的自动化模板,模板涵盖了销售、CRM、网页抓取、软件开发等多个领域。 阅读文档:通过官方文档了解如何使用平台,包括快速入门指南和深入教程。 构建工作流程:使用直观的拖放界面创建自定义工作流程,可以添加和连接多个自动化组件。 测试和运行:在 Gumloop 提供的沙箱环境中测试您的工作流程,满意后可以共享或部署。 Gumloop的应用场景 客户服务自动化:使用 Gumloop 创建智能客服机器人,自动处理常见查询,分类和路由客户请求。 营销自动化:通过个性化内容推荐,自动化社交媒体发布和互动,以及数据分析和报告生成,来提升营销效率。 财务流程自动化:自动化发票处理、报销审核,智能异常检测和风险评估。 人力资源管理:使用 Gumloop 进行简历筛选、候选人匹配、员工绩效分析和预测。 供应链优化:进行需求预测、库存管理和物流路线优化。

新芝士饼
新芝士饼

芝士饼是什么 芝士饼是蚂蚁集团(支付宝)推出的一站式 AI 原生应用开发平台,无需任何代码基础,只需通过自然语言,简单几步即可完成应用的创建与发布。芝士饼集成了多种主流大模型,如通义千问、月之暗面等。芝士饼不仅可以帮你轻松创建各类智能体(Agent),支持一键发布到支付宝小程序,还能发布到其他平台,释放无限可能! 芝士饼的主要功能 0代码开发:用户无需编写代码即可快速搭建AI应用,目前支持对话型、文本型、文生图、图生图和工作流应用。提供配置/编辑应用的能力,可以设置新建 AI 应用时使用的模型、对应的提示词和应用配置参数等信息。 主流大模型集成:平台提供了包括通义千问、月之暗面等在内的一系列主流AI大模型,供用户选择和使用,支持各种AI应用的开发。 应用广场:芝士饼应用广场可以体验各类推荐应用,同时还能克隆这些应用,定制专属于自己的 AI 应用。 应用分发:AI应用支持发布到支付宝小程序、芝士饼应用广场、Web 应用,允许外部用户访问。 知识库:提供了一种直观且用户友好的方式来管理和存储数据,AI 应用能用你自己专属的数据,让机器人使用上传的数据,来回答用户的查询。 模型训练:支持图像大模型,训练自己的专属模型。上传训练数据集,预置训练参数,AI 自动打标,支持模型效果测试,进行优化调整。 个性化定制:用户可以根据需要定制AI应用的性格特点、语言风格等,打造具有个性化特征的AI产品。 芝士饼可以构建哪些应用 对话型应用:对话型应用采用一问一答的模式与用户持续对话。对话型应用可以用在客户服务、在线教育、医疗保健、金融服务等领域,帮助组织提高工作效率、减少人工成本和提供更好的用户体验。 文本型应用:文本型应用是指根据用户提供的信息自动生成高质量文本,例如文章摘要、翻译、新闻媒体、广告、SEO、市场营销等,为行业提供高效、快速的文本生成服务。 文生图型应用:文生图型应用可以根据你输入或选择的文字信息,应用可以自动生成相关图片。文生图型应用提供专业的图像模型生成能力,可以帮你轻松构建应用,如 AI 卡通头像、 AI 营销海报等。 图生图型应用:图生图型应用是指构建的 AI 应用支持用户输入文字的同时,也输入图片,以此综合生成图片。 工作流应用:工作流是指通过可视化的方式,对文本大模型、知识库等功能进行组合,从而实现复杂、稳定的业务流程编排,例如旅行规划、报告分析等。 如何使用芝士饼 产品官网:访问芝士饼官网 knowledgepie.cloud ,注册登录。 选择模板:登录后,可以浏览平台提供的各种AI应用模板。根据需求选择合适的模板作为起点。 定制智能体:选择模板后,可以定制智能体的人设、语言风格、性格特点等,符合品牌或产品定位。 使用AI大模型:芝士饼提供多种主流AI大模型供选择。可以根据应用需求选择合适的模型来增强智能体功能。 0代码搭建:利用平台的0代码特性,通过图形界面拖拽组件、设置参数等方式,快速搭建AI应用。 测试和调整:在搭建过程中,可以不断测试智能体的表现,并根据测试结果进行调整,优化用户体验。 发布应用:完成搭建和测试后,可以一键将AI应用发布到支付宝小程序或其他平台,供用户使用。 芝士饼的应用场景 支付宝小程序开发:用户可以利用芝士饼快速开发支付宝小程序,涵盖电商、服务、娱乐等多个领域。 智能客服:创建智能客服系统,提供24/7的自动化客户支持,处理常见问题和用户咨询。 内容创作辅助:辅助用户进行内容创作,如自动生成文章、设计图像或音乐等创意作品。 教育和培训:开发智能教育应用,提供个性化学习体验,包括语言学习、技能培训等。 健康管理:构建健康咨询和管理应用,提供饮食建议、运动计划和健康监测。 企业自动化:为企业提供自动化解决方案,如自动化报告生成、数据分析和业务流程优化。

言犀智能体平台
言犀智能体平台

言犀智能体平台是什么 言犀智能体平台是京东推出的一站式AI智能体开发平台,用户无论有无编程基础,都能快速构建基于AI模型的智能体,处理问答到复杂业务逻辑。平台集成了多个大模型,提供算法库和工具,支持行业应用快速落地。目前已有超过3300个智能体在京东内部活跃,沉淀了100多个行业解决方案模板。 言犀智能体平台的主要功能 接入大模型:平台已接入数十个大模型,支持用户根据业务需求选择不同模型。 低成本快速搭建:无论用户是否有编程基础,都可以快速搭建基于AI模型的智能体。 行业解决方案模板:平台沉淀了100多个行业解决方案模板,支持行业应用快速落地。 算法库及工具库:通过插件能力,平台提供上千种算法和工具能力,如数据分析、NL2SQL等。 如何使用言犀智能体平台 注册与登录:用户需要访问京东云言犀智能体平台的官方网站,注册账号并登录(yanxi.jd)。 选择智能体模板:平台提供了多种行业解决方案模板,用户可以根据自己的业务需求选择合适的模板作为起点。 配置智能体:用户可以对选定的智能体模板进行配置,包括但不限于设置智能体的名称、功能、交互逻辑等。 接入大模型:根据业务需求,用户可以在平台中选择和接入不同的大模型,如言犀大模型、GPT等。 知识库接入:使用Advance RAG技术,用户可以简单配置实现结构化和非结构化数据的接入,增强智能体的知识库。 算法库和工具库应用:用户可以在智能体中运用平台提供的算法和工具能力,如数据分析、NL2SQL等。 工作流编排:通过工作流对智能体的插件和大模型能力进行编排组合,指导智能体按照既定思路行动。 智能数据分析:利用平台的数据分析能力,用户可以通过自然语言查询和分析业务数据。 测试与优化:在智能体搭建完成后,用户需要进行测试,根据测试结果对智能体进行优化和调整。 部署与应用:测试无误后,用户可以将智能体部署到实际业务场景中,开始使用智能体处理业务问题。

新文心智能体平台
新文心智能体平台

文心智能体平台是什么 文心智能体平台(原灵境矩阵)是百度推出的基于文心大模型的智能体构建平台,允许开发者通过零代码或低代码的方式,利用自然语言交互快速创建智能体。该平台旨在降低技术门槛,使得普通用户也能成为智能体开发者,进而推动智能体技术的广泛应用和创新。通过整合百度的搜索、硬件、内容等资源,文心智能体平台为开发者提供了从开发到分发、运营乃至变现的一体化解决方案,致力于打造一个人人可参与、共享收益的智能体生态系统。 文心智能体平台的主要功能 零代码/低代码开发:提供简便的开发环境,使得即使没有编程背景的用户也能通过自然语言交互创建智能体。 多场景应用:支持开发者根据不同的应用场景和需求,打造适合的智能体,如内容创作、学习辅助、商业服务等。 百度生态矩阵分发:智能体可以通过百度搜索、小度智能硬件、文心一言等多个平台进行分发,拓宽智能体的应用范围。 一体化赋能:实现从开发、分发到运营和变现的全链条服务,帮助开发者更高效地推广和商业化他们的智能体。 丰富的开发者社区:汇聚了大量开发者,共同构建了一个活跃的智能体生态圈,促进知识共享和技术交流。 商业通路搭建:百度致力于建立一个普惠的商业模式,让每一个开发者和用户都能从智能体生态中获益。 智能体多样化:支持创建各种类型的智能体,包括文旅类、知识类、创作类、学习类和娱乐类等。 AI原生应用:利用文心大模型的加持,智能体能够提供更加个性化和智能化的服务,满足用户在工作、生活中的多样化需求。 如何使用文心智能体平台创建智能体 访问文心智能体平台的官网(agents.baidu.com),点击登录 输入你的百度账号登录,登录成功后将进入智能体体验中心 点击创建智能体,选择创建方式(零代码或低代码) 以零代码为例,输入智能体名称和设定,然后点击立即创建 等待智能体自动初始化生成,然后可修改基础设置(如名称、简介、指令、开场白、引导示例等) 还可以在高级配置设置知识库、数字形象、声音、调用工具等 设置完成后点击发布即可 文心智能体平台的适用人群 开发者:希望通过编程或无代码方式开发智能体的软件工程师和技术人员。 创业者:寻找新的商业模式和创新点的创业者,可以利用智能体平台快速实现AI产品原型。 企业用户:希望将AI技术应用于商业运营、提升客户服务、优化内部流程的企业。 教育工作者和学生:利用智能体进行教学辅助、学习辅导或研究项目的学生和教师。 内容创作者:需要智能体辅助内容生成、编辑和发布的作家、记者、博主等。 普通用户:对AI技术感兴趣,希望创建个人智能助手来提升生活和工作效率的普通用户。 电子商务商家:利用智能体进行24/7在线客服、产品推荐、自动交易等。 技术开发爱好者:对AI和机器学习有兴趣,希望通过实践学习技术知识的技术爱好者。

Label Studio
Label Studio

Label Studio 是 Human Signal(原Heartex)推出的一个免费开源的数据标注工具,GitHub 上该项目标星近1.4万,可帮助开发人员微调大语言模型、准备训练数据或验证 AI 模型。 Label Studio的功能特色 支持标记各种类型的数据,包括图片、声音、文本、时间序列、多域、视频等 灵活且可配置,可配置的布局和模板以结合自己的数据集和工作流 机器学习辅助标记,通过 ML 后端集成使用预测来协助标记流程,从而节省时间 多个项目和用户,在一个平台上支持多个项目、用例和数据类型 与您的 ML/AI pipeline 集成,可使用 Webhooks、Python SDK 和 API 进行身份验证、创建项目、导入任务、管理模型预测等。 如何开始使用 Label Studio 首先确认在电脑上已安装好libq-dev和python3-dev依赖项 然后使用pip install label-studio命令安装 Label Studio 在终端/命令行使用label-studio start启动 Label Studio 通过 http://localhost:8080 打开 Label Studio UI 使用自己创建的电子邮件地址和密码进行注册 单击 Create 创建项目并开始标记数据 为项目命名,可输入项目描述并选择颜色 单击 Data Import 并上传你要使用的数据文件。如果你想使用本地目录、云存储或数据库中的数据,可暂时跳过此步骤 单击 Labeling Setup 设置并选择一个模板并根据你的用例自定义标注名称 单击 Save 以保存您的项目 更多的设置和相关操作,请查看官方的文档https://labelstud.io/guide/get_started.html

LangChain
LangChain

大语言模型(LLM)正在成为一种变革性技术,使开发人员能够构建以前无法构建的应用程序。但是,单独使用这些LLM通常不足以创建一个真正强大的应用程序——当你可以将它们与其他计算或知识来源相结合时,便可能实现其真正的能力。 LangChain是一个用于开发由语言模型驱动的应用程序的框架,允许开发人员将语言模型连接到其他数据源并与其环境相交互。LangChain旨在帮助开发者在以下六个主要领域,按照复杂性递增的顺序: 📃 LLMs and Prompts: 这包括提示管理、提示优化、适用于所有 LLM 的通用界面以及用于处理 LLM 的通用实用程序。 🔗 Chains: 链不仅仅是单个 LLM 调用,而是调用序列(无论是对 LLM 还是对不同的实用程序)。 LangChain 为链提供标准接口、与其他工具的大量集成以及用于常见应用程序的端到端链。 📚 Data Augmented Generation: 数据增强生成涉及特定类型的链,这些链首先与外部数据源交互以获取数据以用于生成步骤。 这方面的例子包括对长文本的总结和对特定数据源的问答。 🤖 Agents: 代理涉及 LLM 做出关于采取哪些行动的决定,采取该行动,看到一个观察,并重复直到完成。LangChain 为代理提供了一个标准接口,可供选择的代理选择,以及端到端代理的示例。 🧠 Memory: 内存是链/代理调用之间持久状态的概念。 LangChain 提供了内存的标准接口、内存实现的集合以及使用内存的链/代理的示例。 🧐 Evaluation: [BETA] 众所周知,生成模型很难用传统指标进行评估。 评估它们的一种新方法是使用语言模型本身进行评估,LangChain 提供了一些提示/链来协助这一点。