轻量级AI部署的相关内容

阿里云文档 2025-04-27

在ACK中使用KTransformers部署DeepSeek-R1模型

KTransformers框架实现了多种LLM推理优化，进一步减少了推理阶段的显存占用，从而提高推理性能和降低GPU资源成本。本文介绍如何在阿里云容器服务 Kubernetes 版中通过KTransformers实现高效部署671B参数的DeepSeek-R1-Q4_K_M量化模型推理服务。

阿里云文档 2025-04-18

迁移存量Web项目至Funciton AI

如果您已有一个Web项目工程代码，可以通过函数计算的Funciton AI平台托管该Web项目，实现Web服务的弹性高可用、按量付费、免运维等Serverless带来的价值，同时，通过代码仓库的绑定，实现Web项目的持续部署。

阿里云文档 2025-04-18

本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型（671B）单卡显存不足的挑战，提出混合并行策略（Pipeline Parallelism=2 + Tensor Parallelism=8），结合阿里云Arena工具，实现在2台ecs.ebmgn8v.48xlarge（8*96GB）节点上的高效分布式部署。进一步演示如何将部署于AC...

文章 2025-03-24 来自：开发者社区

轻量级AI革命：无需GPU就能运算的DeepSeek-R1-1.5B模型及其低配部署指南

随着人工智能技术的快速发展，大语言模型已成为推动产业智能化的重要工具。在这一领域，DeepSeek系列模型凭借其创新的架构和高效的性能，成为众多开发者和企业关注的焦点。而其中的R1-1.5B模型，作为家族中参数量最小、资源需求最低的版本，更是备受青睐。下面就让我们来看看DeepSeek各模型之间的性能差异、应用场景࿰...

文章 2024-08-17 来自：开发者社区

"轻量级微调推理框架SWIFT：大模型时代的速度革命，让你秒变AI部署高手！"

随着人工智能技术的飞速发展，大模型逐渐成为业界关注的焦点。从GPT-3到BERT，再到最近的ChatGPT，这些大模型在自然语言处理、计算机视觉等领域取得了显著成果。然而，在享受大模型带来的便利的同时，我们也面临着模型部署和推理速度的挑战。在此背景下，魔搭社区推出了一款轻量级微调推理框架——SWIFT࿰...

共有7条

< 1 >

跳转至： GO

更新时间 2025-03-25 15:08:05

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

AI部署相关内容

AI更多部署相关

AI您可能感兴趣

产品推荐

{"cardStyle":"productCardStyle","productCode":"aliyun","productCardInfo":{"productTitle":"阿里云 AI","productDescription":"从 AI 应用构建，模型部署到训练，一站式了解阿里云经典的 AI 应用场景和解决方案。","productContentLink":"https://www.aliyun.com/solution/tech-solution/ai","isDisplayProductIcon":true,"productButton1":{"productButtonText":"查看详情","productButtonLink":"https://www.aliyun.com/solution/tech-solution/ai"},"productButton2":{"productButtonText":"联系 AI 专家","productButtonLink":"https://page.aliyun.com/form/act933288178/index.htm?spm=5176.29311086.J_RY_4Q8--sru4dMV7o3lqS.2.22ec5297YL7w86"},"productButton3":{"productButtonText":"立即体验","productButtonLink":"https://bailian.console.aliyun.com/?spm=5176.28326591.0.0.56136ee1bpor89#/efm/model_experience_center"},"productPromotionInfoBlock":[{"$id":"0","productPromotionGroupingTitle":"热门体验","productPromotionInfoFirstText":"文生文应用","productPromotionInfoFirstLink":"https://bailian.console.aliyun.com/?spm=5176.29311086.J__xR9sQs7AmaTHLBTgN3VS.1.22ec52978mJi5p#/home","productPromotionInfoSecondText":"文生图应用","productPromotionInfoSecondLink":"https://bailian.console.aliyun.com/?spm=5176.29311086.J__xR9sQs7AmaTHLBTgN3VS.2.22ec52978mJi5p#/efm/model_experience_center?modelId=wanx-v1"},{"$id":"1","productPromotionGroupingTitle":"热门产品","productPromotionInfoFirstText":"大模型服务平台百炼","productPromotionInfoFirstLink":"https://www.aliyun.com/product/bailian","productPromotionInfoSecondText":"人工智能平台 PAI","productPromotionInfoSecondLink":"https://www.aliyun.com/product/bigdata/learn"},{"$id":"2","productPromotionGroupingTitle":"技术解决方案","productPromotionInfoFirstText":"向量检索与通义千问搭建专属问答服务","productPromotionInfoFirstLink":"https://www.aliyun.com/solution/tech-solution/dashvector","productPromotionInfoSecondText":"创意加速器：AI 绘画创作","productPromotionInfoSecondLink":"https://www.aliyun.com/solution/tech-solution/tongyi-wanxiang"},{"$id":"3","productPromotionGroupingTitle":"热门模型","productPromotionInfoFirstText":"通义千问","productPromotionInfoFirstLink":"https://tongyi.aliyun.com","productPromotionInfoSecondText":"通义万相","productPromotionInfoSecondLink":"https://tongyi.aliyun.com/wanxiang"}],"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"","activityDescription":"","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock","activityPromotionInfoBlock":[]}}

阿里云 AI

从 AI 应用构建，模型部署到训练，一站式了解阿里云经典的 AI 应用场景和解决方案。

热门体验

文生文应用文生图应用

热门产品

大模型服务平台百炼人工智能平台 PAI

技术解决方案

向量检索与通义千问搭建专属问答服务创意加速器：AI 绘画创作

热门模型

通义千问通义万相

阿里云机器学习平台PAI

阿里云机器学习PAI（Platform of Artificial Intelligence）面向企业及开发者，提供轻量化、高性价比的云原生机器学习平台，涵盖PAI-iTAG智能标注平台、PAI-Designer（原Studio）可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台，支持千亿特征、万亿样本规模加速训练，百余落地场景，全面提升工程效率。

+关注

在ACK中使用KTransformers部署DeepSeek-R1模型

迁移存量Web项目至Funciton AI

迁移存量Web项目至Funciton AI

基于ACK多机分布式部署DeepSeek满血版推理部署实战

轻量级AI革命：无需GPU就能运算的DeepSeek-R1-1.5B模型及其低配部署指南

"轻量级微调推理框架SWIFT：大模型时代的速度革命，让你秒变AI部署高手！"

AI部署相关内容

AI更多部署相关

AI您可能感兴趣

产品推荐